新聞
2026-04-11 11:50:50

梁文鋒透露擬4月下旬發布DeepSeekV4

內地傳媒引述 DeepSeek 創辦人梁文鋒透露,新一代旗艦大模型 DeepSeek V4將於4月下旬正式發布。另外,騰訊(00700.HK)旗下基礎模型混元3.0亦將於本月正式發布。 據《創智記》報道,DeepSeek V4 將帶來萬億參數規模和百萬級上下文視窗外,更首次實現與華為昇騰等國產晶片深度適配,標誌著內地人工智能(AI)產業在「去CUDA化」路上邁出關鍵一步。(CUDA,Compute Unified Device Architecture是輝達推出的平行運算平台與程式設計模型)。 此外,據報道 DeepSeek 上月底13小時服務中斷,官方當時稱為伺服器故障,但多開發者則發現模型輸出邏輯發生顯著變化,編碼結構更清晰,邏輯嚴謹度飛躍式提升,SVG圖形生成能力明顯增強,認為實為V4的灰度測試或全量部署。據悉,V4將以Apache 2.0協議開源,企業可自主部署。 另外,據外電報道,為迎接V4,字節跳動、阿里巴巴(09988.HK/BABA.US)、騰訊等內地科技巨企已預訂數十萬片新一代 AI 算力晶片,計劃通過雲服務提供 DeepSeek 新模型,並整合其自身 AI 產品。(BC) #DeepSeek #梁文鋒 #阿里巴巴 #騰訊

<匯港通訊>