新聞
2025-04-30 18:44:21

DeepSeek發表Prover-V2模型參數量達6710億

DeepSeek今日在AI開源社群 Hugging Face上發布了一個名為DeepSeek-Prover-V2-671B的新模型。 據悉,DeepSeek-Prover-V2-671B使用了更有效率的safetensors檔案格式,並支援多種運算精度,方便模型更快、更省資源地訓練和部署,參數達6710億,或為去年發布的Prover-V1.5數學模型升級版本。同時支援超長上下文,最大位置嵌入達163840,使其能處理複雜的數學證明,並且採用了FP8量化,可透過量化技術減小模型大小,提高推理效率。 #DeepSeek #人工智能 (CW)

<匯港通訊>