<匯港通訊> DeepSeek 發布新型數學推理模型 DeepSeekMath-V2,採用可自我驗證的訓練框架,在2025年國際數學奧林匹克競賽(IMO 2025)和2024年中國數學奧林匹克競賽(CMO 2024)中,均達到金牌水平,並在2024年普特南數學競賽(Putnam 2024)獲得近乎滿分的118/120分優異成績。
新模型基於 DeepSeek-V3.2-Exp-Base 構建,透過 LLM 驗證器自動審查生成的數學證明,並利用高難度樣本持續優化性能,透過驗證、產生閉環和元驗證機制,顯著提升證明品質評估準確性,並實現全自動化標註。
團隊表示,該成果驗證了自驗證推理路徑的可行性,為建立可靠數學智能系統提供新方向。
模型程式碼與權重已開源,發布於 Hugging Face 及 GitHub 平台。
(BC)
新聞來源 (不包括新聞圖片): 滙港資訊