▲Deepseek V3推出小更新版本。(圖/路透)
記者魏有德/綜合報導
大陸研發的AI軟體DeepSeek24日公佈V3小更新版本「DeepSeek-V3-0324」,官方報告顯示,新版本在推理能力、前端開發能力、中文寫作能力和中文搜索能力均有所強化。V3-0324雖被侷限在小版本更新,但在代碼生成能力的提升令使用者印象深刻,用戶只需關閉深度思考模式,就能體驗新版本,而API接口和使用方式保持不變。
《網易新聞》報導,報告顯示,推理能力的提升主要體現在新版V3模型的百科知識(MMLU-Pro, GPQA)、數學(MATH-500, AIME 2024)和代碼任務(LiveCodeBench),表現均有提高,特別是在數學、代碼類相關評測集上取得了超過GPT-4.5、Claude-Sonnet-3.7的得分成績。
據了解,在DeepSeek推出的兩個模型中,R1偏推理模型,V3則較為適合日常對話,在小更新裡,V3也有了推理能力的強力升級,使用者可根據問題難度,複雜問題用R1,日常對話用新版V3,將算力資源與任務需求更加契合,避免不必要的計算浪費。
除了代碼能力,新版本V3在中文能力也有明顯增強,特別是中長篇文本創作上的結構更佳完整,邏輯更為嚴密,實用性因此大幅提升。
此外,在聯網搜索場景下,報告生成能力也有顯著提升,模型能夠從網路資訊中提取關鍵內容,生成詳實準確的報告,並以清晰美觀的排版呈現。
官方報告強調,此次更新與之前的DeepSeek-V3使用同樣的base模型,僅改進「後訓練方法」,並借鑒了DeepSeek-R1模型訓練過程中的強化學習技術,代表著純RL路線的再一次的驗證和公示,在對手們繼續閉源並使用「唯一混合模型」這樣的概念「博眼球」之際,DeepSeek將持續藉由開源,提供業內公開的高效迭代思路。
讀者迴響