DeepSeek V3小更新　中文寫作和搜索等四能力強化

▲▼Deepseek。（圖／路透）

▲Deepseek V3推出小更新版本。（圖／路透）

記者魏有德／綜合報導

大陸研發的AI軟體DeepSeek24日公佈V3小更新版本「DeepSeek-V3-0324」，官方報告顯示，新版本在推理能力、前端開發能力、中文寫作能力和中文搜索能力均有所強化。V3-0324雖被侷限在小版本更新，但在代碼生成能力的提升令使用者印象深刻，用戶只需關閉深度思考模式，就能體驗新版本，而API接口和使用方式保持不變。

《網易新聞》報導，報告顯示，推理能力的提升主要體現在新版V3模型的百科知識（MMLU-Pro, GPQA）、數學（MATH-500, AIME 2024）和代碼任務（LiveCodeBench），表現均有提高，特別是在數學、代碼類相關評測集上取得了超過GPT-4.5、Claude-Sonnet-3.7的得分成績。

據了解，在DeepSeek推出的兩個模型中，R1偏推理模型，V3則較為適合日常對話，在小更新裡，V3也有了推理能力的強力升級，使用者可根據問題難度，複雜問題用R1，日常對話用新版V3，將算力資源與任務需求更加契合，避免不必要的計算浪費。

除了代碼能力，新版本V3在中文能力也有明顯增強，特別是中長篇文本創作上的結構更佳完整，邏輯更為嚴密，實用性因此大幅提升。

此外，在聯網搜索場景下，報告生成能力也有顯著提升，模型能夠從網路資訊中提取關鍵內容，生成詳實準確的報告，並以清晰美觀的排版呈現。

官方報告強調，此次更新與之前的DeepSeek-V3使用同樣的base模型，僅改進「後訓練方法」，並借鑒了DeepSeek-R1模型訓練過程中的強化學習技術，代表著純RL路線的再一次的驗證和公示，在對手們繼續閉源並使用「唯一混合模型」這樣的概念「博眼球」之際，DeepSeek將持續藉由開源，提供業內公開的高效迭代思路。

每日新聞精選　免費訂閱《ETtoday電子報》