DeepSeek宣布R1升級：整體表現接近國際頂尖模型

▲▼Deepseek。（圖／路透）

▲DeepSeek。（圖／路透社）

記者蔡紹堅／綜合報導

中國大陸AI新創公司深度求索（DeepSeek）29日發出升級公告，解釋DeepSeek-R1升級的具體情況。公告中提到，更新後的R1模型在數學、寫程式與通用邏輯等多個基準測評中取得當前大陸所有模型中首屈一指的優異成績，並且在整體表現上已接近其他國際頂尖模型，如o3與Gemini-2.5-Pro。

根據公告，DeepSeek R1模型已完成小版本升級，當前版本為DeepSeek-R1-0528。用戶透過官方網站、APP或小程序進入對話界面後，開啓「深度思考」功能即可體驗最新版本。

公告提到，DeepSeek-R1-0528使用2024年12月所發佈的DeepSeek V3 Base模型作為基座，但在後訓練過程中投入了更多算力，顯著提升模型的思維深度與推理能力。更新後的R1模型在數學、寫程式與通用邏輯等多個基準測評中取得當前大陸所有模型中首屈一指的優異成績，並且在整體表現上已接近其他國際頂尖模型，如o3與Gemini-2.5-Pro。

相較於舊版R1，新版模型在複雜推理任務中的表現有顯著提升。例如在AIME2025測試中，新版模型準確率由舊版的70%提升至87.5%。這一進步得益於模型在推理過程中的思維深度增強：在AIME2025測試集上，舊版模型平均每題使用12K tokens，而新版模型平均每題使用23Ktokens，表明其在解題過程中進行了更為詳盡和深入的思考。

DeepSeek表示，DeepSeek-R1-0528的思維鏈對於學術界推理模型的研究和工業界針對小模型的開發都將具有重要意義。

新版DeepSeek R1針對「幻覺」問題進行了優化。與舊版相比，更新後的模型在改寫潤色、總結摘要、閱讀理解等場景中，幻覺率降低45-50%左右，能夠有效地提供更為準確、可靠的結果。

在舊版R1的基礎上，更新後的R1模型針對議論文、小說、散文等文體進行進一步優化，能夠輸出篇幅更長、結構內容更完整的長篇作品，同時呈現出更加貼近人類偏好的寫作風格。

公告中還提到，目前模型的測評成績與OpenAI o1-high相當，但與o3-High以及Claude4 Sonnet仍有差距。

每日新聞精選　免費訂閱《ETtoday電子報》

01/17 全台詐欺最新數據

更多新聞

421 件 2 億 3418 萬 損失金額(元) 更多新聞

※ 資料來源：內政部警政署165打詐儀錶板

ET快訊

燉湯浪費了！白蘿蔔「1吃法」防癌最猛　營養師激推

台積電4成產能搬到美國　謝寒冰怒「台股、台灣直接垮了」：被賣

《文森佐》羅喆離世3年！　金高銀探望墓園「我會再來」引鼻酸

20年全國電子撤出板橋地標三角窗　驚人月租曝光

分享給朋友：

追蹤我們：

熱門活動

01/17 全台詐欺最新數據

‧ 為博流量用AI生成低俗影片 成都警方依法拘留涉案男子

‧ Thinking Machines Lab爆發人事震盪 多名核心成員轉投OpenAI

‧ Google重申Gemini暫不置入廣告 AI搜尋成主要變現來源

‧ ChatGPT網頁版升級方向曝光 新增內嵌編輯、任務與進度追蹤

‧ ChatGPT Go正式全球上線 月費290元主打平價進階AI

‧ 韓國AI訂閱支出首度超越Netflix ChatGPT市占逾7成

‧ 企業調整招募條件 研究揭示：會AI的人，福利拿得更多

‧ JD Sports布局AI購物 比價、下單不必離開聊天視窗

‧ 中國用電量飆到全球第一！規模竟是美國2倍 AI電力戰開打

‧ 燒錢太兇撐不住 ChatGPT要放廣告了！免費用戶先看到

‧ 43歲RAIN超強！睽違20年攻蛋 一開場就裸半身...露驚人肌肉

‧ Joy推銷「親自當模特兒擺拍」 車太鉉被說服…全包寵女兒！

‧ 笑憶從土城看守所「活著回來」 柯文哲：國民黨不要高估自己實力

‧ 宜蘭近海地震為好發區域 氣象署：上次達規模6為2024年

‧ 拚生涯第3度征戰經典賽 陳冠宇鬆口談心境：希望成為人生完美回憶

‧ 投資300萬沒下文！北市男持斧頭猛砍合夥人雙腿被逮 共犯在逃

‧ GOT7微合體慶12周年大喊「老了」 直播卡卡粉笑：沒變的是爛網路XD

‧ 沒出示車票被列車長請下車 男乘客直接「躺新營站地上」不動

‧ 桃園火警

‧ 天降熱水壺砸車！土城男情緒失控大鬧旅店 遭警消強制送醫

‧ 為博流量用AI生成低俗影片 成都警方依法拘留涉案男子

‧ Thinking Machines Lab爆發人事震盪 多名核心成員轉投OpenAI

‧ Google重申Gemini暫不置入廣告 AI搜尋成主要變現來源

‧ ChatGPT網頁版升級方向曝光 新增內嵌編輯、任務與進度追蹤

‧ ChatGPT Go正式全球上線 月費290元主打平價進階AI

‧ 韓國AI訂閱支出首度超越Netflix ChatGPT市占逾7成

‧ 企業調整招募條件 研究揭示：會AI的人，福利拿得更多

‧ JD Sports布局AI購物 比價、下單不必離開聊天視窗

‧ 中國用電量飆到全球第一！規模竟是美國2倍 AI電力戰開打

‧ 燒錢太兇撐不住 ChatGPT要放廣告了！免費用戶先看到

‧ 孔劉一頭亂髮機場奔波 LV訂製行李箱行頭洩大使身份

‧ 從高雄壽山拍到美國紐約！邵雨薇合體王柏傑談愛 《動物園》定檔了

‧ 視察三峽污水下水道接管工程 侯友宜：新北接管戶數全國第一

‧ Lucas退團後「首度同框NCT」！ 現身經紀人婚禮合照曝光

‧ 從倉庫到博物館！新北環保小局長走讀實戰 化身校園淨零種子

‧ 風田、金針菇日韓對抗踢鐵板 Lulu與黃偉晉西門町狂殺價

‧ 陳培瑜哭叫她捏我 陳玉珍提「女立委混戰片」自稱遭壓制

‧ 檢方反詐戰線前移！南檢、橋檢攜手南科 簽署反詐合作備忘錄

‧ 男生會意淫「女友的正妹閨蜜嗎？」 大票老司機曝真實想法！

‧ 彭佳嶼觀光船遊客心臟驟停 空勤基隆外海極限吊掛

AI科技熱門新聞

相關新聞

關鍵字：

讀者迴響

熱門新聞

最夯影音

43歲RAIN超強！睽違20年攻蛋 一開場就裸半身...露驚人肌肉

熱門快報

‧ 為博流量用AI生成低俗影片　成都警方依法拘留涉案男子

‧ Thinking Machines Lab爆發人事震盪　多名核心成員轉投OpenAI

‧ Google重申Gemini暫不置入廣告　AI搜尋成主要變現來源

‧ ChatGPT網頁版升級方向曝光　新增內嵌編輯、任務與進度追蹤

‧ ChatGPT Go正式全球上線　月費290元主打平價進階AI

‧ 韓國AI訂閱支出首度超越Netflix　ChatGPT市占逾7成

‧ 企業調整招募條件　研究揭示：會AI的人，福利拿得更多

‧ JD Sports布局AI購物　比價、下單不必離開聊天視窗

‧ 中國用電量飆到全球第一！規模竟是美國2倍　AI電力戰開打

‧ 燒錢太兇撐不住　ChatGPT要放廣告了！免費用戶先看到

‧ 43歲RAIN超強！睽違20年攻蛋　一開場就裸半身...露驚人肌肉

‧ Joy推銷「親自當模特兒擺拍」　車太鉉被說服…全包寵女兒！

‧ 笑憶從土城看守所「活著回來」　柯文哲：國民黨不要高估自己實力

‧ 宜蘭近海地震為好發區域　氣象署：上次達規模6為2024年

‧ 拚生涯第3度征戰經典賽　陳冠宇鬆口談心境：希望成為人生完美回憶

‧ 投資300萬沒下文！北市男持斧頭猛砍合夥人雙腿被逮　共犯在逃

‧ GOT7微合體慶12周年大喊「老了」　直播卡卡粉笑：沒變的是爛網路XD

‧ 沒出示車票被列車長請下車　男乘客直接「躺新營站地上」不動

‧ 天降熱水壺砸車！土城男情緒失控大鬧旅店　遭警消強制送醫

‧ 為博流量用AI生成低俗影片　成都警方依法拘留涉案男子

‧ Thinking Machines Lab爆發人事震盪　多名核心成員轉投OpenAI

‧ Google重申Gemini暫不置入廣告　AI搜尋成主要變現來源

‧ ChatGPT網頁版升級方向曝光　新增內嵌編輯、任務與進度追蹤

‧ ChatGPT Go正式全球上線　月費290元主打平價進階AI

‧ 韓國AI訂閱支出首度超越Netflix　ChatGPT市占逾7成

‧ 企業調整招募條件　研究揭示：會AI的人，福利拿得更多

‧ JD Sports布局AI購物　比價、下單不必離開聊天視窗

‧ 中國用電量飆到全球第一！規模竟是美國2倍　AI電力戰開打

‧ 燒錢太兇撐不住　ChatGPT要放廣告了！免費用戶先看到

‧ 孔劉一頭亂髮機場奔波　LV訂製行李箱行頭洩大使身份

‧ 從高雄壽山拍到美國紐約！邵雨薇合體王柏傑談愛　《動物園》定檔了

‧ 視察三峽污水下水道接管工程　侯友宜：新北接管戶數全國第一

‧ Lucas退團後「首度同框NCT」！　現身經紀人婚禮合照曝光

‧ 從倉庫到博物館！新北環保小局長走讀實戰　化身校園淨零種子

‧ 風田、金針菇日韓對抗踢鐵板　Lulu與黃偉晉西門町狂殺價

‧ 陳培瑜哭叫她捏我　陳玉珍提「女立委混戰片」自稱遭壓制

‧ 檢方反詐戰線前移！南檢、橋檢攜手南科　簽署反詐合作備忘錄

‧ 男生會意淫「女友的正妹閨蜜嗎？」　大票老司機曝真實想法！

‧ 彭佳嶼觀光船遊客心臟驟停　空勤基隆外海極限吊掛

43歲RAIN超強！睽違20年攻蛋　一開場就裸半身...露驚人肌肉