DeepSeek 公布最新V3模型 意圖超越 OpenAI

記者吳立言/綜合報導

▲▼OpenAI,ChatGPT,DeepSeek。(組圖/路透)

▲OpenAI與DeepSeek。(組圖/路透)

DeepSeek 昨日(24)針對其「DeepSeek V3-0324」模型悄悄發布了更新,雖非外界預期的R2 模型,但仍然有不少亮點。

V3模型無預警地在本週的 Hugging Face 上發布,此次更新聲稱能夠「有效且準確地解決現實世界中的挑戰」。今年一月,DeepSeek 一度超越 ChatGPT,成為蘋果美國應用程式商店中最受歡迎的免費軟體。V3 模型是一款強大的混合專家(MoE)語言模型,擁有6710 億個總參數,其中處理每個 token(即每個單詞或符號)時,模型會動態選擇並啟動370億個參數來進行計算,這種方法使得模型能夠在保持高效運行的同時,利用大量參數來提高預測的準確性和性能。在預訓練之後,V3 進行了知識蒸餾,從 DeepSeek-R1 模型中提取知識,這一過程進一步提升了模型的性能和應用能力。

本次更新展示了 DeepSeek 在技術創新方面的持續努力,並預示著未來 AI 技術將更加高效。隨著競爭的加劇,DeepSeek 的進步無疑將對全球 AI 產業產生深遠影響,更突顯了這家中國 AI 新創公司保持領先競爭對手的意圖。

12/24 全台詐欺最新數據

更多新聞
518 2 5661 損失金額(元) 更多新聞

※ 資料來源:內政部警政署165打詐儀錶板

分享給朋友:

追蹤我們:

※本文版權所有,非經授權,不得轉載。[ ETtoday著作權聲明 ]

AI科技熱門新聞

相關新聞

關鍵字:

讀者迴響

熱門新聞

最夯影音

更多

熱門快報

回到最上面