阿里巴巴發布Qwen3模型 正面對決DeepSeek與OpenAI

▲▼QWEN3。(圖/官方部落格)

▲阿里巴巴今日發布Qwen3挑戰DeepSeek與OpenAI頂尖模型。(圖/官方部落格)
記者吳立言/綜合報導
阿里巴巴旗下的阿里雲,今(29日)正式發布中國首款混合推理模型「Qwen3系列」,並全面開源。這次推出的Qwen3不只性能強悍,還首創將「快思考」與「慢思考」兩種推理模式整合到同一個模型中,大幅提升回應速度與深度,同時有效節省運算資源。

Qwen3的預訓練資料量達到驚人的「36萬兆個token」,支援多達119種語言與方言,包括爪哇語、海地語等地方性語種,真正做到「全球通用」。在數學推理、程式碼生成與綜合能力等基準測試上,Qwen3同樣表現出色。
Qwen3主打「自動切換思考模式」,簡單問題能瞬間回覆,節省計算資源;複雜問題則會深度推理,提升回答的準確性與專業度。部署需求也同步降低。阿里雲表示,旗艦版Qwen3-235B-A22B只需要「4張H20顯示卡」就能本地部署,部署成本比DeepSeek R1下降超過六成,對企業或開發者而言,門檻大幅降低。

此外,Qwen3全面支援MCP(Multi-Agent Communication Protocol)協議,使得開發AI代理(Agent)能力也獲得大幅強化,尤其是在程式碼能力方面,成為台灣與中國地區許多開發者期待的新利器。

這次Qwen3一口氣開源了8款模型,包括:

2款MoE(混合專家)模型:旗艦版 Qwen3-235B-A22B(總參數2350億,啟用參數220億)、小型版Qwen3-30B-A3B(總參數300億,啟用參數30億),適合一般高階顯示卡部署。

6款Dense(密集型)模型:分別為 Qwen3-32B、Qwen3-14B、Qwen3-8B、Qwen3-4B、Qwen3-1.7B、Qwen3-0.6B

最小的0.6B模型甚至可以直接在手機端運行,讓AI無所不在。

所有模型皆採用Apache 2.0開源授權,方便商業應用及二次開發。根據阿里雲公布的資料,Qwen3在數學推理、程式碼理解與綜合智力測試中取得領先成績,全面超越DeepSeek-R1、OpenAI o1與o3-mini、Grok3等競品。不僅如此,Qwen3在訓練資料來源上更加多元,不僅涵蓋了網路資料,還大量吸收PDF文件、大量合成程式碼片段,讓知識基礎更為堅實。
隨著Qwen3的發布與全系列開源,阿里巴巴在大模型領域展現出強勁的技術實力。隨著更多企業與開發者投入應用,全球AI競爭格局勢必迎來新一輪變化。

05/19 全台詐欺最新數據

更多新聞
586 2 4484 損失金額(元) 更多新聞

※ 資料來源:內政部警政署165打詐儀錶板

分享給朋友:

追蹤我們:

※本文版權所有,非經授權,不得轉載。[ ETtoday著作權聲明 ]

AI科技熱門新聞

Google智慧眼鏡佈局成形

Gemini 2.5 Pro正式上線

Google推出Gemini Diffusion與Deep Think

Gemini新增鏡頭與螢幕分享功能

Imagen 4、Veo 3正式亮相

NotebookLM手機App正式上線

企業溝通升級!AI即時多國翻譯上線

微軟宣布AI Agents時代來臨 

Google推出AI編碼工具「Jules」

Google I/O 2025首日發表總整理

會議成癮、AI氾濫正在拖垮你公司

Gemini Advanced現可連接GitHub倉庫

GPT-4.1重磅登場!

OpenAI團隊揭秘GPT-5整合計畫

相關新聞

讀者迴響

熱門新聞

最夯影音

更多

熱門快報

回到最上面