▲阿里巴巴今日發布Qwen3挑戰DeepSeek與OpenAI頂尖模型。(圖/官方部落格)
記者吳立言/綜合報導
阿里巴巴旗下的阿里雲,今(29日)正式發布中國首款混合推理模型「Qwen3系列」,並全面開源。這次推出的Qwen3不只性能強悍,還首創將「快思考」與「慢思考」兩種推理模式整合到同一個模型中,大幅提升回應速度與深度,同時有效節省運算資源。
Qwen3的預訓練資料量達到驚人的「36萬兆個token」,支援多達119種語言與方言,包括爪哇語、海地語等地方性語種,真正做到「全球通用」。在數學推理、程式碼生成與綜合能力等基準測試上,Qwen3同樣表現出色。
Qwen3主打「自動切換思考模式」,簡單問題能瞬間回覆,節省計算資源;複雜問題則會深度推理,提升回答的準確性與專業度。部署需求也同步降低。阿里雲表示,旗艦版Qwen3-235B-A22B只需要「4張H20顯示卡」就能本地部署,部署成本比DeepSeek R1下降超過六成,對企業或開發者而言,門檻大幅降低。
此外,Qwen3全面支援MCP(Multi-Agent Communication Protocol)協議,使得開發AI代理(Agent)能力也獲得大幅強化,尤其是在程式碼能力方面,成為台灣與中國地區許多開發者期待的新利器。
這次Qwen3一口氣開源了8款模型,包括:
2款MoE(混合專家)模型:旗艦版 Qwen3-235B-A22B(總參數2350億,啟用參數220億)、小型版Qwen3-30B-A3B(總參數300億,啟用參數30億),適合一般高階顯示卡部署。
6款Dense(密集型)模型:分別為 Qwen3-32B、Qwen3-14B、Qwen3-8B、Qwen3-4B、Qwen3-1.7B、Qwen3-0.6B
最小的0.6B模型甚至可以直接在手機端運行,讓AI無所不在。
所有模型皆採用Apache 2.0開源授權,方便商業應用及二次開發。根據阿里雲公布的資料,Qwen3在數學推理、程式碼理解與綜合智力測試中取得領先成績,全面超越DeepSeek-R1、OpenAI o1與o3-mini、Grok3等競品。不僅如此,Qwen3在訓練資料來源上更加多元,不僅涵蓋了網路資料,還大量吸收PDF文件、大量合成程式碼片段,讓知識基礎更為堅實。
隨著Qwen3的發布與全系列開源,阿里巴巴在大模型領域展現出強勁的技術實力。隨著更多企業與開發者投入應用,全球AI競爭格局勢必迎來新一輪變化。
讀者迴響