記者吳立言/綜合報導
▲Google Gemini 2.5 flash,目前正開放開發者預覽使用。(圖/Google)
Google近期在其Gemini系列中推出全新版本「Gemini 2.5 Flash」,目前正開放開發者預覽使用。這個版本主打強化的推理能力,並首度引入「思考」機制,讓開發者能夠靈活調控成本與延遲,打造更具性價比的AI解決方案。
與先前的Gemini 2.0 Flash 相比,2.5 Flash在推理性能上有顯著升級,也是Google首款支援「全混合推理模式」的模型。開發者可依照需求決定是否啟用「思考」功能,並透過設定「思考預算」來在品質、成本與延遲之間取得理想平衡。即便在關閉思考功能的情況下,2.5 Flash仍維持2.0 Flash的高速回應能力,且整體表現更為優異。這項創新背後的「思考過程」是指模型在輸出回答之前,先進行一連串內部推理,能幫助更準確理解輸入提示、拆解複雜任務,並規劃出更合理的回應策略。像是在解決數學題或分析研究問題等需要多步驟推理的任務上,「思考」大幅提升了模型的準確度與完整性。根據LMArena的「困難提示」測試結果顯示,2.5 Flash僅次於旗艦級的2.5 Pro,展現強勁實力。
Gemini 2.5 Flash亦提供對思考過程的細部控制功能,開發者可以設定「最大思考 token 數」,以彈性調整推理深度。預算越高,模型的推理越深入,回應的品質也越佳;若設定為0,則模型會以最低成本執行推理,且「表現仍優於2.0Flash」。實際應用上,任務的複雜程度將決定所需的推理深度。例如,簡單的翻譯或四則運算任務可能只需極少的思考資源,但像是複雜的程式設計、邏輯推理問題則需更長的推理時間。透過可設定的思考預算,開發者得以根據任務需求,找到最佳解決策略。
目前,開發者可透過Gemini API、Google AI Studio和Vertex AI等平台使用Gemini 2.5 Flash。Google鼓勵開發者試驗不同的思考參數設定,探索如何運用可控推理能力,有效解決更具挑戰性的問題。
讀者迴響