馬斯克宣布旗下人工智慧公司xAI的Grok 2.5(Grok 2) 模型正式開源,並透露Grok 3 也將在約六個月後開放。這是xAI去年最強大的模型之一,如今開放後將讓更多開發與研究機構能加以應用與改進。
2025-08-25 11:19
近日有社群用戶發現,OpenAI可能正準備釋出兩款代號為「gpt-oss-20b」與「gpt-oss-120b」的大型語言模型。根據X(前推特)上多位開發者者貼文,這些模型短暫出現在某公開倉庫,隨後即被移除,但部分技術細節與配置檔已遭截圖保存,引發社群熱議。
2025-08-01 18:15
阿里巴巴旗下的阿里雲,今(29日)正式發布中國首款混合推理模型「Qwen3系列」,並全面開源。這次推出的Qwen3不只性能強悍,還首創將「快思考」與「慢思考」兩種推理模式整合到同一個模型中,大幅提升回應速度與深度,同時有效節省運算資源。
2025-04-29 10:42
中國AI新創公司DeepSeek近期傳出即將推出全新大模型DeepSeek R2,主打12,000億參數規模與自主研發的Hybrid MoE 3.0架構,並以華為昇騰910B晶片作為主要運行平台。
2025-04-28 11:19
與過去僅能處理文字資訊的AI模型不同,OpenAI今(17日)正式發布「o3 與 o4-mini」兩款全新人工智慧推理模型,首次整合了強大的圖像理解能力。
2025-04-17 08:34
OpenAI今(11日)日開源全新基準測試資料集「BrowseComp」,針對 AI 代理在真實網路環境中搜尋、整合與驗證資訊的能力進行全面評估。這項工具的推出,不僅為AI系統的實用性測試建立標竿,也揭示目前主流大型語言模型在複雜任務處理上的明顯短板。
2025-04-11 11:19
Meta日前正式推出最新一代人工智慧模型「Llama 4」,涵蓋多款針對不同應用場景設計的模型,強調效能與多模態處理能力兼具。新模型採用「專家混合架構」(Mixture of Experts, MoE),並擴展至處理文本、圖片與影片等多種資料格式,並導入 WhatsApp、Messenger、Instagram及網頁版的Meta AI助理,顯現出Meta在生成式AI領域的積極布局。
2025-04-08 00:30
OpenAI 執行長Sam Altman今(1日)日於X(前推特)宣布,公司計劃在未來數月內推出一款強大且具備推理能力的開源語言模型,這將是 OpenAI「自 GPT-2以來首次」釋出的開源權重(open-weight)模型。
2025-04-03 15:47