ETtoday > 熱搜關鍵字 > 多模態

多模態

更快更便宜!OpenAI推出GPT-5.4 mini、nano 主打高流量應用

OpenAI 宣布推出 GPT-5.4 mini 與 GPT-5.4 nano,作為 GPT-5.4 系列的輕量化版本,鎖定高頻率、高即時性的應用場景。兩款模型延續旗艦模型的推理、多模態理解與工具使用能力,同時在速度與成本上大幅優化。

百度文心5.0正式版發布 原生全模態+835位專家挺進全球AI前段班

陸產大模型競爭進入白熱化階段,百度於22日正式發布並上線「文心5.0」正式版,不僅參數規模突破2.4兆(2.4 Trillion),更以「原生全模態」統一建模技術,打破過去多模態模型「後期拼接」的侷限。在最新LMArena全球大模型競技場中,文心5.0以1460分高居大陸第一、全球第八,實力已超越GPT-5.1-High及Gemini-2.5-Pro等國際主流模型。

消費級AI戰局白熱化 投資圈點名2025年關鍵轉折

在 2025 年,消費級人工智慧產品競爭快速升溫,新服務與新功能密集推出,但真正能長期留住用戶的產品卻相對有限。投資圈觀察指出,多數使用者最終只會固定使用一款 AI 工具,使得市場逐漸走向「贏家全拿」的結構。

Google推出Gemini 3Flash 主打「前沿智慧 × 極速推理」全面取代2.5 Flash

Google 今(18日)正式擴展 Gemini 3 模型家族,推出全新 Gemini 3 Flash。該模型主打「前沿等級智慧、但為速度而生」,在大幅降低成本與延遲的同時,仍保有接近旗艦模型的推理與多模態能力,並已開始向全球用戶全面推送。

虛擬互動世界成新戰場 Google DeepMind點名2026年AI三大關鍵發展

在近期舉行的 Axios AI+ 峰會 上,Google DeepMind 執行長哈薩比斯(Demis Hassabis)提出他對 2026 年人工智慧發展的最新判斷,點名「多模態模型」、「互動式影片世界」以及「更可靠的 AI 代理」將成為未來一年的三大關鍵趨勢。

Google推出最強模型Nano Banana Pro 4K+精準排字、專業視覺一次生成

Google 在美國時間20日宣布推出 Nano Banana Pro(Gemini 3 Pro Image),主打更高解析度與更精準的影像生成、編輯能力,提供開發者打造新一代多模態應用的工具。這款新模型延續今年稍早推出的 Nano Banana(Gemini 2.5 Flash Image),並大幅提升文字呈現、真實感與邏輯處理能力。

Google Gemini Live大升級 節奏與音調更接近真人

Google 今(13日)宣布針對語音互動服務「Gemini Live」推出多項重大更新,新增語速即時調整、語氣自適應、口音選擇與多模態整合等功能,進一步提升語音 AI 的自然度與互動流暢性。

熱門新聞

最夯影音

更多

熱門快報

回到最上面