Imagen 4、Veo 3正式亮相  Google打造全方位AI創作平台

▲▼             。(圖/Google)

▲Google正式推出Imagen 4、Veo 3 。(圖/Google)

記者吳立言/綜合報導

Google DeepMind今(21日)於開發者大會中,正式發表新一代生成圖像模型Imagen 4,不僅在細節還原、色彩層次、排版字體等多方面提升,還將推出速度提升10倍的快版,目標是加速創意探索流程。此外,Google也同步推出Veo 3、音樂生成模型Lyria 2及全新AI製片工具Flow,全面進軍創作市場。

Imagen 4目前已開放於 Gemini App、Whisk、Google Workspace各項產品中使用,並支援高達2K解析度及多種長寬比例。其在字體排版上的強化,尤其適合創作卡片、漫畫、海報等設計圖像。為進一步降低等待時間,Google預告將推出一款「Imagen 4 快版」,生成速度是上一代Imagen 3的10倍。這項升級對設計師與內容創作者而言,無疑將大幅縮短構思與實作之間的距離。

除了圖像模型,Google也正式推出「Veo 3」影音生成模型,首度支援影片中的聲音生成,例如城市喧囂、鳥鳴或角色對話。Veo 3對故事敘述理解能力更強,還可搭配Flow工具進行AI電影製作,目前已開放給美國地區的Ultra訂閱用戶與企業Vertex AI用戶使用。

針對影片製作者需求,前一代Veo 2模型也獲得升級,加入「參考圖像生成」、「鏡頭運動控制」、「場景延伸(outpainting)」、「物件增刪」等實用功能。新登場的Flow是一款整合Veo、Imagen與Gemini的AI製片平台,主打自然語言敘述即可完成分鏡腳本、角色設定、場景風格統一,並預計將陸續拓展至更多國家。

Google同時強調責任創作原則,透過SynthID技術為AI生成內容加入數位浮水印,截至目前已為超過100億項內容標記,並同步推出「SynthID Detector」入口網站,供外界查驗內容是否為AI生成。

06/16 全台詐欺最新數據

更多新聞
557 2 4772 損失金額(元) 更多新聞

※ 資料來源:內政部警政署165打詐儀錶板

分享給朋友:

追蹤我們:

※本文版權所有,非經授權,不得轉載。[ ETtoday著作權聲明 ]

AI科技熱門新聞

ChatGPT圖像生成功能登陸WhatsApp

AI工具幫企業擺脫「濫開會」困境

Apple Intelligence繁體中文即將上線

Gemini深度思考模式即將登場

ChatGPT專案功能大升級

ChatGPT新增圖片查詢與多重搜尋功能

Grok任務排程功能疑將上線

OpenAI推出提示詞儲存與版本控管功能

Copilot、Gemini、ChatGPT差在哪?

Codex升級單一任務可獲多種解法

ChatGPT建議急診用戶送醫救回敗血症妻

麻省理工打造AI畫作修復技術

Dia瀏覽器內建AI一站處理搜尋與寫作

漸凍人用腦發聲技術問世

相關新聞

讀者迴響

熱門新聞

最夯影音

更多

熱門快報

回到最上面