▲Google正式推出Imagen 4、Veo 3 。(圖/Google)
記者吳立言/綜合報導
Google DeepMind今(21日)於開發者大會中,正式發表新一代生成圖像模型Imagen 4,不僅在細節還原、色彩層次、排版字體等多方面提升,還將推出速度提升10倍的快版,目標是加速創意探索流程。此外,Google也同步推出Veo 3、音樂生成模型Lyria 2及全新AI製片工具Flow,全面進軍創作市場。
Imagen 4目前已開放於 Gemini App、Whisk、Google Workspace各項產品中使用,並支援高達2K解析度及多種長寬比例。其在字體排版上的強化,尤其適合創作卡片、漫畫、海報等設計圖像。為進一步降低等待時間,Google預告將推出一款「Imagen 4 快版」,生成速度是上一代Imagen 3的10倍。這項升級對設計師與內容創作者而言,無疑將大幅縮短構思與實作之間的距離。
除了圖像模型,Google也正式推出「Veo 3」影音生成模型,首度支援影片中的聲音生成,例如城市喧囂、鳥鳴或角色對話。Veo 3對故事敘述理解能力更強,還可搭配Flow工具進行AI電影製作,目前已開放給美國地區的Ultra訂閱用戶與企業Vertex AI用戶使用。
針對影片製作者需求,前一代Veo 2模型也獲得升級,加入「參考圖像生成」、「鏡頭運動控制」、「場景延伸(outpainting)」、「物件增刪」等實用功能。新登場的Flow是一款整合Veo、Imagen與Gemini的AI製片平台,主打自然語言敘述即可完成分鏡腳本、角色設定、場景風格統一,並預計將陸續拓展至更多國家。
Google同時強調責任創作原則,透過SynthID技術為AI生成內容加入數位浮水印,截至目前已為超過100億項內容標記,並同步推出「SynthID Detector」入口網站,供外界查驗內容是否為AI生成。
讀者迴響