挑戰Sora!陸發表首款國產影片生成AI

記者蔡紹堅/綜合報導

中國大陸生數科技聯合清華大學研發的影片生成AI大模型Vidu近日在北京發表,它支援一鍵生成長達16秒,分辦率高達1080P的高畫質影片內容,是大陸第一款國產的影片生成AI大模型,。

從現場示範的影片中可以看到,Vidu能夠模擬真實的物理世界,產生細節複雜且符合真實物理規律的場景,諸如合理的光影效果,細膩的人物表情等。

Vidu也能夠產生複雜的動態鏡頭,不只限於簡單的推,拉,移等鏡頭,而是能夠圍繞統一主體在一段畫面裡實現遠景,近景,中景,特寫等不同鏡頭的切換,直接生成長鏡頭,追焦,轉場等效果也不在話下,為影片注入豐富的鏡頭語言。

▼Vidu的示範影片。(圖/翻攝微博)

▲▼陸發表國產影片生成AI Vidu。(圖/翻攝微博)

短片中的片段都是從頭到尾的連續生成,沒有明顯的插幀現象,透過這種「一鏡到底」的表現能夠推測出,Vidu採用的是「一步到位」的生成方式,從文字到影片的轉換是直接且連續的,在底層演算法實現上是基於單一模型完全端到端生成,不涉及中間的插幀和其他多步驟的處理。

清華大學AI 研究院副院長,生數科技首席科學家朱軍表示,「在今年2月,文生影片大模型Sora發布後,我們發現其剛好和我們的技術路線是高度一致的,這也讓我們堅定地進一步推進了自己的研究」。

▲▼陸發表國產影片生成AI Vidu。(圖/翻攝微博)

根據陸媒報導,Sora發布推出後,Vidu團隊基於對U-ViT架構的深入理解以及長期積累的工程與數據經驗,在短短兩個月進一步突破長視頻表示與處理關鍵技術,研發推出Vidu視頻大模型,顯著提升影片的連貫性與動態性。

研發團隊也特別強調,Vidu能夠深刻理解並展現中國元素,特別注重文化適應性,能夠生成具有中國特色的元素,諸如貓熊、龍等等。

▲▼陸發表國產影片生成AI Vidu。(圖/翻攝微博)

分享給朋友:

※本文版權所有,非經授權,不得轉載。[ ETtoday著作權聲明 ]

相關新聞

讀者迴響

熱門新聞

最夯影音

更多

熱門快報

回到最上面