來源:科技日報 發布時間:2024-8-5 9:50
科技日報訊 (記者崔爽)記者8月3日獲悉,亮相2024中關村論壇年會的人工智能視頻大模型Vidu日前宣布在全球正式上線。Vidu開放文生視頻、圖生視頻兩大核心功能,提供4秒和8秒兩種時長選擇,分辨率最高達1080P。
Vidu是北京生數科技有限公司(以下簡稱“生數科技”)聯合清華大學發布的自研長時長、高一致性、高動態性視頻大模型。據介紹,此次面向全球上線,Vidu在基礎功能外新增動漫風格、角色一致性等功能。生數科技有關負責人表示,Vidu實現了業界最快實測推理速度,僅需30秒就能生成一段4秒片段。目前Vidu無需申請,用戶直接使用郵箱注冊即可上手體驗。
今年初,文生視頻大模型Sora在全球引發廣泛關注。目前業界對視頻模型的評價主要圍繞三大核心維度:語義理解準確性、畫面美觀性、主體動態一致性。Vidu較好平衡了這三方面的表現。它能準確理解并生成提示詞中的文字,包括字母、數字等,并能生成文字特效。對第一人稱、延時攝影等鏡頭語言,Vidu也能精準表達,用戶只需細化提示詞,即可大幅提升視頻可控性。同時,Vidu支持大幅度、精準的動作生成,保持高流暢、高動態的畫面效果。
此外,Vidu在構圖、敘事和光影等方面,能達到接近電影級效果。Vidu還能生成影視級特效畫面,如煙霧、炫光效果、CG(計算機圖形學)特效等。