我國自研視頻大模型全球上線

來源：科技日報發布時間：2024-8-5 9:50

　　科技日報訊（記者崔爽）記者8月3日獲悉，亮相2024中關村論壇年會的人工智能視頻大模型Vidu日前宣布在全球正式上線。Vidu開放文生視頻、圖生視頻兩大核心功能，提供4秒和8秒兩種時長選擇，分辨率最高達1080P。

　　Vidu是北京生數科技有限公司（以下簡稱“生數科技”）聯合清華大學發布的自研長時長、高一致性、高動態性視頻大模型。據介紹，此次面向全球上線，Vidu在基礎功能外新增動漫風格、角色一致性等功能。生數科技有關負責人表示，Vidu實現了業界最快實測推理速度，僅需30秒就能生成一段4秒片段。目前Vidu無需申請，用戶直接使用郵箱注冊即可上手體驗。

　　今年初，文生視頻大模型Sora在全球引發廣泛關注。目前業界對視頻模型的評價主要圍繞三大核心維度：語義理解準確性、畫面美觀性、主體動態一致性。Vidu較好平衡了這三方面的表現。它能準確理解并生成提示詞中的文字，包括字母、數字等，并能生成文字特效。對第一人稱、延時攝影等鏡頭語言，Vidu也能精準表達，用戶只需細化提示詞，即可大幅提升視頻可控性。同時，Vidu支持大幅度、精準的動作生成，保持高流暢、高動態的畫面效果。

　　此外，Vidu在構圖、敘事和光影等方面，能達到接近電影級效果。Vidu還能生成影視級特效畫面，如煙霧、炫光效果、CG（計算機圖形學）特效等。

上一篇：4.21克機器人是怎樣飛起來的

下一篇：我國智算服務釋放巨大潛力

相關資訊