商湯將開放首個人物影片大模型Vimi 支援聊天、唱歌、舞動等互動場景

2024世界人工智能大會(WAIC 2024)4日上午在上海登場,大陸知名AI企業商湯科技推出首個向廣大用戶開放的「可控」人物視頻生成大模型Vimi。Vimi基於商湯日日新大模型,只需要一張任何風格的照片,即可生成和目標動作一致的人物類短片。

香港經濟日報4日報導,當前生成式AI技術急速發展,雖然讓照片中的人物動起來已非新鮮事,但商湯科技指出,目前市面上相關產品的實際應用仍存在挑戰,闢如人物動作、表情動作無法精準控制,效果不穩定,且時長有限,只能生成3至4秒短片等,無法滿足廣大短片創作者的需求。

為解決以上痛點,商湯科技研發的人物影片生成大模型Vimi,可控制照片中人物上半身的自然肢體動作,並自動生成與人物相符的頭髮、服飾及背景變化。商湯科技表示,該模型也可生成合理的光影變化,讓人物動作和視覺效果更為流暢自然。

而且,Vimi可穩定生成長達1分鐘的單鏡頭人物類短片,畫面效果亦不會隨著時間變化而降低品質或失真。針對喜愛自拍的用戶、創作者等需求,該模型還支援聊天、唱歌、舞動等多種娛樂互動場景。模型更獲頒WAIC展覽展示最高榮譽「鎮館之寶」殊榮,成本屆大會最具創新的展品。

更多中時新聞網報導
25元的00919要繼續等全糖價? 網讚2條件堪稱「雙重特價」:直接All in了
頂客族老公過世 遺產不能全拿 還要分大伯小姑一半?專家1張紙拿回8成
逾800萬有房族注意!7月起少做1件事 房屋稅恐變4倍 囤房族更要看