阿里巴巴開源AI影片神器!Wan2.1-VACE終結好萊塢特效 一款模型搞定多個影片編輯任務
阿里巴巴 (09988-HK)(BABA-US)周三 (14 日) 宣布正式開源其自主研發的影片生成與編輯大模型通義萬相 Wan2.1-VACE,這一里程碑式的技術突破標誌著中國企業在 AI 影片生成領域邁入全球領先行列。
作為當前業界首個實現全流程覆蓋的影片大模型,Wan2.1-VACE 透過創新性的技術架構和開放的生態策略,為內容創作者、開發者及企業用戶提供了前所未有的影片創作工具。
Wan2.1-VACE 包含 1.3B 和 14B 兩個版本,其中輕量級的 1.3B 版本可在消費級顯卡上流暢運行,顯著降低 AI 視訊產生的技術門檻。開發者可透過 GitHub、HuggingFace 及阿里雲魔搭社群免費下載體驗,而更高效能的 14B 版本則支援 480P 至 720P 高畫質影片產生。
官方數據顯示,自今年 2 月啟動開源計畫以來,通義萬相系列模型在 GitHub 平台的下載量已經突破 330 萬次,獲得超過 1.1 萬個 Star 標記,成為當下最受開發者追捧的影片生成模型之一。
Wan2.1-VACE 的核心技術突破在於其首創的「視訊條件單元」(VCU)。本模組透過統一文字、影像、視訊、Mask 和控制訊號四類輸入形態,成功解決了多模態輸入的 token 序列化難題。具體而言,系統會將輸入內容分解為可變序列與不可變序列,分別進行編碼處理後再進行特徵融合。此設計讓模型在維持角色一致性的同時,能 0 準控制影片的版面、運動姿態及空間關係,例如使用者可透過上傳物件參考圖或影片片段,結合姿態光流、深度圖等控制訊號,實現對影片內容的局部重繪、主體替換甚至背景環境動態擴展。
功能上,Wan2.1-VACE 實現了影片產生與編輯的全鏈條覆蓋,其支援的六大核心能力包括:文生影片、影像參考影片生成、影片重繪、局部編輯、背景延展時間長延展。尤其重要的是,模型創新性地支援多任務自由組合。開發者不用針對特定需求訓練獨立模型,只需透過輸入條件的靈活搭配即可完成複雜創作,例如將影像參考與主體重塑功能結合可實現視訊物件替換;融合圖片參考、首幀參考和背景擴充功能,甚至可將直式圖片轉換為包含參考元素的橫向影片。這種模組化設計大幅提升創作效率,讓影片製作從傳統線性流程,轉向高度個人化的拼圖式創作。
此外,Wan2.1-VACE 採用分層編碼架構。首先,透過變分自編碼器 (VAE) 將可變幀與不變幀分別編碼至 16 通道的隱空間,Mask 序列被映射至 64 通道的時空特徵空間。隨後,系統將三類隱空間特徵融合併映射為擴散 Transformer(DiT)的 Token 序列。
訓練策略方面,團隊比較了全域微調與情境適配器微調兩種方案,最終選擇後者以實現更快的收斂速度,並降低基礎能力遺失風險。
實驗數據顯示,相較於 1.3B 預覽版,目前開源版本在影片產生品質、編輯精準度及多任務協同效率等關鍵指標上均提升超過 35%。
專家指出,Wan2.1-VACE 的開源不僅提升阿里巴巴在 AI 創作領域的生態佈局,更可能重塑影片內容生產範式。相較於傳統視訊生成工具需要頻繁切換模型和工具鏈,Wan2.1-VACE 的一站式解決方案讓創意實現更有效率和靈活,尤其是在影視後期、廣告創意、社群媒體營運等領域,Wan2.1-VACE 支援的局部修改、長度調整和背景替換等功能,可大幅降低內容生產成本,並激發創作者的想像。
值得注意的是,阿里巴巴此次開源採取了漸進式開放策略。透過先期釋放輕量化版本吸引開發者參與,逐步推動技術迭代與生態繁榮。這種「以開源促創新」的模式,既延續 Gemini、Stable Diffusion 等成功專案的開源經驗,也結合中國本土市場的實際需求。
隨著更多開發者基於 Wan2.1-VACE 建構垂直應用,一個以視訊生成為核心的開源生態正在快速成型。
根據產業分析師預測,隨著算力成本持續下降和模型能力不斷提升,AI 影片生成未來三年將進入普惠階段。Wan2.1-VACE 的開源恰逢其時,不僅降低技術准入門檻,更重要的是透過開放協作加速了技術創新。當開發者能自由組合文字、圖像、視訊和控制訊號創造出無限可能時,人類對於視覺敘事的想像邊界將被徹底改寫。
更多鉅亨報導
相關內容
阿里千問月活躍用戶突破3千萬,開放四項新功能
MoneyDJ新聞 2025-12-10 15:44:21 新聞中心 發佈綜合陸媒報導,阿里巴巴(BABA.US;9988.HK)今(10)日宣布,千問公測上線後僅23天,月活躍用戶數(含APP、Web、PC端)突破3,000萬,成為全球成長最快的AI應用。官方表示,千問APP正加速從「會聊天」邁向「能辦事」,將向所有用戶首批開放AI PPT、AI寫作、AI文庫、AI講題四項「辦事」新功能。 具體來看,AI PPT可一句話生成PPT,逾10萬範本智慧匹配,可對話修改內容;AI寫作支持一句話成稿,上萬種論文、公文、合同範本自動排版;AI文庫可一句話找資料,5億規模資料全領域覆蓋,免費下載;AI講題能一鍵拍題,模擬真人老師講解,百萬真題免費提供。 據瞭解,千問App於11月17日公測上線,基於開源模型通義千問Qwen打造,同步提供網頁和PC版。目前,阿里巴巴已成立千問C端事業群,由阿里巴巴集團副總裁吳嘉負責。阿里巴巴於內部溝通中提及,千問C端事業群的首要目標是將千問打造成為一款超級App,成為AI時代用戶的第一入口;未來將進一步把千問打造成無處不在的AI助手,覆蓋眼鏡、PC、汽車等場景,意
Moneydj理財網 ・ 4 天前 ・ 發起對話
傳字節跳動、阿里巴巴想買輝達H200 能否放行仍看北京點頭
《路透》周三 (10 日) 援引知情人士消息報導,在美國總統川普宣布允許輝達 (NVDA-US) 旗下台灣製造的人工智慧 (AI) 晶片 H200 可出口至中國後,字節跳動與阿里巴巴 (BABA-US)(09988-HK) 已向輝達詢問採購事
鉅亨網 ・ 4 天前 ・ 發起對話Meta棄守開源轉攻閉源商業化,傳攜手阿里通義千問優化新模型
【財訊快報/陳孟朔】外電報導,臉書母公司Meta Platforms(美股代碼META)傳正大幅調整人工智慧策略,準備由過去力推的開源路線轉向閉源商業化模型,並在新一代模型訓練過程中,導入阿里巴巴(Alibaba Group,美股代碼BABA)旗下通義千問(QWEN)等第三方模型作為優化工具。消息傳出後,週三Meta股價收低1%,阿里巴巴美國預託證券(ADR)則一度抽高約3.1%,終場漲1.83%,顯示資本市場已開始押注這場路線轉向的潛在贏家與受惠方。市場傳出,Meta正開發代號為「牛油果(Avocado)」的新模型,定位為可直接收費的閉源產品,最快有望在2026年春季推出,標誌該公司試圖從大規模AI投資中加速變現。為此,Meta內部組建名為TBD Lab的團隊專責相關研發,並在模型訓練和強化階段,引入多家外部技術資源,包含谷歌(Google)的Gemma、OpenAI(OpenAI)的GPT-oss,以及來自中國的多家模型與工具,希望透過「多模型融合」提升新產品在企業級應用與獲利能力。知情人士指出,Meta執行長佐克柏(Mark Zuckerberg)已明確對內下達方向指示,要求公司
財訊快報 ・ 3 天前 ・ 發起對話阿里通義千問Qwen3-TTS全面升級 提供49種音色
MoneyDJ新聞 2025-12-11 11:02:10 新聞中心 發佈綜合陸媒報導,阿里巴巴(9988.HK)旗下通義千問Qwen3-TTS全面升級。據悉,這是一款支持多音色、多語種和多方言的語音合成AI模型,目前可透過Qwen API訪問。此次Qwen3-TTS主要改進包括更加豐富的音色支持、多語種多方言能力持續增強,以及韻律/語速更加自然、更擬人化。具體來看,音色方面,Qwen3-TTS提供超過49種高品質音色,涵蓋不同性別、年齡、地域特徵與角色設定,滿足多樣化的場景需求。語言方面,Qwen3-TTS支持中文、英文、德語、義大利語、葡萄牙語、西班牙語、日語、韓語、法語、俄語等10大主流語言,同時並支持更多音色的方言生成,包括閩南語、粵語、四川話、北京話等。此外,相比於上一個版本,Qwen3-TTS自適應根據文本調節語速和韻律的能力大幅提高,擬人化程度逼近真人。延伸閱讀:騰訊發布自研AI大模型混元2.0,聚焦推理能力美預計將擴大旅遊禁令至約30國,加強身份文件查驗 資料來源-MoneyDJ理財網
Moneydj理財網 ・ 3 天前 ・ 發起對話增長全球最快!阿里千問變辦公神器 月活躍用戶破3千萬 AI PPT幾分鐘搞定
大陸媒體引述阿里巴巴數據顯示,旗下人工智慧(AI)助手千問App自11月17日公開測試以來,以23天每月活躍用戶人數已突破3,000萬,成為全球增長最快的AI應用
中時財經即時 ・ 4 天前 ・ 發起對話輝達H200解禁對騰訊、阿里有利 陸券商:難阻國產替代
美中科技戰重大轉向,美國總統川普宣布放寬AI晶片龍頭輝達H200晶片對中國大陸出口。美國前官員和智庫相繼示警,美國恐因此放棄算力優勢,拱手讓給中國大陸。中國大陸券商則分析,這有利騰訊、阿里巴巴等中國大陸雲端企業,但難以阻礙中國大陸發展科技自主的國產化替代長期目標。
工商時報 ・ 4 天前 ・ 1
外媒:字節跳動、阿里均有意訂購輝達H200晶片
MoneyDJ新聞 2025-12-11 08:02:49 新聞中心 發佈綜合港媒引用路透社報導,據四名消息人士表示,在美國總統川普(Donald Trump)表示,允許輝達(Nvidia)向中國出口H200人工智慧(AI)晶片後,字節跳動和阿里巴巴(9988.HK)已向輝達詢問購買該晶片事宜 。 據其中兩位知情人士表示,若中國政府開綠燈,這些中國企業熱衷於下大訂單購買H200晶片;不過,他們仍然擔心供應問題,正在尋求輝達的澄清。 另據《The Information》報導,中國監管機構召集了阿里巴巴、字節跳動和騰訊控股(0700.HK)等公司的代表,要求他們評估對H200的需求。消息人士表示,官員告訴這些公司,他們將很快被告知中國政府的決定。 另外兩位熟悉輝達供應鏈的人士表示,H200目前的生產數量非常有限,因輝達一直專注於其最先進的Blackwell和即將推出的Rubin產品線。 消息人士指出,中國企業熱衷於H200,因其訓練AI模型的能力是目前更適合推理的中國國內同類產品所無法比擬的。中國企業預計當局可能需要審查採購申請,並要求他們提供使用案例,因為他們正在考量允許H200進口的
Moneydj理財網 ・ 3 天前 ・ 發起對話字節跳動、阿里巴巴有意訂購大筆輝達H200晶片,等待北京拍板
【財訊快報/劉敏夫】外電報導指出,熟知內情的消息人士透露,自美國總統川普表示將允許輝達向中國出口H200晶片以來,字節跳動和阿里巴巴已針對下達該晶片大筆訂單的事宜進行了問詢。消息人士表示,上述兩家公司正在等待中國方面的首肯,以下達訂單。對此,中國外交部表示,中國重視與美國的合作,但拒絕進一步置評。
財訊快報 ・ 3 天前 ・ 發起對話中國與科技公司召開緊急會議 評估是否購買輝達H200
The Information報導,中國監管機構召集了阿里巴巴、字節跳動和騰訊控股等公司的代表,要求他們評估對輝達H200的需求。消息人士說,官員告訴這些公司,他們將很快被告知中國政府的決定。
中時財經即時 ・ 4 天前 ・ 發起對話
FiRa 聯盟推出全新會員層級,驅動產業擴張
俄勒岡州比佛頓, December 11, 2025--(美國商業資訊)--FiRa® 聯盟正擴展其會員結構,新增「協作會員」層級,為更廣泛的產業參與敞開大門。憑藉全新以營收為基礎的定價模式,不同規模的組織如今皆能更輕鬆地共同形塑精準、安全的無線體驗未來。此新層級透過降低成本門檻並擴大對 FiRa 資源的取得,為創新者、開發者及新興參與者開啟了大门,使其有机会为下一代無線技術發展做出贡献。
Business Wire ・ 2 天前 ・ 發起對話
破解綠色通膨迷思!碳費一噸 300 元太便宜?彭啓明揭「減碳成本」超乎想像...
論壇中心/綜合報導隨著全球加速推動氣候行動,碳定價成為國際趨勢。環境部長彭啓明在《決策者》節目中指出,一噸300元的碳費「絕非真實成本」,這是台灣採雙軌制的主因。具備減碳能力的企業將逐步走向「總量管制與排放交易(ETS)」;轉型較慢的業者則續留碳費架構。彭部長以德國循環經濟占GDP 9%為例,強調台灣循環經濟仍有成長空間。
民視財經網 ・ 2 天前 ・ 3
美財長提鬆綁金融監管 稱降低障礙能促經濟成長
《CNBC》周四 (11 日) 報導,美國財政部長貝森特正提議大幅改變金融監管方針,將金融穩定監督委員會 (FSOC) 的重心從強化監管轉向放鬆管制,主張降低監管障礙能強化金融體系並促進經濟成長,此舉與川普政府鬆綁監管政策一致。
鉅亨網 ・ 3 天前 ・ 發起對話
〈正文法說〉切入光通訊模組明年下半年量產 印度Wi-Fi毫米波FWA力拚百倍成長
網通廠正文 (4906-TW) 今 (11) 日召開法說會,執行董事楊正任表示,正文積極佈局四大關鍵技術產品線,從光纖網路基礎建設、邊緣 AI 整合模組、Wi-Fi over 毫米波 FWA 到增值軟體應用全面出擊,力拚在 AI 驅動的網路時
鉅亨網 ・ 3 天前 ・ 發起對話
易控智慧攜手科技大廠攻AI建築 打造軟硬整合服務
2025台北國際建築建材暨產品展11日於南港展覽館登場,隨著淨零碳排與AI應用成為產業顯學,易控智慧執行長周世泰宣布,將以AI、機器人、360圖控作為三大成長引擎,並攜手英特爾、建碁、研華、信驊等科技大廠,透過開放式架構與一條龍服務,打造智慧建築軟硬體整合的第一品牌。
中時財經即時 ・ 3 天前 ・ 發起對話
Netbank選擇Thredd推動其於全菲律賓推出的新世代Cards-as-a-Service服務
新加坡, December 10, 2025--(美國商業資訊)--Thredd領先的次世代全球支付處理商,今日宣布菲律賓首個完全受監管的嵌入式銀行平台Netbank已選擇Thredd來推出其全新的Cards-as-a-Service(CaaS)解決方案,幫助金融科技公司、電子錢包與銀行在消費者與商業領域迅速部署現代且彈性的卡片發行服務。
Business Wire ・ 4 天前 ・ 發起對話
《美國經濟》上週初領失業金23.6萬人遜於預期
MoneyDJ新聞 2025-12-12 06:40:56 黃文章 發佈美國勞工部12月11日公佈,經季節調整後,截至12月6日為止當週,首次申請失業救濟金人數較前週修正值(上修1,000人)增加44,000人至236,000人,增加人數創下2020年3月以來的單週新高,遜於經濟學家平均預估的21.9萬人。截至12月6日當週,首次申請失業救濟金人數的4週移動平均值較前週增加2,000人至216,750人。 截至11月29日為止當週,經季節調整後,連續申請失業救濟金人數較前週修正值減少99,000人至1,838,000人。當週連續申請失業救濟金人數的4週移動平均值較前週修正值減少27,000人至1,918,000人。截至11月29日為止當週,經過季節性因素調整後的保險失業率較前週下滑0.1個百分點至1.2%。 截至11月29日當週,初領失業金申請數增加最多的州為賓州(+2,208人)、威斯康辛州(+1,092人)、內布拉斯加州(+870人)、愛荷華州(+605人)以及俄亥俄州(+493人),而減少最多的州則為加州(-19,844人)、德州(-7,836人)、紐約州(-3,453人)、伊利
Moneydj理財網 ・ 2 天前 ・ 發起對話
北北桃一小時生活圈成形 G08 站區段躍居自住客新寵
過去十年,台灣房市焦點一路從核心外移,重劃區接棒成為市場焦點;如今,在重劃區大量供給、生活機能尚待成形的背景下,「回到市中心」的強勢回歸浪潮反而成了房市保值蛋黄區的趨勢。隨著舊市區陸續推動都更,結合既有捷運與商圈機能優勢,坐落市中心的新建築重新吸引高質感自住客的目光。這不只是房市的輪迴,更是一線城市價值翻轉的再確立,結合捷運,享有市中心商業區的新生活型態,也鼓動了自住客進場的磁吸效應。
住展房屋網 ・ 4 天前 ・ 發起對話
Kioxia研發核心技術,推動高密度低功耗3D DRAM的實際應用
東京, December 12, 2025--(美國商業資訊)--全球儲存解決方案領域的領軍企業Kioxia Corporation今日宣布,已研發出具備高堆疊性的氧化物半導體溝道電晶體技術,該技術將推動高密度、低功耗3D DRAM的實際應用。這項技術已於12月10日在美國舊金山舉行的IEEE國際電子元件大會(IEDM)上亮相,可望降低AI伺服器和物聯網組件等眾多應用場景的功耗。
Business Wire ・ 2 天前 ・ 發起對話