NEWS

阿里開源通義萬相Wan2.2

2025.08.14火貓網絡閱讀量: 489

阿里開源電影級視頻生成模型通義萬相Wan2.2

7月28日晚間，阿里巴巴旗下阿里云正式開源電影級視頻生成模型「通義萬相Wan2.2」，引發AI領域廣泛關注。此次開源涵蓋三款核心模型，分別為文生視頻模型（Wan2.2-T2V-A14B）、圖生視頻模型（Wan2.2-I2V-A14B）及統一視頻生成模型（Wan2.2-TI2V-5B），其中前兩者為業界首個采用MoE架構的視頻生成模型，進一步推動AI視頻創作從專業領域走向大眾化。

技術突破：MoE架構與電影美學控制系統

通義萬相Wan2.2在技術上實現多重創新：

MoE架構優化效率：文生/圖生模型總參數量達27B，激活參數僅14B，通過「高噪聲專家模型+低噪專家模型」雙專家分工，分別負責視頻整體布局與細節完善，在同參數規模下節省約50%計算資源，解決長視頻生成的算力瓶頸。
電影級美學控制：首創「電影美學控制系統」，集成光影、色彩、構圖、鏡頭角度等60+可控參數，用戶輸入關鍵詞即可精準調控畫面風格。例如，「雨夜、逆光、藍綠色調」可生成情緒張力的都市夜景，「清晨、暖光、淺景深」則呈現溫情家庭場景，實現從「猜畫面」到「懂創作」的跨越。
高壓縮3D VAE技術：5B小模型采用4×16×16時空壓縮比，信息壓縮率提升4倍，僅需22G顯存（單張消費級顯卡如RTX 4090）即可在數分鐘內生成5秒720P高清視頻，普通用戶也能體驗云端級效果。

模型能力與應用場景

Wan2.2單次可生成5秒高清視頻，支持多輪提示詞迭代優化，滿足短劇制作、廣告創意、影視分鏡等場景需求。例如，輸入《星際穿越》經典場景描述，模型可精準還原宇航員在米勒星球的畫面質感；輸入「黑人女性在黃昏地鐵中靜止畫面」，能生成符合現實主義風格的文藝視頻。未來，團隊計劃進一步延長單次生成時長，拓展更長敘事場景。

開源渠道與生態支持

三款模型已全面開放，開發者可通過以下渠道獲取：

GitHub：https://github.com/Wan-Video/Wan2.2
HuggingFace：https://huggingface.co/Wan-AI
魔搭社區：https://modelscope.cn/organization/Wan-AI
企業API：阿里云百煉平臺
用戶體驗：通義萬相官網及通義APP

此外，模型兼容FP8量化、LoRA訓練、ComfyUI及Diffusers生態，支持開發者快速集成與二次開發，降低AI視頻創作門檻。

行業意義

作為阿里繼Qwen2大模型后又一重磅開源成果，通義萬相Wan2.2不僅推動視頻生成技術向「電影級」「實用化」邁進，更通過開源生態吸引全球開發者參與優化。自2025年2月以來，通義萬相系列模型已累計下載超500萬次，此次Wan2.2的發布將進一步加速AI視頻創作的普及，為影視、廣告、教育等行業注入新活力。

上一篇：35+技術人創業，這5個方向可試下一篇：AI智能體哪家強？三大工具測評

返回列表頁

火貓網絡

明確需求效果至上