
第 1 步:註冊並選擇 Wan 2.6
建立免費的 Elser AI 帳號。在影片模型選擇器中選擇 Wan 2.6。
Wan 2.6 是阿里巴巴通義萬相最先進的影片生成模型。它可以從文字、圖像、參考影片或音訊生成 1080p、24 fps 的影片——具備原生音畫同步與精準口型同步。其亮點功能包括參考生影片的角色扮演、從簡單提示詞出發的智能多鏡頭敘事,以及最長 15 秒的片段。現已登陸 Elser AI。
Wan 2.6-R2V 讓你上傳角色的參考影片(捕捉其外觀與聲音),僅憑一段文字提示詞就能生成以該角色、動物或物體為主角的生動新場景。它將徹底改變短劇創作者的工作方式。
立即體驗 Wan 2.6

Wan 2.6 能理解複雜腳本,自動把一段簡單提示詞拆解為多個連貫鏡頭——遠景、中景與特寫——再拼接成流暢的 10–15 秒轉場影片。場景切換自然順滑,更像精心設計的跟拍或搖鏡,而非生硬的跳切。
立即體驗 Wan 2.6Wan 2.6 可輸出最長 15 秒的 1080p 片段——比多數競品的標準檔更長——並在一次推理中同步生成對白、環境音與音素級口型同步。角色身份、光線與色彩在每一次剪切之間都保持一致。
立即體驗 Wan 2.6

建立免費的 Elser AI 帳號。在影片模型選擇器中選擇 Wan 2.6。

用多鏡頭語法寫一段結構化提示詞:「整體描述。鏡頭 1 [0–4s] 內容。鏡頭 2 [4–8s] 內容。鏡頭 3 [8–12s] 內容。」選擇時長(5、10 或 15 秒)、解析度(720p 或 1080p)和長寬比(16:9、9:16、1:1、4:3 或 3:4)。開啟「提示詞擴寫」和「多鏡頭」可獲得更豐富的敘事分段。

生成影片、預覽,並匯出為帶同步音軌的 MP4——可直接用於社群、廣告或短劇。
原生音訊同步幫我省下了好幾個小時的後期。再也不用手動把配音對到畫面上了。
終於有一個能理解滑動變焦、對焦切換等複雜運鏡的模型了。
我用不到兩分鐘就生成了一段 15 秒、帶配音和背景音樂的產品影片。Wan 2.6 對電商是顛覆性的。
跨多個鏡頭的角色一致性簡直不真實。再也沒有換臉漂移——我真的能用同一個主角講完一個短故事。
我們用 Wan 2.6 的數字人做了一支提案影片。客戶以為是真人演員。原生口型同步起了決定性作用。
Wan 2.6 是阿里巴巴通義萬相最先進的影片生成模型。它可以從文字、圖像、參考影片或音訊生成 1080p、24 fps 的影片,具備原生音畫同步與精準口型同步。核心功能包括參考生影片(將角色的外觀與聲音植入新場景)、從簡單提示詞出發的多鏡頭敘事,以及最長 15 秒的片段。
三大關鍵差異。其一,參考生影片(角色扮演):Wan 2.6 是中國首個僅憑一段參考影片,就能在生成的場景中同時保留角色外觀與聲音的模型。其二,智能多鏡頭敘事:模型把單條提示詞拆解為多個連貫鏡頭——遠景、中景、特寫——銜接流暢,並在每次剪切之間保持光線、色彩與角色身份的一致。其三,15 秒 1080p 輸出且自帶原生音訊:時長超過多數競品的標準檔,對白、環境音與口型同步在一次推理中一併生成。
可以。Elser AI 為新用戶提供試用積分。升級到付費方案即可獲得完整的商用權利。
Wan 2.6 支援 5、10 或 15 秒、24 fps。解析度為 720p 和 1080p。長寬比包括 16:9、9:16、1:1、4:3 和 3:4——涵蓋 YouTube 寬螢幕、TikTok/Reels 直螢幕、Instagram 方形以及傳統廣播格式。
支援。Wan 2.6 在一次推理中生成同步的影片與音訊——對白、環境音、音效與背景音樂——並具備音素級口型同步。
支援。Wan 2.6 圖生影片可將靜態圖片動畫成最長 15 秒的高保真影片片段,並可選音訊,配合文字引導實現精確的運動控制。提供 720p 和 1080p。
參考生影片(R2V)是 Wan 2.6 的招牌功能。你上傳一段同時捕捉外觀與聲音的角色參考影片,再用文字提示詞生成以同一角色為主角的新場景——畫面與音訊均保持一致。R2V 支援 1–3 段參考影片,在提示詞中用 @Video1、@Video2、@Video3 語法引用。適用於人物、動物或物體。
使用結構化的多鏡頭語法:先寫整體描述,再逐鏡頭寫明時間與內容。範例:「鏡頭 1 [0–4s] 黃昏時分未來都市的遠景。鏡頭 2 [4–8s] 跟隨主角穿過霓虹街道的中景跟拍。鏡頭 3 [8–12s] 主角面部特寫,眼中映出霓虹反光。」開啟「提示詞擴寫」和「多鏡頭」可獲得最佳的敘事分段。
價格因提供方而異。透過 Elser AI,我們提供簡化的按量計費方案——請在平台上查看當前價格與免費試用積分。
透過 Elser AI 使用最為簡單——註冊、選擇 Wan 2.6、輸入提示詞並生成,無需 API 金鑰或基礎設施管理。Wan 2.6 也可透過阿里雲百煉(Model Studio)平台及其他第三方提供方使用。
1080p、24 fps,具備出色的角色一致性、流暢的多鏡頭轉場、原生音畫同步與電影級光影。Wan 2.6 在運動品質與指令遵循方面持續位列中國一流模型之中。寫實人像更自然,「AI 感」大幅降低,構圖具備專業級美學。
在 Elser AI 註冊即可解鎖 Wan 2.6——參考生影片角色扮演、智能多鏡頭敘事與原生音訊同步。即刻生成專業電影級影片,無需任何技能,無需 GPU。
在 Elser AI 上體驗 Wan 2.6