Wan 2.7 视频生成模型

Wan 2.7 是阿里巴巴通义万相于 2026 年 4 月推出的最新 AI 视频生成套件。它是一个具备四种生成模式的单一模型——文生视频、图生视频、参考生视频与视频编辑——并将在生成前先理解你意图的标志性「思考模式」与原生音画同步、最多 5 个主体的参考追踪结合在一起。现已登陆 Elser AI。

Wan 2.7

Wan 2.7 的核心能力

思考模式:先理解,再创作

大多数 AI 视频工具一按下按钮就匆忙开始生成。Wan 2.7 的思考模式会在渲染前花时间理解你的真实意图——更像一位联合导演,而不是一台盲目创作的机器。你由此获得更强的掌控力、更高的创作一致性,以及更少的重试。

立即体验 Wan 2.7

一个创作套件,四种生成模式

Wan 2.7 不是单一用途的工具,而是集于一个模型中的完整创作流程——文生视频、图生视频、参考生视频与视频编辑。生成、参考、续写与编辑,无需切换模型,也无需离开你的工作流。

立即体验 Wan 2.7

原生音视频同步

Wan 2.7 在一次统一推理中生成同步的视频与音频——对白、环境音、音效与背景音乐。音素级口型同步让角色的口型与台词精准对应,免去后期配音的步骤。

立即体验 Wan 2.7

如何在 Elser AI 上使用 Wan 2.7

第 1 步:注册并选择模式

创建免费的 Elser AI 账号。在视频模型选择器中选择 Wan 2.7,并选定你的生成模式:文生视频、图生视频、参考生视频或视频编辑。

第 2 步:输入提示词并上传参考素材

写一段有画面感的提示词——Wan 2.7 的思考模式能理解自然语言,无需过度雕琢的提示词。要保持多主体一致,可在参考生视频模式下上传最多 5 张参考图(外观),并可选地上传一段音频参考(声音)。

第 3 步:配置并生成

选择时长(2 到 15 秒)、分辨率(720p 或 1080p)和宽高比(16:9、9:16、1:1、4:3 或 3:4)。若需要精确的首尾画面,可启用首/尾帧,然后生成并导出为带同步音轨的 MP4。

探索 通义万相 系列

大家都在讨论 Wan 2.7

我最期待的功能就是 3×3 图生视频模式。它以九宫格形式接收 9 张参考图——多角度参考、连续姿态、场景变体。构图更丰富,漂移也大幅减少。

— Felix,AI 创作者

Wan 2.7 终于让 AI 视频能用于客户项目了。跨 5 个参考的角色一致性简直离谱——镜头之间再也不会换脸。我不用制作团队就能交付多角色短剧。

— Sarah Whitman,独立电影人

我以前要花好几个小时对台词、找环境音。Wan 2.7 一次生成就搞定。我的交付周期缩短了一半以上。

— Marcus Chen,电商内容负责人

思考模式是颠覆性的。我不用再跟提示词较劲 20 分钟,而是像跟人说话一样跟它沟通。它真的能在第一两次就明白我的意思。

— Lucas Meyer,短剧制片人

常见问题

Wan 2.7 是阿里巴巴通义万相于 2026 年 4 月推出的最新 AI 视频生成套件。它是一个具备四种生成模式的单一模型——文生视频、图生视频、参考生视频与视频编辑。其标志性的「思考模式」会在生成前理解你的意图,让 AI 更像一位创作伙伴,而不是一个盲目的工具。

四大关键差异。其一,思考模式——模型在渲染前先规划你的场景,而非盲目生成。其二,完整的创作流水线——生成、编辑、参考与续写集于一个套件。其三,业界领先的 5 主体参考追踪——在最多 5 个角色之间保持外观与声音一致。其四,基于指令的编辑——用自然语言修改已有视频,而不必从零重新生成。

可以。Elser AI 为新用户提供试用积分。升级到付费计划可获得更高分辨率、优先队列和完整的商用权利。

Wan 2.7 支持 2 到 15 秒、24 fps 的视频时长。分辨率为 720p 和 1080p。宽高比包括 16:9、9:16、1:1、4:3 和 3:4。如需 4K 输出,请使用 Wan 2.7-Image-Pro(仅图像)。

支持。Wan 2.7 在一次推理中生成同步的视频与音频——对白、环境音、音效与背景音乐。音素级口型同步确保角色的口型与台词自然吻合。

在参考生视频模式下,Wan 2.7 支持最多 5 个同时的角色参考——业界最高——同时锁定外观与声音。在图生视频模式下,它接收 3×3 九宫格布局的 9 张参考图,用于结构化的多角度构图。

Wan 2.7(视频)用于视频生成——一个模型,四种生成模式,涵盖文生视频、图生视频、参考生视频与视频编辑。Wan 2.7-Image 则是独立的图像生成模型,具备深度个性化、色板控制、高级文字渲染,以及支持 4K 输出的 Pro 版本。两者都可在 Elser AI 上使用——静态视觉用 Wan 2.7-Image,动态内容用 Wan 2.7(视频)。

描述要具体但自然——思考模式能理解自然语言,所以无需过度雕琢的提示词。可包含运镜(跟拍、滑动变焦、平移)、光线条件(黄金时刻、柔和漫射光)、情绪/基调,以及音频描述。当你需要精确的逐镜头控制时,Wan 2.7 也支持结构化的多镜头提示词。

价格因模式和分辨率而异。通过 Elser AI,我们提供简化的按量计费方案——请在平台上查看当前价格与免费试用情况。

Elser AI 已将 Wan 2.7 与 Seedance、Kling、Veo 等领先视频模型一同集成。注册后,在模型选择器中选择 Wan 2.7,选定你的生成模式(文生视频、图生视频、参考生视频或视频编辑),输入提示词或上传参考素材,即可开始生成——无需 API 密钥或复杂基础设施。

1080p、24 fps,具备电影级运镜、流畅的运动动态、原生音画同步以及出色的角色一致性。

AI 视频创作的未来,从 Wan 2.7 开始

在 Elser AI 注册即可解锁 Wan 2.7——一个模型,四种生成模式,配备思考模式与原生音频同步。即刻生成专业电影级视频,无需任何技能,无需 GPU。

在 Elser AI 上体验 Wan 2.7