Wan 2.6 動画生成モデル

Wan 2.6は、Alibabaの通義万相による最も先進的な動画生成モデルです。テキスト、画像、参照動画、音声から1080p、24fpsの動画を生成し——ネイティブな音声・映像同期と精密なリップシンクを備えています。際立った機能には、参照から動画のロールプレイング、シンプルなプロンプトからのインテリジェントなマルチショットストーリーテリング、最大15秒のクリップが含まれます。Elser AIで今すぐご利用いただけます。

Wan 2.6

Wan 2.6 のコア機能

ロールプレイング:中国初の参照から動画モデル

Wan 2.6-R2Vでは、キャラクターの参照動画(外観と声を捉えたもの)をアップロードし、テキストプロンプトだけでそのキャラクター、動物、物体を主役にした生き生きとした新しいシーンを生成できます。ショートドラマクリエイターの働き方を一変させるでしょう。

今すぐWan 2.6を試す

インテリジェントなマルチショットストーリーテリング

Wan 2.6は複雑な脚本を理解し、シンプルなプロンプトを複数の一貫したショット——ワイド、ミディアム、クローズアップ——に自動的に分解し、滑らかな10〜15秒のトランジション動画に縫い合わせます。シーンの切り替えは自然で、唐突なジャンプカットではなく、丁寧に設計されたトラッキングやパンのように感じられます。

今すぐWan 2.6を試す

ネイティブ音声付き15秒1080p出力

Wan 2.6は、最大15秒の1080pクリップ——多くの競合の標準ティアよりも長い——を提供し、対話、環境音、音素レベルのリップシンクを1回のパスで一緒に生成します。キャラクターのアイデンティティ、ライティング、色は、すべてのカット間で一貫して保たれます。

今すぐWan 2.6を試す

Elser AIでのWan 2.6の使い方

ステップ1:登録してWan 2.6を選ぶ

無料のElser AIアカウントを作成します。動画モデルセレクターでWan 2.6を選びます。

ステップ2:プロンプトを入力して設定

マルチショット構文で構造化されたプロンプトを書きます:「全体の説明。ショット1 [0–4s] 内容。ショット2 [4–8s] 内容。ショット3 [8–12s] 内容。」再生時間(5、10、15秒)、解像度(720pまたは1080p)、アスペクト比(16:9、9:16、1:1、4:3、3:4)を選びます。より豊かな物語の分割には、プロンプト拡張とマルチショットを有効にします。

ステップ3:生成・プレビュー・エクスポート

動画を生成し、プレビューして、同期音声トラック付きのMP4でエクスポート——ソーシャルメディア、広告、ショートドラマにすぐ使えます。

Aliyun Wan シリーズを探索

Wan 2.6が話題になっています

ネイティブ音声同期のおかげで、ポストプロダクションを何時間も節約できました。ナレーションを動画に手動で合わせる必要はもうありません。

— Sarah C.、動画編集者

ようやく、ドリーズームやラックフォーカスのような複雑なカメラの動きを理解するモデルが登場しました。

— David L.、AI研究者

ナレーションとBGM付きの15秒の商品動画を、2分足らずで生成できました。Wan 2.6はeコマースにとって革命的です。

— Jessica W.、デジタルマーケティングマネージャー

複数のショットにわたるキャラクターの一貫性が信じられないほどです。もう顔ドリフトはありません——同じ主人公でショートストーリーを実際に語れます。

— Michael T.、インディーアニメーター

Wan 2.6のデジタルヒューマンでピッチ動画を作りました。クライアントは本物の俳優だと思っていました。ネイティブのリップシンクが決定的な違いを生みました。

— Derek P.、エージェンシープロデューサー

よくある質問

Wan 2.6は、Alibabaの通義万相による最も先進的な動画生成モデルです。テキスト、画像、参照動画、音声から1080p、24fpsの動画を生成し、ネイティブな音声・映像同期と精密なリップシンクを備えています。主な機能には、参照から動画(キャラクターの外観と声を新しいシーンに挿入する)、シンプルなプロンプトからのマルチショットストーリーテリング、最大15秒のクリップが含まれます。

3つの主要な差別化要素があります。第一に、参照から動画(ロールプレイング):Wan 2.6は、参照動画1本だけで、生成されたシーン全体にわたってキャラクターの外観と声の両方を保持できる中国初のモデルです。第二に、インテリジェントなマルチショットストーリーテリング:モデルは単一のプロンプトを複数の一貫したショット——ワイド、ミディアム、クローズアップ——に分解し、滑らかなトランジションで、すべてのカット間でライティング、色、キャラクターのアイデンティティを維持します。第三に、ネイティブ音声付き15秒1080p出力:多くの競合の標準ティアより長く、対話、環境音、リップシンクが1回のパスで一緒に生成されます。

はい。Elser AIは新規ユーザーに試用クレジットを提供しています。有料プランにアップグレードすると、完全な商用利用権が得られます。

Wan 2.6は5秒、10秒、15秒、24fpsに対応します。解像度は720pと1080p。アスペクト比は16:9、9:16、1:1、4:3、3:4に対応——YouTubeのワイドスクリーン、TikTok/Reelsの縦型、Instagramの正方形、従来の放送フォーマットをカバーします。

はい。Wan 2.6は、1回の推論パスで同期した動画と音声——対話、環境音、効果音、BGM——を、音素レベルのリップシンクとともに生成します。

はい。Wan 2.6のI2Vは、静止画像を最大15秒の高忠実度な動画クリップにアニメーション化し、オプションの音声とテキストガイドによる精密なモーション制御を備えています。720pと1080pで利用可能です。

参照から動画(R2V)は、Wan 2.6の看板機能です。外観と声の両方を捉えたキャラクターの参照動画をアップロードし、テキストプロンプトを使って同じキャラクターを主役にした新しいシーンを生成します——映像と音声の両方が一貫します。R2Vは1〜3本の参照動画を受け付け、プロンプト内では@Video1、@Video2、@Video3の構文で参照します。人物、動物、物体に対応します。

構造化されたマルチショット構文を使います:全体の説明、続いてショットごとのタイミングと内容。例:「ショット1 [0–4s] 夕暮れの未来都市のワイドな風景ショット。ショット2 [4–8s] ネオンに照らされた街路を進む主人公を追うミディアムトラッキングショット。ショット3 [8–12s] 主人公の顔のクローズアップ、瞳に映るネオンの反射。」最良の物語分割には、プロンプト拡張とマルチショットを有効にします。

料金はプロバイダーによって異なります。Elser AIでは、シンプルな従量制プランを提供しています——現在の料金と無料トライアルクレジットはプラットフォームでご確認ください。

最もシンプルな体験を提供するElser AIを通じて——登録し、Wan 2.6を選び、プロンプトを入力して生成するだけで、APIキーやインフラ管理は不要です。Wan 2.6は、Alibaba CloudのBailian(Model Studio)プラットフォームやその他のサードパーティプロバイダーからも利用できます。

1080p、24fpsで、高いキャラクターの一貫性、滑らかなマルチショットのトランジション、ネイティブな音声・映像同期、シネマティックなライティングを実現します。Wan 2.6は、動きの品質と指示の遵守において、中国でトップクラスのモデルに常にランクインしています。リアルなポートレートはより自然になり、「AIっぽさ」が大幅に軽減され、構図はプロフェッショナルグレードの美学を備えています。

AI主導のショートドラマの未来はWan 2.6から始まる

Elser AIに登録してWan 2.6を解き放ちましょう——参照から動画のロールプレイング、インテリジェントなマルチショットストーリーテリング、ネイティブ音声同期。プロフェッショナルな映画のような動画を即座に生成——スキルもGPUも不要です。

Elser AIでWan 2.6を試す