Wan 2.1 | 革命的なビデオ生成
Wan 2.1はビデオ作成のベンチマークで他の競合を超えます。1.3Bモデルはわずか8.19GBのVRAMしか必要とせず、標準的なハードウェアで4分で480Pビデオを生成するText-to-VideoとImage-to-Videoの両方のワークフローをサポートします。Wan 2.1の14BモデルはRunComfyのクラウドを通じて720Pの高品質を提供します。ビデオ内で中国語と英語の両方のテキストを生成する最初のモデルとして、Wan 2.1は創造的なオプションを拡大し、Wan-VAEバックエンドは時間的な一貫性を持って1080Pビデオ処理を効率的に行います。ComfyUI Wan 2.1 ワークフロー
ComfyUI Wan 2.1 例
ComfyUI Wan 2.1 説明
ComfyUI Wan 2.1 ワークフローの説明
1. Wan 2.1とは?
ComfyUI Wan 2.1 ワークフローは、最新のWan 2.1モデルを活用して、テキストプロンプトやベース画像から高品質のビデオを生成する最先端のビデオ生成パイプラインです。Wan 2.1はText-to-Video (T2V) とImage-to-Video (I2V) の生成をサポートし、自然な動きとプロフェッショナルな品質の5秒ビデオを生成します。Wan 2.1はAIビデオ生成の新たなベンチマークを設定し、オープンソースや商用の代替案を上回ります。Wan 2.1の14Bモデルはさらに限界を押し広げ、720Pまでの優れた結果を提供します。
2. Wan 2.1の利点と能力
- 高品質な出力: 現実的な動きと高忠実度のテクスチャで480Pから720Pのビデオを生成します。
- ハードウェアのアクセス性: 軽量なWan 2.1 1.3Bモデルは8.19GBのVRAMしか必要とせず、ほとんどの現代のGPUと互換性があります(ここでRunComfyが提供しています!)。
- 多用途な生成: Wan 2.1はText-to-Video (T2V) とImage-to-Video (I2V) の両方のワークフローをサポートします。
- 多言語サポート: Wan 2.1はビデオ内で中国語と英語の両方のテキストを生成できる最初のビデオモデルです。
- VAEの効率性: Wan-VAEバックエンドは時間的な一貫性を保ちながら1080Pビデオを効率的に処理します。
- 高速処理: Wan 2.1 1.3Bモデルは品質を維持しながら迅速な結果を提供します。
3. Wan 2.1の使用方法
3.1 Wan 2.1生成方法
プライマリWan 2.1生成方法(デフォルトでは無効): Text-to-Video
- 入力: テキストプロンプト
- 最適: テキスト記述を使用してゼロからビデオを作成する
- 特徴:
- Wan 2.1 1.3Bモデルを使用して迅速な生成
- 480P解像度で33フレーム(5秒)のビデオを作成
- 短いクリップでのスムーズな動きに最適化
高度なWan 2.1方法(デフォルトで有効): Image-to-Video with Text Prompt
- 入力: ベース画像 + テキストプロンプト
- 最適: 静止画像をアニメーション化し、プロンプトで動きを誘導
- 特徴:
- 入力画像の視覚要素を保持
- 動きの方向をテキストで制御可能
- 高い忠実度のためにWan 2.1 14Bモデルを使用
- 512x512解像度で33フレームのビデオを作成
ワークフローの例:
- CLIPTextEncode (Positive Prompt / Negative Prompt): シーンの説明を入力(例: "a fox moving quickly in a beautiful winter landscape with trees and mountains during daytime, tracking camera")。
- 画像の読み込み: ベース画像をアップロード。
- さらなる調整(オプション):
- KSampler:
steps
(デフォルト: 30)を調整して品質と速度のバランスを取ります。 - ModelSamplingSD3:
scale
値(デフォルト: 8)を変更してプロンプトの遵守を調整。
- KSampler:
- Queue Prompt をクリックして生成を開始。
- SaveAnimatedWEBP で出力プレビューを見つけます(ComfyUI > Outputフォルダにも保存されます)。
3.2 Wan 2.1のパラメータリファレンス
- KSampler:
steps
: 20-30(高い値は品質を向上させますが、時間がかかります)cfg
: 6.0(プロンプトの遵守強度を制御)scheduler
: "simple"(ノイズスケジューリングアプローチを決定)sampler_name
: "uni_pc"(Wan 2.1に推奨されるサンプラー)
- WanImageToVideo:
width/height
: 512(出力解像度)length
: 33(ビデオのフレーム数)batch_size
: 1(実行ごとのビデオ数)
- ModelSamplingSD3:
scale
: 8(ガイダンスの遵守を制御)
- EmptyHunyuanLatentVideo:
width/height
: 832/480(T2V出力解像度)length
: 33(ビデオのフレーム数)batch_size
: 1(実行ごとのビデオ数)
3.3 Wan 2.1を使用した高度な最適化
- メモリ最適化:
- Wan 2.1 1.3Bモデルを使用して、VRAM要件を低くして迅速な生成を行います。
- 解像度を下げる(例: 512x320)ことで処理を迅速化。
- フレーム数を減らして短く迅速なレンダリングを実現。
- 品質最適化:
- Wan 2.1 14Bモデルを使用して高品質な出力を実現。
- KSamplerステップを30-40に増やしてより洗練された結果を得る。
- 高品質のベース画像を使用してImage-to-Videoを利用して最高の忠実度を実現。
詳細情報
Wan 2.1の詳細については、をご覧ください。
クレジット
Wan 2.1モデルはWanチームによって開発され、ComfyUIの統合は元の開発者によって作成されました。AIによるビデオ生成の進化を推進したこれらの革新者に全てのクレジットが与えられます。