Wan 2.1 | 革新的なビデオ生成
2025年6月16日更新: ComfyUIバージョンがv0.3.39に更新され、安定性と互換性が向上しました。Wan 2.1はビデオ作成ベンチマークで競合他社を凌駕します。その1.3Bモデルは8.19GBのVRAMのみを必要とし、標準的なハードウェアで4分で480Pビデオを生成するText-to-VideoとImage-to-Videoワークフローの両方をサポートします。Wan 2.1 14Bモデルは、RunComfyのクラウドを介して720Pの高品質を提供します。ビデオ内で中国語と英語の両方のテキストを生成する最初のモデルとして、Wan 2.1は創造的なオプションを拡大し、そのWan-VAEバックエンドは時間的一貫性を保ちながら1080Pビデオ処理を効率的に処理します。ComfyUI Wan 2.1 ワークフロー
ComfyUI Wan 2.1 例
ComfyUI Wan 2.1 説明
ComfyUI Wan 2.1 ワークフロー説明
1. Wan 2.1とは?
ComfyUI Wan 2.1 ワークフローは、最新のWan 2.1モデルを活用してテキストプロンプトまたは/および基本画像から高品質のビデオを作成する最先端のビデオ生成パイプラインです。Wan 2.1はText-to-Video (T2V)およびImage-to-Video (I2V)生成をサポートし、自然な動きとプロフェッショナルレベルの品質で5秒のビデオを生成します。Wan 2.1はAIビデオ生成の新しいベンチマークを設定し、オープンソースおよび商業的な代替品を凌駕します。Wan 2.1 14Bモデルはさらに限界を押し広げ、720Pまでの優れた結果を提供します。
2. Wan 2.1の利点と機能
- 高品質な出力: リアルな動きと高忠実度のテクスチャで480Pから720Pのビデオを生成します。
- ハードウェアのアクセス性: 軽量のWan 2.1 1.3Bモデルは8.19GBのVRAMのみを必要とし、ほとんどの最新GPUと互換性があります(ここではRunComfyによって提供されます!)。
- 多用途な生成: Wan 2.1はText-to-Video (T2V)およびImage-to-Video (I2V)ワークフローの両方をサポートします。
- 多言語サポート: Wan 2.1は、ビデオ内で中国語と英語の両方のテキストを生成する最初のビデオモデルです。
- VAE効率: Wan-VAEバックエンドは、時間的一貫性を保ちながら1080Pビデオを効率的に処理します。
- 高速処理: Wan 2.1 1.3Bモデルは、品質を維持しながら迅速な結果を提供します。
3. Wan 2.1の使用方法
3.1 Wan 2.1生成方法
プライマリWan 2.1生成方法(デフォルトでは無効): Text-to-Video
- 入力: テキストプロンプト
- 最適な用途: テキスト記述を使用してスクラッチからビデオを作成する
- 特徴:
- Wan 2.1 1.3Bモデルを使用して高速生成
- 480P解像度で33フレーム(5秒)のビデオを作成
- 短いクリップでスムーズな動きに最適化
高度なWan 2.1方法(デフォルトで有効): 画像からテキストプロンプトによるビデオ
- 入力: ベース画像 + テキストプロンプト
- 最適な用途: 静止画像をアニメーション化し、プロンプトで動きを誘導
- 特徴:
- 入力画像の視覚要素を保持
- 動きの方向をテキストで制御可能
- Wan 2.1 14Bモデルを使用して高忠実度を実現
- 512x512解像度で33フレームのビデオを作成
ワークフローの例:
- CLIPTextEncode (Positive Prompt / Negative Prompt): シーンの説明を入力(例: "a fox moving quickly in a beautiful winter landscape with trees and mountains during daytime, tracking camera")。
- Load Image: ベース画像をアップロードします。
- さらなる調整(オプション):
- KSampler:
steps
(デフォルト: 30)を調整して品質と速度のバランスを取ります。 - ModelSamplingSD3:
scale
値(デフォルト: 8)を変更してプロンプトの遵守を強化します。
- KSampler:
- Queue Promptをクリックして生成を開始します。
- SaveAnimatedWEBPで出力プレビューを確認します(ComfyUI > Outputフォルダーにも保存されます)。
3.2 Wan 2.1のパラメータリファレンス
- KSampler:
steps
: 20-30(高い値は品質を向上させますが、時間がかかります)cfg
: 6.0(プロンプトの遵守強度を制御)scheduler
: "simple"(ノイズスケジューリングアプローチを決定)sampler_name
: "uni_pc"(Wan 2.1に推奨されるサンプラー)
- WanImageToVideo:
width/height
: 512(出力解像度)length
: 33(ビデオのフレーム数)batch_size
: 1(1回の実行でのビデオ数)
- ModelSamplingSD3:
scale
: 8(ガイダンスの遵守を制御)
- EmptyHunyuanLatentVideo:
width/height
: 832/480(T2V出力解像度)length
: 33(ビデオのフレーム数)batch_size
: 1(1回の実行でのビデオ数)
3.3 Wan 2.1による高度な最適化
- メモリ最適化:
- Wan 2.1 1.3Bモデルを使用して、より少ないVRAMで高速生成を実現します。
- 解像度を下げる(例: 512x320)ことで処理を迅速化します。
- フレーム数を減らして短く高速なレンダリングを実現します。
- 品質最適化:
- Wan 2.1 14Bモデルを使用して高品質な出力を実現します。
- KSamplerのステップを30-40に増やして、より洗練された結果を得ます。
- 高品質のベース画像を使用したImage-to-Videoで最高の忠実性を実現します。
詳細情報
Wan 2.1についての詳細は、をご覧ください。
クレジット
Wan 2.1モデルはWan Teamによって開発され、ComfyUIの統合はオリジナルの開発者によって作成されました。AIを活用したビデオ生成の進化に貢献したこれらの革新者に全てのクレジットが贈られます。