Wan2.2 Fun Camera は、単一の静止画像を滑らかなパン、ズーム、回転で生き生きとしたビデオに変えます。Wan 2.2 Funファミリーを基に構築されたこのComfyUIワークフローは、手動のキーフレームや編集なしで深みとストーリー性を加えるカメラの動きに焦点を当てています。クイックなソーシャルクリップ、ダイナミックなヒーローショット、または製品やキャラクターの静止画にパンチのある動きが必要な場合、Wan2.2 Fun Cameraはクリーンで繰り返し可能な結果を提供します。
グラフには2つのバリエーションがあり、タスクに最適なバランスを選択できます。ネイティブのfp8スケールドパスは、Wan2.2 Fun Cameraモデルからのモーションの豊かさを最大化し、LightX2V 4 Steps LoRAバリアントはダイナミクスに若干のトレードオフを持ちながら速度を優先します。両方のバリエーションは同じプロンプト、カメラプリセット、エクスポートステージを共有しており、Wan2.2 Fun Cameraを学びやすく、素早く反復可能にしています。
ワークフローには2つの並列分岐があります:「Wan2.2 Fun Camera fp8スケールド + LightX2V 4 Steps LoRA」と「Wan2.2 Fun Camera fp8スケールド」。生成する前に一方の分岐を有効にし、他方を無効にします。両方の分岐は同じ4つの操作ステップと、シャープなフレームを得るために高ノイズで始まり低ノイズで終わる2段階のデノイズスケジュールをたどります。
このグループでは、Wan 2.2 Fun Camera 高ノイズおよび低ノイズUNets、オプションのLightX2V LoRAペア、UMT5-XXLテキストエンコーダー、Wan 2.1 VAEを準備します。迅速なターンアラウンドが必要な場合はLoRA分岐を、モーションの豊かさが優先される場合はネイティブfp8分岐を選択します。ロードされると、モデルは常駐するため、Wan2.2 Fun Cameraでカメラの動きやプロンプトを迅速に繰り返すことができます。
「Upload start_image」グループにソースの静止画像を追加します。ワークフローは単一の画像を想定しており、視点をアニメーション化しながらコアコンテンツを保持します。Wan2.2 Fun Cameraで最良の結果を得るには、クリーンな被写体、適度なコントラスト、エッジに動きの余地を残した構図を使用してください。
被写体の意図と動きのフレーバーを説明する簡潔なポジティブプロンプトを入力し、アーティファクトを避けるためにネガティブプロンプトで微調整します。プロンプトは短く、アクション指向に保ちます。例えば「シネマティックな製品のヒーロー、穏やかなズームアウト」や「ポートレート、微妙な右パン」などです。Wan2.2 Fun Cameraは、シーンを過度に制約しないスタイルやモーションの記述にうまく反応します。
WanCameraEmbedding
グループでカメラプリセットとタイムラインを選択します。これにより、コアノードが従うカメラパス埋め込みと期間および解像度設定が構築されます。Wan2.2 Fun Cameraには、ズームアウト、パン、回転などの直感的なプリセットが含まれており、曲線を手動で調整することなく異なる動きをすばやくプレビューできます。
最初のサンプラーパスは、粗い構造を敷き、Wan2.2 Fun Cameraでのモーションダイナミクスを開始します。この段階で選択されたカメラパスがグローバルな動きとして現れ始めます。LoRA分岐では、LightX2V 4 Steps LoRAがこの段階を少ないステップで圧縮して速度を向上させます。ネイティブfp8分岐では、Wan2.2 Fun Cameraが洗練前にモーションの忠実性を優先します。
第2サンプラーパスは、詳細の回復、テクスチャ、時間的一貫性に焦点を当て、低ノイズUNetを使用します。確立されたカメラパスを尊重しながら、エッジや顔をクリーンアップします。LoRAが有効な場合、この段階も速度が上がり、微小動きのバリエーションに若干の影響があります。LoRAがない場合、Wan2.2 Fun Cameraは最終フレームからさらなる鮮明さを絞り出します。
VAEは潜在変数をフレームにデコードし、ビデオヘルパーノードがそれらをMP4に組み立てます。デフォルト設定は、迅速にプレビューをレンダリングするために、広く互換性のあるH.264ファイルをターゲットにし、控えめなフレームレートを設定します。プロンプトやカメラプリセットを調整して再生成することでインプレースで反復できます。Wan2.2 Fun Cameraは、バッチ実験のために予測可能なファイル名で出力を一貫して保ちます。
WanCameraEmbedding
(#87, #108)Wan2.2 Fun Cameraのためのモーションプランを定義します。カメラプリセットを選択し、全体のショットの解像度とクリップの長さを設定します。クロッピングやレターボックスが発生した場合は、ここで幅と高さを調整します。長いクリップはより多くの計算を必要とし、速度のためにLoRAパスを利用することが有益です。
WanCameraImageToVideo
(#80, #98)プロンプト、VAE、開始画像、およびカメラ埋め込みをモーション対応の潜在変数に融合させるコアドライバーです。動きが強すぎるまたは微妙すぎると感じる場合は、最初にサンプラーではなくカメラプリセットやプロンプトの動詞を見直します。
KSamplerAdvanced
(#71 and #78, #102 and #103)2段階のスケジュールを実行します:モーションを確立するための高ノイズサンプラー、その後洗練するための低ノイズサンプラー。より強い構造を求める場合は、最初のパスでいくつかのステップを追加し、より鮮明な詳細を求める場合は2番目のパスにステップを投資します。ガイダンスをバランスよく保ち、モーションが自然に保たれ、プロンプトに過度に適合しないようにします。
VHS_VideoCombine
(#116, #117)デコードされたフレームをクイックレビュー用に単一のビデオファイルにパッケージ化します。カメラの動きの感触に合わせてフレームレートを調整し、より高品質のエクスポートが必要な場合はCRFを調整します。Wan2.2 Fun Cameraのバリエーションを探索する際に、バージョンを整理するためにクリーンなファイル名プレフィックスを使用します。
LoraLoaderModelOnly
(#88, #90)LightX2V 4 Steps LoRAペアを有効にします。迅速な反復または低VRAMプレッシャーのためにこれらをオンにします。Wan2.2 Fun Cameraショットを最終化する際には、最大のモーションの豊かさを得るためにそれらを無効にします。
このワークフローは、以下の作品やリソースを実装し、基にしています。Alibaba PAIによるWan2.2-Fun A14B Camera Controlモデル、Comfy OrgによるComfyUI Wan2.2 Fun Camera Controlワークフローとドキュメント、aigc-appsによるVideoX-Funフレームワークの貢献とメンテナンスに感謝します。権威ある詳細については、以下のリンクされたオリジナルのドキュメントとリポジトリを参照してください。
注:参照されたモデル、データセット、コードの使用は、それぞれの著者およびメンテナーによって提供されるライセンスおよび条件に従います。
RunComfyは最高の ComfyUI プラットフォームです。次のものを提供しています: ComfyUIオンライン 環境とサービス、および ComfyUIワークフロー 魅力的なビジュアルが特徴です。 RunComfyはまた提供します AI Playground, アーティストが最新のAIツールを活用して素晴らしいアートを作成できるようにする。