ComfyUI ファンタジーポートレートワークフロー | アイデンティティに富んだポートレートからのモーション

ファンタジーポートレート: ComfyUIでの表現豊かなポートレートアニメーション

このワークフローは、1枚の静止画像を高忠実度なファンタジーポートレートアニメーションに変換します。Fantasy-AMAPのFantasyPortraitモデルを表現強化型拡散トランスフォーマーと統合し、Wan Video 2.1の画像から動画へのパイプラインでラッピングしているため、最小限のセットアップでアイデンティティを保持し、感情豊かなトーキングショットを生成できます。映画的なファンタジーポートレートモーションを1枚の写真から作成したいクリエイター向けに設計されており、フレーミング、持続時間、スタイルを明確にコントロールできます。

パイプラインは完全に自動化されています: ポートレートを投入し、解像度とフレーム数を選択し、オプションでプロンプトとLoRAを追加し、MP4にレンダリングします。内部では、グラフが顔を検出し、画像とテキストのガイダンスをエンコードし、ファンタジーポートレートのアイデンティティエンベディングをWanのI2Vコンディショナーに融合し、動画をサンプリングし、フレームをデコードして最終クリップを保存します。

ComfyUIファンタジーポートレートワークフローの主要モデル

FantasyPortrait (Fantasy-AMAP)

コアアイデンティティおよび表現モジュール。被写体の特性を保持しつつ、微細な顔の動きを可能にする表現強化型のエンベディングを提供します。 GitHub | Paper (arXiv)

WanVideo 2.1 I2V (14B, 720p)

ポートレートおよびテキスト/画像条件付けからアニメーションをサンプリングするために使用されるビデオ拡散バックボーン。Kijaiのモデルパックを通じて量子化され、Comfy対応の重みが利用可能です。 Hugging Face: Kijai/WanVideo_comfy

UMT5-XXLエンコーダー

ビデオサンプラーでのプロンプトガイダンスに使用される高容量テキストエンコーダー。例の重み: umt5-xxl-enc-bf16.safetensors in Kijai/WanVideo_comfy

Wan 2.1 VAE

潜在変数のエンコード/デコード用に最適化されたビデオVAE。例の重み: Wan2_1_VAE_bf16.safetensors in Kijai/WanVideo_comfy

ComfyUIファンタジーポートレートワークフローの使い方

ワークフローは、入力から最終ビデオまで左から右に進行します。主に設定するのは、画像、寸法、および持続時間の3つです。その後、必要に応じて短いプロンプトやLoRAで微調整できます。

1) 画像入力とサイズ設定

LoadImageに1枚のポートレートをロードし、それが処理用にリサイズされます。2段階のリサイズにより、選択した幅および高さに合わせて画像が一致しつつ構図が維持されます。Width、Height、およびFramesのコントロールを使用して出力サイズ（デフォルトは720 × 720）とアニメーションの長さを定義します。これにより、パイプライン全体でファンタジーポートレートのフレーミングが一貫性を持ちます。

2) 顔検出とファンタジーポートレートエンベディング

FantasyPortraitModelLoaderがFantasyPortraitの重みをロードし、FantasyPortraitFaceDetectorが画像からアイデンティティおよび表現に敏感なポートレートエンベディングを抽出します。コアアイデアは、被写体が誰かを分離し、最終アニメーションがアイデンティティを保持しながら表現豊かな動きを可能にすることです。モデルを交換しない限り、ここでは何も調整する必要はありません。

3) 画像およびテキスト条件付け

画像ガイダンスのために、CLIPVisionLoaderとWanVideoClipVisionEncodeがポートレートから堅牢な視覚特徴を生成します。テキストガイダンスのために、WanVideoTextEncodeCachedがUMT5-XXLエンコーダーを使用して、肯定および否定のプロンプトをビデオ条件エンベディングに変換します。「自然なスタジオクローズアップ、穏やかな微笑み」などの短くシンプルなプロンプトが、クリーンなファンタジーポートレートの外観に十分な場合が多いです。

4) 持続時間制御によるI2Vエンコーディング

VHS_LoadVideoは便利なフレームカウンターとして使用されます。プレースホルダクリップをそのままにするか、好みの持続時間で参照をロードし、そのフレーム数がWanVideoImageToVideoEncodeにフィードされ、開始画像と画像/テキストエンベディングをI2V条件に変換します。固定長を好む場合は、Framesを直接設定し、参照ローダーを無視してください。

5) ファンタジーポートレート融合

WanVideoAddFantasyPortraitがステップ2からのポートレートエンベディングとI2V条件を統合します。これが最終的なファンタジーポートレートアニメーションに強いアイデンティティ保持と表現豊かなディテールを与えます。画像がロードされると、追加の入力は必要ありません。

6) LoRAおよびモデル設定

WanVideoModelLoaderがWan 2.1をロードし、WanVideoLoraSelectがKijaiパックからの軽量I2V LoRAをオプションで適用し、動きや美学をバイアスすることができます。アイデンティティを維持しながら、少しスタイリッシュなファンタジーポートレートを求める場合、ここで実験するのが良いです。

7) ビデオサンプリングとデコード

WanVideoSamplerが融合された条件を使用して潜在フレームを生成します。プロンプトをシンプルに保ち、詳細が必要な場合はステップを適度に増やし、長い否定で過度に制約しないようにします。WanVideoDecodeが潜在変数を画像に変換し、ワークフローはプレビューを連結し、VHS_VideoCombineがMP4（デフォルト16 fps、yuv420p）を書き込みます。出力ファイル名のプレフィックスは便利に設定されています。

ComfyUIファンタジーポートレートワークフローの主要ノード

`FantasyPortraitModelLoader` (#138)

FantasyPortraitの重みをロードします。新しいFantasy-AMAPリリースをテストする場合はここで交換してください。チューニングは必要ありませんが、WanモデルとVAEの精度を一致させてください。

`FantasyPortraitFaceDetector` (#142)

リサイズされた画像からポートレートエンベディングを抽出します。良好な結果は、よく照らされた正面の写真で、遮蔽が最小限のものから得られます。動きが不自然に見える場合は、入力クロップを確認し、よりクリーンなソース画像を試してください。

`WanVideoImageToVideoEncode` (#151)

CLIP画像特徴、開始画像、および持続時間からWanのI2V条件を構築します。width、height、およびnum_framesを調整してレンダーフットプリントと長さを制御します。長いシーケンスには、より多くのVRAMと時間が必要です。

`WanVideoAddFantasyPortrait` (#150)

ファンタジーポートレートのアイデンティティ/表現をI2Vコンディショナーに融合します。これを使用して、フレーム間で被写体を同一に保ちながら、微細な表現の変化を可能にします。通常、パラメータの調整は必要ありません。

`WanVideoSampler` (#149)

ビデオ潜在変数を生成します。より鮮明なディテールを望む場合は、ステップを控えめに増加させます。動きがずれる場合は、プロンプトの複雑さを減らすか、別のLoRAを試してください。ガイダンスを一貫性のあるものに保ち、冗長にしないでください。

`WanVideoTextEncodeCached` (#155)

UMT5-XXLを使用して肯定/否定のプロンプトをエンコードします。短く、説明的なフレーズを使用してください。過度に強い否定プロンプト（例えば、「悪い品質」の多用なスタック）は表現を抑制する可能性があります。

ヒント

クイックな反復のために、まず720 × 720の正方形と4〜6秒を使用し、必要に応じて拡大してください。
クリーンで正面から光が当たったポートレートを使用し、目が見えるようにしてください。重い遮蔽、サングラス、極端な角度は避けてください。
ファンタジーポートレートのプロンプトは簡潔に保ち、照明やムードを説明し、アイデンティティではなくしてください。
アイデンティティを失わずに異なる動きの感触を求める場合、Kijaiパックからの穏やかなLoRAを試してください。

謝辞

このワークフローは、Fantasy-AMAPチームのファンタジーポートレートモデルを活用し、Expression-Augmented Diffusion TransformersをComfyUIに統合して、完全自動化された高品質ポートレートアニメーションパイプラインを実現しています。特に、画像から動画へのフレームワークでポートレートアニメーションをシームレスに実行可能にするWan Video Wrapperノードを作成し統合したkijaiに感謝します。また、オープンな創造的ツールへの継続的な貢献をしているComfyUIコミュニティ全体に感謝します。

リンク:

ファンタジーポートレート | 表現豊かな写真アニメーション

ファンタジーポートレート: ComfyUIでの表現豊かなポートレートアニメーション

ComfyUIファンタジーポートレートワークフローの主要モデル

ComfyUIファンタジーポートレートワークフローの使い方

1) 画像入力とサイズ設定

2) 顔検出とファンタジーポートレートエンベディング

3) 画像およびテキスト条件付け

4) 持続時間制御によるI2Vエンコーディング

5) ファンタジーポートレート融合

6) LoRAおよびモデル設定

7) ビデオサンプリングとデコード

ComfyUIファンタジーポートレートワークフローの主要ノード

`FantasyPortraitModelLoader` (#138)

`FantasyPortraitFaceDetector` (#142)

`WanVideoImageToVideoEncode` (#151)

`WanVideoAddFantasyPortrait` (#150)

`WanVideoSampler` (#149)

`WanVideoTextEncodeCached` (#155)

ヒント

謝辞

Want More ComfyUI Workflows?

LivePortrait | ポートレートのアニメーション | Img2Vid

LivePortrait | ポートレートをアニメーション化 | Vid2Vid

EchoMimic | オーディオ駆動のポートレートアニメーション

Sonic | リップシンクポートレートアニメーション

Nvidia Cosmos | テキスト & 画像から動画の作成

Wan 2.2 VACE | ポーズ制御ビデオジェネレーター

Put It Here Kontext | オブジェクト置換

Flux Krea Dev | 自然なテキストから画像へ

ファンタジーポートレート | 表現豊かな写真アニメーション

ファンタジーポートレート: ComfyUIでの表現豊かなポートレートアニメーション

ComfyUIファンタジーポートレートワークフローの主要モデル

ComfyUIファンタジーポートレートワークフローの使い方

1) 画像入力とサイズ設定

2) 顔検出とファンタジーポートレートエンベディング

3) 画像およびテキスト条件付け

4) 持続時間制御によるI2Vエンコーディング

5) ファンタジーポートレート融合

6) LoRAおよびモデル設定

7) ビデオサンプリングとデコード

ComfyUIファンタジーポートレートワークフローの主要ノード

FantasyPortraitModelLoader (#138)

FantasyPortraitFaceDetector (#142)

WanVideoImageToVideoEncode (#151)

WanVideoAddFantasyPortrait (#150)

WanVideoSampler (#149)

WanVideoTextEncodeCached (#155)

ヒント

謝辞

Want More ComfyUI Workflows?

LivePortrait | ポートレートのアニメーション | Img2Vid

LivePortrait | ポートレートをアニメーション化 | Vid2Vid

EchoMimic | オーディオ駆動のポートレートアニメーション

Sonic | リップシンクポートレートアニメーション

Nvidia Cosmos | テキスト & 画像から動画の作成

Wan 2.2 VACE | ポーズ制御ビデオジェネレーター

Put It Here Kontext | オブジェクト置換

Flux Krea Dev | 自然なテキストから画像へ

`FantasyPortraitModelLoader` (#138)

`FantasyPortraitFaceDetector` (#142)

`WanVideoImageToVideoEncode` (#151)

`WanVideoAddFantasyPortrait` (#150)

`WanVideoSampler` (#149)

`WanVideoTextEncodeCached` (#155)