テキスト入力から高品質な画像を生成できるWan 2.2。創造性を広げるクリエイター向けツール。
Fantasy Portrait: 表情豊かなポートレート動画生成 | 画像から動画へ
Fantasy Portrait は、1枚のポートレート画像と参照動画から、FantasyPortrait (Fantasy-AMAP) と WanVideo 2.1 を用いて、本人らしさを保ちながら表情豊かな映画風 MP4 アニメーションを生成します。
Fantasy Portrait の紹介
このリリースでは、Fantasy-AMAP の FantasyPortrait モデルを基盤とし、Wan 2.1 およびオプションの軽量 LoRA を組み合わせることで、静止画像を映画のような Fantasy Portrait アニメーションへと変換できます。本システムは被写体の個性を保ちつつ、表情豊かな顔の動きを実現し、単一のポートレートから映画的な動画表現を求めるクリエイター向けに感情豊かな映像クリップを生成します。
Fantasy Portrait は、静止画像をダイナミックで本人らしさを損なわないアニメーションに変えるためのツールです。クリエイター、アーティスト、ストーリーテラーに最適で、1枚のポートレート写真と動画から自然な動きを持つ印象的な映像クリップを生成します。出力は一貫したフレーミングと洗練された映画的クオリティを備えた高精細な MP4 動画です。
Fantasy Portrait の主要モデル
FantasyPortrait (Fantasy-AMAP)
FantasyPortrait モデルは、被写体の特徴を保持しながらも繊細な顔の動きを可能にする、アイデンティティおよび表情認識に基づいたコア埋め込みを提供します。これは Fantasy Portrait ワークフローの中心的な要素です。詳細は GitHub project および対応する arXiv 論文 から確認できます。
WanVideo 2.1 I2V (14B, 720p)
WanVideo 2.1 は動画生成のための拡散バックボーンとして機能し、ポートレートおよびプロンプトガイドから高解像度のアニメーションを生成します。画像とテキストの両方の条件を利用して動画をサンプリングし、統一感のある表現豊かな結果を生み出します。Kijai の Hugging Face モデルパック から量子化済みで Comfy 対応の重みを利用可能です。
Fantasy Portrait の使用方法
必要な入力
まず、Image および Video 入力を通じて画像と動画を提供してください。これらは Fantasy Portrait 生成の基礎となります。Width と Height を設定して出力サイズを定義し、Number of Frames でアニメーションの再生時間を制御します。これらの入力は、一貫したフレーミングとアニメーションの長さを確保するために不可欠です。
オプション入力とコントロール
出力の芸術性や感情表現を調整したい場合は、短い説明的なフレーズを含む Prompt を追加することでガイドできます。必要に応じて、Seed で生成ごとのランダム性を調整し、Shift で動きのタイミングに影響を与え、Steps を増減してサンプリング精度を微調整できます。これらのオプション設定により、被写体のアイデンティティを維持しながらスタイルのバリエーションを試すことができます。
出力
このワークフローでは、高品質な MP4 動画を生成します。デフォルトでは 16fps・yuv420p フォーマットで出力されます。入力したポートレートをもとに、埋め込みやプロンプトを組み合わせることで、映画的で表情豊かな動きを実現します。結果は洗練された Fantasy Portrait アニメーションクリップです。
ベストプラクティス
最適な結果を得るためには、明るく均一な照明条件下で撮影されたポートレート画像を使用してください。アップロードする動画は、想定する動きや雰囲気に沿った内容を選びましょう。Prompt は簡潔にし、被写体の特徴ではなく雰囲気や照明などに焦点を当てるのが理想的です。Steps の調整を控えめに行うことで映像をシャープにできます。また、Width、Height、Number of Frames が意図するフレーミングおよび再生時間に一致していることを常に確認してください。
Related Playgrounds
Dreamina 3.0がテキストを精密な映像に変換。手軽に映画のようなAI動画を創り出せます。
Kling 2.5 Turboでテキストから高品質な映像を素早く生成。創造力と表現力を引き出すAIビデオツール。
画像とテキストから自然な動画を生成、直感操作で柔軟に編集可能
静止画を数秒で映像化。Veo 3.1 Fastで手軽に高品質なAIビデオを制作。
テキストから高品質な映像を生成するWan 2.1。複雑な動きやリアルな表現で創造を形に。
RunComfyは最高の ComfyUI プラットフォームです。次のものを提供しています: ComfyUIオンライン 環境とサービス、および ComfyUIワークフロー 魅力的なビジュアルが特徴です。 RunComfyはまた提供します AI Models, アーティストが最新のAIツールを活用して素晴らしいアートを作成できるようにする。
