LongCat Image Edit Turbo: ComfyUIでの高速プロンプトガイド画像編集#
LongCat Image Edit Turboは、主題と構図を保ちながら迅速にプロンプトガイド編集を行うために特別に設計されたComfyUIワークフローです。LongCat Image Edit TurboモデルをQwen2.5-VLコンディショニングとAE VAEと組み合わせて、キャラクタースタイリング、マスクのような局所的な変更、映画的な照明調整を迅速で反復可能なループで提供します。
クリエイターやパワーユーザー向けに設計されたこのLongCat Image Edit Turboグラフは、任意のソース画像を受け入れ、ビジョンランゲージエンコーダーを通じて編集意図を解釈し、オリジナルのフレーミングを維持した高忠実度の結果を返します。RunComfy対応で、迅速なプレビューと制御された洗練に最適化されています。
Comfyui LongCat Image Edit Turboワークフローの主要モデル#
- LongCat Image Edit Turbo (bf16)。プロンプトに強く反応しながら、構図を保つ高速画像編集を可能にする拡散モデル。モデルファイル
- Qwen2.5-VL 7Bテキストエンコーダー (FP8スケール、ComfyUIパッケージ)。プロンプトと入力画像からのビジュアルコンテキストを理解し、豊かなコンディショニングを生成します。エンコーダーファイル
- AE VAE (ae.safetensors)。低損失で潜在から画像を再構築し、サンプリング後のLongCat Image Edit Turboが細部を保つのを助けます。VAEファイル
Comfyui LongCat Image Edit Turboワークフローの使い方#
ワークフローは、画像とプロンプトからデコードされた結果までの明確なパスをたどります。ステージは、編集を迅速かつ安定に保ついくつかの決定的なコンポーネントを中心に組織されています。
ソース画像の読み込みと準備#
LoadImage(#79)で画像をインポートします。グラフはFluxKontextImageScale(#64)を通じて標準化スケールのためにルーティングし、堅牢な編集を可能にします。- 画像は
GetImageSize(#72)とEmptyLatentImage(#61)を通じて作業キャンバスを設定し、LongCat Image Edit Turboが構図と主題の配置を維持するのを助けます。 - この準備により、その後の編集が賢明でマスクのような調整として機能し、全面的な再合成を回避します。
Qwenで編集意図をエンコード#
- ワークフローは
CLIPLoader(#19)を使用してQwen2.5-VLエンコーダーを読み込みます。 TextEncodeQwenImageEditPlus (Positive)(#53)で希望する変更を記述します。スタイル、照明、属性の手がかりを明確にし、LongCat Image Edit Turboに適用します。TextEncodeQwenImageEditPlus (Negative)(#54)を使用して、避けたい要素や保護したい要素をリストアップし、アイデンティティと不要な変更を保護します。- エンコーダーはあなたのテキストとソース画像を読み取り、オリジナルのシーンに変更を固定する編集認識コンディショニングを作成します。
ガイダンスとリファレンスミキシングの形成#
FluxGuidance(#21)とFluxGuidance(#22)は、ポジティブおよびネガティブな指示が結果にどれだけ強く影響するかを調整します。強調を高めると大胆な編集が進み、低くすると微妙で構図の安全な調整が優先されます。FluxKontextMultiReferenceLatentMethod(#51)とFluxKontextMultiReferenceLatentMethod(#52)は、複数のリファレンスを追加する場合にどのように混合されるかを制御します。デフォルトでは、「DO NOT USE (LEAVE BYPASSED)」とラベル付けされたヘルパーサブグラフが非アクティブのままです。スタイルや属性のリファレンスを追加したい場合は、独自の画像ローダーで置き換えてください。
サンプラーを実行#
- LongCat Image Edit Turbo UNetは
UNETLoader(#18)によってロードされ、CFGNorm(#23)で安定したガイダンスのために正規化されます。 KSampler(#27)は、実際の拡散ステップを実行し、あなたの意図とコンテキストを新しい潜在に変換します。プレビューのために迅速な反復を開始し、最終的な品質のためにプロンプトやガイダンスの強度を必要に応じて洗練します。- 各パスで単一の明確な目標に編集を集中させることで、最も予測可能な結果を得ることができます。
デコードとエクスポート#
- AE VAEは
VAELoader(#20)を介して取り込まれ、VAEDecode(#25)によってサンプルされた潜在から高忠実度で画像を再構築します。 SaveImage(#9)は、出力ディレクトリに結果を書き込み、明確なプレフィックスで変化を追跡しやすくします。
Comfyui LongCat Image Edit Turboワークフローの主要ノード#
TextEncodeQwenImageEditPlus (Positive)(#53)。Qwen2.5-VLとソース画像を使用して、希望する変更を編集認識コンディショニングに変換します。プロンプトを主題と望む変更、例えば衣装、ムード、照明、または素材に集中させ、LongCat Image Edit Turboがシーンを逸脱しないようにします。TextEncodeQwenImageEditPlus (Negative)(#54)。避けたいものを指定することで、アイデンティティと構図を保護します。アーティファクトを減らしたり、シーンを一貫性を保ちながら不要な再スタイリングを防ぐために使用します。FluxGuidance(#21)。ポジティブな指示が編集をどれだけ積極的に推進するかを調整します。強調を増やすと強い再スタイリングや劇的な照明が可能になり、減らすとオリジナルの外観をより多く保持します。プロンプトの詳細さや提供するリファレンスの数とバランスを取ります。FluxKontextMultiReferenceLatentMethod(#51)。複数のリファレンスがコンディショニングにどのように混合されるかを決定します。スタイル転送のための強い融合や属性の微調整のための軽い影響など、目標に合った方法を選択します。CFGNorm(#23)。ガイダンスの動作を正規化し、異なる設定での変更が一貫していることを確認します。プロンプトを反復したりサンプラーを切り替えたときにLongCat Image Edit Turboが安定しているのを助けます。KSampler(#27)。生成の中心。迅速に反復し、再現性のためにシードを固定し、方向性が気に入ったら異なるサンプラーで実験します。FluxGuidanceと連携して編集の強度とオリジナルへの忠実度をトレードオフします。FluxKontextImageScale(#64)。入力画像を下流ノードのために準備しスケールします。このステップは、編集を通じてフレーミングと比率を安定に保つために重要です。
オプションの追加要素#
- さらにリファレンスを追加します。マルチイメージガイダンスが必要な場合は、バイパスされたヘルパーサブグラフを独自の
LoadImageノードで置き換え、Qwenエンコードノードの追加リファレンス入力に接続します。ポーズとレイアウトを保持しながらスタイルや衣装の転送に役立ちます。 - 迅速な反復のヒント。簡潔なプロンプトで始め、迅速なプレビューを実行し、その後、表現やガイダンスの強度を洗練します。お気に入りのルックを再現し、小さなバリエーションを分岐させるためにシードを使用します。
- 言葉による局所的な変更。明確にターゲットを指定し、「ジャケットだけを赤に変更」や「被写体にソフトリムライト」といったように、明示的なマスクを必要とせずにマスクのような編集を進めます。
- GGUFバリアント。CPUや非常に低いVRAMシナリオの場合、
UnetLoaderGGUF(#77)で量子化されたLongCat Image Edit Turboウェイトに切り替えることができます。利用可能な量子化はGGUFパックを参照してください。モデルバリアント
謝辞#
このワークフローは、以下の作品やリソースを実装し、それに基づいて構築されています。LongCat Image Edit Turboおよび関連コンポーネントの提供に感謝し、vantagewithaiのLongCat Image Edit Turbo GGUFモデル、およびCivitaiコミュニティのLongCat Image Edit Turboワークフローに貢献とメンテナンスを感謝します。詳細については、下記のオリジナルのドキュメントとリポジトリを参照してください。
リソース#
- Civitai/Civitaiワークフローソース
- ドキュメント / リリースノート: Civitaiモデルページ
- Comfy-Org/LongCat Image Edit Turbo bf16モデル
- Hugging Face: Comfy-Org/LongCat-Image
- vantagewithai/LongCat Image Edit Turbo GGUFモデル
- Hugging Face: vantagewithai/LongCat-Image-Edit-Turbo-GGUF
- Comfy-Org/Qwen 2.5 VLテキストエンコーダー
- Hugging Face: Comfy-Org/Qwen-Image_ComfyUI
- Comfy-Org/AE VAE
- Hugging Face: Comfy-Org/z_image_turbo
注: 参照されたモデル、データセット、およびコードの使用は、それぞれの作成者および管理者によって提供されるライセンスおよび条件に従う必要があります。









