Qwen Image Edit 2509: ComfyUI向けのマルチイメージ、プロンプト駆動の編集とブレンド
Qwen Image Edit 2509は、ComfyUIのためのマルチイメージ編集ワークフローで、2〜3枚の入力画像を単一のプロンプトの下で融合し、正確な編集とシームレスなブレンドを作成します。オブジェクトを合成したり、シーンを再スタイル化、要素を置換したり、参照を統合しながら直感的で予測可能なコントロールを維持したいクリエイター向けに設計されています。
このComfyUIグラフは、Qwenイメージモデルを編集対応のテキストエンコーダと組み合わせ、自然言語と1つ以上のビジュアル参照で結果をステアリングできます。Qwen Image Edit 2509は、スタイル転送、オブジェクト挿入、シーンリミックスを処理し、ソースが外観や品質で異なる場合でも一貫した結果を生成します。
Comfyui Qwen Image Edit 2509ワークフローの主要モデル
- Qwen Image Edit 2509 (Diffusion Model & GGUF, Q8_0)。編集動作を維持しながらVRAMを削減するために量子化された形式で読み込まれる主要な画像編集チェックポイントです。サンプリング中にテキストと参照画像を解釈する拡散バックボーンを提供します。
- Qwen Image VAE。Qwen Image専用に調整されたVAEで、ベースキャンバスを潜在空間にエンコードし、最終結果をピクセルにデコードします。アセットソース: Comfy-Org/Qwen-Image_ComfyUI。
- Qwen 2.5 VL 7Bテキストエンコーダ (FP8スケール)。ComfyUI用にパッケージ化されたビジョンランゲージテキストエンコーダで、プロンプトと参照画像を編集条件に変換します。アセットソース: Comfy-Org/Qwen-Image_ComfyUI。
- Qwen‑Image‑Lightning‑4steps‑V1.0 LoRA。モデルを高速で高インパクトの更新にバイアスするオプションのLoRAで、迅速な反復や低ステップ数に有用です。モデルページ: lightx2v/Qwen-Image-Lightning。
Comfyui Qwen Image Edit 2509ワークフローの使用方法
このワークフローは、入力から出力までの明確なパスをたどります: 2〜3枚の画像をロードし、プロンプトを書き、グラフがテキストと参照をエンコードし、サンプリングが潜在ベースで実行され、結果がデコードされて保存されます。
ステージ1 — ソースをロードしてサイズを調整
- Image 1には
LoadImage(#103)を、Image 2にはLoadImage(#109)を使用します。Image 2は編集を受けるベースキャンバスとして機能します。 - 各画像は
ImageScaleToTotalPixels(#93および#108)を通過し、両方の参照が一貫したピクセル予算を共有します。これにより、構成とスタイル転送が安定化します。 - 3つ目の参照が必要な場合は、エンコーディングノードの
image3入力に別のLoadImageを差し込みます。Qwen Image Edit 2509は、より豊かなガイダンスのために最大3枚の画像を受け入れます。
ステージ2 — プロンプトを書き、意図を設定
- ポジティブエンコーダ
TextEncodeQwenImageEditPlus(#104)は、プロンプトとImage 1およびImage 2を組み合わせ、望む結果を記述します。自然言語を使用して、マージ、置換、またはスタイルのキューを要求します。 - ネガティブエンコーダ
TextEncodeQwenImageEditPlus(#106)は、不要なディテールから離れるようにステアリングします。中立を保つために空にしておくか、アーティファクトや望まないスタイルを抑制するフレーズを追加します。 - 両方のエンコーダはQwenテキストエンコーダとVAEを使用するため、モデルは参照を指示の一部として「見る」ことができます。
ステージ3 — モデルを準備
UnetLoaderGGUF(#102)は、効率的な推論のためにQwen Image Edit 2509バックボーンをGGUF形式でロードします。LoraLoaderModelOnly(#89)は、Qwen‑Image‑Lightning LoRAを適用します。パンチの効いた編集のためにその影響を増やすか、より保守的な更新のためにそれを減らします。- モデルは編集の安定性に調整された構成でサンプリングに準備されます。
ステージ4 — ガイド付き生成
- ベースキャンバス(Image 2)は
VAEEncode(#88)によってエンコードされ、KSampler(#3)に開始潜在として提供されます。これにより、画像から画像へのランが行われ、純粋なテキストから画像への変換が行われます。 KSampler(#3)は、ポジティブおよびネガティブ条件と潜在キャンバスを融合させ、編集結果を生成します。再現性のためにシードをロックするか、代替を探索するためにそれを変更します。- ガイダンスとサンプリングの選択は、ソースの忠実性とプロンプトの遵守をバランスさせ、Qwen Image Edit 2509にその精度と柔軟性のブレンドを与えます。
ステージ5 — デコードして保存
VAEDecode(#8)は最終的な潜在を画像に変換し、SaveImage(#60)はそれを出力フォルダに書き込みます。ファイル名は実行を反映しており、バージョンを簡単に比較できます。
Comfyui Qwen Image Edit 2509ワークフローの主要ノード
TextEncodeQwenImageEditPlus (#104)
このノードは、Qwenエンコーダを介してプロンプトと最大3つの参照画像を組み合わせることにより、ポジティブ編集条件を作成します。それを使用して、何を表示するか、どのスタイルを採用するか、参照が結果にどの程度影響するかを指定します。明確な単文の目標から始め、必要に応じてスタイル記述子やカメラキューを追加します。エンコーダのアセットはComfy-Org/Qwen-Image_ComfyUIでパッケージされています。
TextEncodeQwenImageEditPlus (#106)
このノードは、不要な特性を防ぐためにネガティブ条件を形成します。アーティファクト、過度のスムージング、または不一致のスタイルをブロックする短いフレーズを追加します。ポジティブ意図と戦わないように最小限に抑えます。それはポジティブパスと同じQwenエンコーダとVAEスタックを使用します。
UnetLoaderGGUF (#102)
VRAMに優しい推論のために、Qwen Image Edit 2509チェックポイントをGGUF形式でロードします。量子化を高めるとメモリが節約されますが、細かいディテールにわずかに影響する可能性があります。余裕がある場合は、忠実度を最大化するためにより攻撃的でない量子化を試してください。実装参照: city96/ComfyUI-GGUF。
LoraLoaderModelOnly (#89)
ベースモデルの上にQwen‑Image‑Lightning LoRAを適用して収束を加速し、編集を強化します。このLoRAの効果を強調するためにstrength_modelを増やすか、微妙なガイダンスのためにそれを下げます。モデルページ: lightx2v/Qwen-Image-Lightning。コアノード参照: comfyanonymous/ComfyUI。
ImageScaleToTotalPixels (#93, #108)
高品質のリサンプリングを使用して、各入力を一貫した総ピクセル数にリサイズします。メガピクセルのターゲットを上げると、時間とメモリのコストでシャープな結果が得られます。どちらの参照も同様のスケールに保つことで、Qwen Image Edit 2509が要素をクリーンにブレンドするのに役立ちます。コアノード参照: comfyanonymous/ComfyUI。
KSampler (#3)
条件に基づいて潜在キャンバスを変換する拡散ステップを実行します。ステップとサンプラーを調整して速度と忠実度をバランスさせ、同じセットアップから複数の構成を探索するためにシードを変化させます。Image 2の構造を保持するタイトな編集のために、ステップ数を適度に保ち、プロンプトと参照をコントロールに頼ります。コアノード参照: comfyanonymous/ComfyUI。
オプションの追加機能
- Image 2をキャンバス、Image 1をドナーとして扱い、プロンプトでどの要素を転送し、どれを残すべきかを説明します。
- ハロー、テクスチャドリフト、または過度のスタイリゼーションを抑えるために簡潔なネガティブを使用します。長いネガティブリストは目標と衝突する可能性があります。
- 結果があまりにも保守的に見える場合は、LoRAの強度またはサンプリングステップをわずかに増やします。ベースからあまりにも離れている場合は、それらを減らします。
- 最終化時にメガピクセルのターゲットを上げ、気に入った正確な構成をアップスケールするために同じシードを再利用します。
- プロンプトを具体的に保つ: 主題、アクション、設定、スタイル。Qwen Image Edit 2509は、いくつかの強力な記述子を伴う明確な意図に最もよく応答します。
謝辞
このワークフローは、以下の作品とリソースを実装および構築しています。Qwen Image Edit 2509 Workflowの貢献とメンテナンスに対してRobbaWに心より感謝します。権威ある詳細については、以下にリンクされたオリジナルのドキュメントとリポジトリを参照してください。
リソース
- RobbaW/Qwen Image Edit 2509 Workflow
- Hugging Face: QuantStack/Qwen-Image-Edit-2509-GGUF
- ドキュメント / リリースノート: Qwen Image Edit 2509 Workflow @RobbaW from Reddit r/comfyui
注記: 参照されたモデル、データセット、およびコードの使用は、それぞれの作者とメンテナーによって提供されるライセンスと条件に従います。




