Qwen Image Edit 2509は、ComfyUIのためのマルチイメージ編集ワークフローで、2〜3枚の入力画像を単一のプロンプトの下で融合し、正確な編集とシームレスなブレンドを作成します。オブジェクトを合成したり、シーンを再スタイル化、要素を置換したり、参照を統合しながら直感的で予測可能なコントロールを維持したいクリエイター向けに設計されています。
このComfyUIグラフは、Qwenイメージモデルを編集対応のテキストエンコーダと組み合わせ、自然言語と1つ以上のビジュアル参照で結果をステアリングできます。Qwen Image Edit 2509は、スタイル転送、オブジェクト挿入、シーンリミックスを処理し、ソースが外観や品質で異なる場合でも一貫した結果を生成します。
このワークフローは、入力から出力までの明確なパスをたどります: 2〜3枚の画像をロードし、プロンプトを書き、グラフがテキストと参照をエンコードし、サンプリングが潜在ベースで実行され、結果がデコードされて保存されます。
ステージ1 — ソースをロードしてサイズを調整
LoadImage
(#103)を、Image 2にはLoadImage
(#109)を使用します。Image 2は編集を受けるベースキャンバスとして機能します。ImageScaleToTotalPixels
(#93および#108)を通過し、両方の参照が一貫したピクセル予算を共有します。これにより、構成とスタイル転送が安定化します。image3
入力に別のLoadImage
を差し込みます。Qwen Image Edit 2509は、より豊かなガイダンスのために最大3枚の画像を受け入れます。ステージ2 — プロンプトを書き、意図を設定
TextEncodeQwenImageEditPlus
(#104)は、プロンプトとImage 1およびImage 2を組み合わせ、望む結果を記述します。自然言語を使用して、マージ、置換、またはスタイルのキューを要求します。TextEncodeQwenImageEditPlus
(#106)は、不要なディテールから離れるようにステアリングします。中立を保つために空にしておくか、アーティファクトや望まないスタイルを抑制するフレーズを追加します。ステージ3 — モデルを準備
UnetLoaderGGUF
(#102)は、効率的な推論のためにQwen Image Edit 2509バックボーンをGGUF形式でロードします。LoraLoaderModelOnly
(#89)は、Qwen‑Image‑Lightning LoRAを適用します。パンチの効いた編集のためにその影響を増やすか、より保守的な更新のためにそれを減らします。ステージ4 — ガイド付き生成
VAEEncode
(#88)によってエンコードされ、KSampler
(#3)に開始潜在として提供されます。これにより、画像から画像へのランが行われ、純粋なテキストから画像への変換が行われます。KSampler
(#3)は、ポジティブおよびネガティブ条件と潜在キャンバスを融合させ、編集結果を生成します。再現性のためにシードをロックするか、代替を探索するためにそれを変更します。ステージ5 — デコードして保存
VAEDecode
(#8)は最終的な潜在を画像に変換し、SaveImage
(#60)はそれを出力フォルダに書き込みます。ファイル名は実行を反映しており、バージョンを簡単に比較できます。TextEncodeQwenImageEditPlus
(#104)このノードは、Qwenエンコーダを介してプロンプトと最大3つの参照画像を組み合わせることにより、ポジティブ編集条件を作成します。それを使用して、何を表示するか、どのスタイルを採用するか、参照が結果にどの程度影響するかを指定します。明確な単文の目標から始め、必要に応じてスタイル記述子やカメラキューを追加します。エンコーダのアセットはComfy-Org/Qwen-Image_ComfyUIでパッケージされています。
TextEncodeQwenImageEditPlus
(#106)このノードは、不要な特性を防ぐためにネガティブ条件を形成します。アーティファクト、過度のスムージング、または不一致のスタイルをブロックする短いフレーズを追加します。ポジティブ意図と戦わないように最小限に抑えます。それはポジティブパスと同じQwenエンコーダとVAEスタックを使用します。
UnetLoaderGGUF
(#102)VRAMに優しい推論のために、Qwen Image Edit 2509チェックポイントをGGUF形式でロードします。量子化を高めるとメモリが節約されますが、細かいディテールにわずかに影響する可能性があります。余裕がある場合は、忠実度を最大化するためにより攻撃的でない量子化を試してください。実装参照: city96/ComfyUI-GGUF。
LoraLoaderModelOnly
(#89)ベースモデルの上にQwen‑Image‑Lightning LoRAを適用して収束を加速し、編集を強化します。このLoRAの効果を強調するためにstrength_model
を増やすか、微妙なガイダンスのためにそれを下げます。モデルページ: lightx2v/Qwen-Image-Lightning。コアノード参照: comfyanonymous/ComfyUI。
ImageScaleToTotalPixels
(#93, #108)高品質のリサンプリングを使用して、各入力を一貫した総ピクセル数にリサイズします。メガピクセルのターゲットを上げると、時間とメモリのコストでシャープな結果が得られます。どちらの参照も同様のスケールに保つことで、Qwen Image Edit 2509が要素をクリーンにブレンドするのに役立ちます。コアノード参照: comfyanonymous/ComfyUI。
KSampler
(#3)条件に基づいて潜在キャンバスを変換する拡散ステップを実行します。ステップとサンプラーを調整して速度と忠実度をバランスさせ、同じセットアップから複数の構成を探索するためにシードを変化させます。Image 2の構造を保持するタイトな編集のために、ステップ数を適度に保ち、プロンプトと参照をコントロールに頼ります。コアノード参照: comfyanonymous/ComfyUI。
このワークフローは、以下の作品とリソースを実装および構築しています。Qwen Image Edit 2509 Workflowの貢献とメンテナンスに対してRobbaWに心より感謝します。権威ある詳細については、以下にリンクされたオリジナルのドキュメントとリポジトリを参照してください。
注記: 参照されたモデル、データセット、およびコードの使用は、それぞれの作者とメンテナーによって提供されるライセンスと条件に従います。
RunComfyは最高の ComfyUI プラットフォームです。次のものを提供しています: ComfyUIオンライン 環境とサービス、および ComfyUIワークフロー 魅力的なビジュアルが特徴です。 RunComfyはまた提供します AI Playground, アーティストが最新のAIツールを活用して素晴らしいアートを作成できるようにする。