ComfyUI用Qwen画像編集: プロンプトベースの写真編集、置換、再照明
このワークフローは、Qwenファミリーによって強化された迅速で制御可能な画像編集を提供します。単一のプロンプトで、インペインティング、背景置換、オブジェクトの挿入または削除、シネマティックな再照明を行いながら、ローカルの詳細を保持できます。Qwen画像編集は、複雑なノードグラフと格闘することなく、正確な変換を望むアーティストやクリエイターに最適です。
グラフはシンプルなステップに整理されています: モデルをロードし、画像をアップロードし、プロンプトを書き、サンプルを保存します。超高速の4ステップ編集用のオプションのLightning LoRAが付属しており、迅速に繰り返し、望む外観を固定できます。
Comfyui Qwen画像編集ワークフローの主要モデル
- Qwen画像編集拡散モデル 指示に基づいた編集のために使用されるコア画像編集UNet。ComfyUI用に
qwen_image_edit_fp8_e4m3fn.safetensorsとしてパッケージ化され、Comfy-Org/Qwen-Image-Edit_ComfyUIで提供されています。 - Qwen 2.5 VL 7Bテキストエンコーダー 編集指示を解釈し、モデルを条件付けるマルチモーダルテキストエンコーダー。
qwen_2.5_vl_7b_fp8_scaled.safetensorsとして提供され、Comfy-Org/Qwen-Image_ComfyUIで入手可能です。 - Qwen画像VAE Qwen画像モデル用に調整された潜在コーデックで、再構築品質を改善します。
qwen_image_vae.safetensorsとして配布され、Comfy-Org/Qwen-Image_ComfyUIで入手可能です。 - Qwen-Image-Lightning LoRA (オプション) 高品質編集を4ステップで可能にする速度最適化されたLoRA。
Qwen-Image-Lightning-4steps-V1.0.safetensorsとしてlightx2v/Qwen-Image-Lightningで利用可能です。
Comfyui Qwen画像編集ワークフローの使用方法
ステップ1 – モデルをロード
グラフはUNETLoader (#37)で編集UNetをロードし、CLIPLoader (#38)でテキストエンコーダーをロードし、VAELoader (#39)で潜在コーデックをロードします。迅速な反復を希望する場合は、オプションのLoraLoaderModelOnly (#89)を切り替えて、ベースモデルの上にLightning LoRAを適用します。ModelSamplingAuraFlow (#66)とCFGNorm (#75)は、Qwen画像編集モデルがプロンプトに従って詳細を過剰に焼き付けないようにサンプラーを準備します。
ステップ2 – 編集用の画像をアップロード
LoadImage (#78)を使用して、変更したい写真を選択します。画像はImageScaleToTotalPixels (#93)を通過し、品質に優しい範囲で解像度を維持し、Qwen画像編集が非常に大きな入力からアーティファクトを避けるのに役立ちます。VAEEncode (#88)はピクセルを潜在に変換し、構造を保存しながら効率的な編集を行います。
ステップ3 – プロンプト
TextEncodeQwenImageEdit (#76)に指示をポジティブな指示として書きます。例として、「背景を夕焼けの都市景観に置き換える」、「後ろの人物を削除する」、または「左から柔らかい金色のキーライトを当てる」などがあります。変更を避ける必要がある場合は、2番目のTextEncodeQwenImageEdit (#77)をネガティブなガイドとして使用します。例えば「被写体の顔を変更しない」、「ジャケットの色を保持する」など。両方のエンコーダーは、アップロードされた画像とVAEを参照し、コンディショニングがコンテンツと整合するようにします。
サンプリングと出力
KSampler (#3)は、パッチされたモデルとコンディショニングを使用して編集を実行します。Lightning LoRAが有効な場合は、非常に少ないステップで収束できます。それ以外の場合は、最大の忠実度を得るためにステップを増やします。編集された潜在はVAEDecode (#8)によってデコードされ、SaveImage (#60)を介してディスクに書き込まれます。
Comfyui Qwen画像編集ワークフローの主要ノード
TextEncodeQwenImageEdit (#76)
編集を駆動する主な指示をエンコードします。「置換」、「挿入」、「削除」、「再色」、「再照明」などの直接的な動詞を優先します。変更がローカルであるべき場合は、領域またはオブジェクトを明示的に指定します。プロンプトは簡潔に保ちます; スタイルタグの長いリストはほとんど必要ありません。
TextEncodeQwenImageEdit (#77)
ネガティブまたは保護的なガイダンスを提供します。モデルに何を避けるべきか、または重要な属性を保存するように指示します。良いパターン: 「肌のトーンを保持する」、「構図を変更しない」、「背景のテキストを無視する」。
LoraLoaderModelOnly (#89)
迅速な反復のためにQwen-Image-Lightning LoRAを適用します。即時の結果が必要な場合にオンにします。このLoRAがアクティブな場合は、サンプラーステップを大幅に減少させて、鮮明な編集を維持します。
ImageScaleToTotalPixels (#93)
品質を安定させるためにオーバーサイズの入力をターゲットメガピクセル予算にダウンスケールします。ソース画像が非常に大きい場合や重い圧縮を含む場合に使用します; しばしばエッジの滑らかさを向上させ、ハローを減少させます。
CFGNorm (#75)
分類器フリーガイダンスの動作を正規化し、モデルがアーティファクトを押し込まずにプロンプトに従うようにします。オーバーサチュレーションや「過剰編集」を見る場合は、強度を少し下げます; 編集が控えめに感じる場合は、少し上げます。
KSampler (#3)
拡散ループを実行します。fp8のために控えめなステップから始め、編集が不完全な場合のみ増やします。ガイダンスを中程度に保ちます; 非常に高い値は保存された領域を洗い流す可能性があります。Lightning LoRAがオンの場合は、その速度の利点をキャプチャするために非常に少ないステップを使用します。
オプションのエクストラ
- 編集を明確に説明します。Qwen画像編集は「空を曇りにして雨を追加する」や「ビルボードのテキストを白で'RunComfy'に変更する」などの短く実行可能な指示に最もよく応答します。
- 背景置換の場合、新しいシーンとムードの両方を指定します。例えば「背景を夕暮れのスカイラインに置き換え、オレンジ色の霞、かすかな都市の光を追加する」。
- オブジェクト作業の場合、アクションと配置を組み合わせます。「被写体の右手に赤い傘を挿入する」、または「左のゴミ箱を削除する」。
- 再照明の場合、方向、品質、強度を指定します。「カメラ右からの柔らかなキーライト、微妙なリムライト、暖かいトーン」。
- 結果が過剰処理されているように見える場合は、ガイダンスを下げるか、LoRAを無効にします; 編集が弱すぎる場合は、ステップを少し増やすか、指示を強化します。
謝辞
このワークフローは、以下の作品とリソースを実装し、構築しています。QwenLMのQwen-Image-Edit、QwenLMのQwen-Image、およびComfyOrgのComfyUIネイティブワークフロー例の貢献と保守に感謝します。詳細については、以下にリンクされた元のドキュメントおよびリポジトリを参照してください。
リソース
- Comfy/Qwen画像編集リファレンス
- GitHub: QwenLM/Qwen-Image
- Hugging Face: Qwen/Qwen-Image-Edit
- arXiv: Qwen-Image Technical Report
- ドキュメント / リリースノート: Qwen-Image-Edit ComfyUI Native Workflow Example
注意: 参照されたモデル、データセット、コードの使用は、著者および保守者によって提供されたそれぞれのライセンスと条件に従います。

