このワークフローは、Qwenファミリーによって強化された迅速で制御可能な画像編集を提供します。単一のプロンプトで、インペインティング、背景置換、オブジェクトの挿入または削除、シネマティックな再照明を行いながら、ローカルの詳細を保持できます。Qwen画像編集は、複雑なノードグラフと格闘することなく、正確な変換を望むアーティストやクリエイターに最適です。
グラフはシンプルなステップに整理されています: モデルをロードし、画像をアップロードし、プロンプトを書き、サンプルを保存します。超高速の4ステップ編集用のオプションのLightning LoRAが付属しており、迅速に繰り返し、望む外観を固定できます。
qwen_image_edit_fp8_e4m3fn.safetensors
としてパッケージ化され、で提供されています。qwen_2.5_vl_7b_fp8_scaled.safetensors
として提供され、で入手可能です。qwen_image_vae.safetensors
として配布され、で入手可能です。Qwen-Image-Lightning-4steps-V1.0.safetensors
としてで利用可能です。グラフはUNETLoader
(#37)で編集UNetをロードし、CLIPLoader
(#38)でテキストエンコーダーをロードし、VAELoader
(#39)で潜在コーデックをロードします。迅速な反復を希望する場合は、オプションのLoraLoaderModelOnly
(#89)を切り替えて、ベースモデルの上にLightning LoRAを適用します。ModelSamplingAuraFlow
(#66)とCFGNorm
(#75)は、Qwen画像編集モデルがプロンプトに従って詳細を過剰に焼き付けないようにサンプラーを準備します。
LoadImage
(#78)を使用して、変更したい写真を選択します。画像はImageScaleToTotalPixels
(#93)を通過し、品質に優しい範囲で解像度を維持し、Qwen画像編集が非常に大きな入力からアーティファクトを避けるのに役立ちます。VAEEncode
(#88)はピクセルを潜在に変換し、構造を保存しながら効率的な編集を行います。
TextEncodeQwenImageEdit
(#76)に指示をポジティブな指示として書きます。例として、「背景を夕焼けの都市景観に置き換える」、「後ろの人物を削除する」、または「左から柔らかい金色のキーライトを当てる」などがあります。変更を避ける必要がある場合は、2番目のTextEncodeQwenImageEdit
(#77)をネガティブなガイドとして使用します。例えば「被写体の顔を変更しない」、「ジャケットの色を保持する」など。両方のエンコーダーは、アップロードされた画像とVAEを参照し、コンディショニングがコンテンツと整合するようにします。
KSampler
(#3)は、パッチされたモデルとコンディショニングを使用して編集を実行します。Lightning LoRAが有効な場合は、非常に少ないステップで収束できます。それ以外の場合は、最大の忠実度を得るためにステップを増やします。編集された潜在はVAEDecode
(#8)によってデコードされ、SaveImage
(#60)を介してディスクに書き込まれます。
TextEncodeQwenImageEdit
(#76)編集を駆動する主な指示をエンコードします。「置換」、「挿入」、「削除」、「再色」、「再照明」などの直接的な動詞を優先します。変更がローカルであるべき場合は、領域またはオブジェクトを明示的に指定します。プロンプトは簡潔に保ちます; スタイルタグの長いリストはほとんど必要ありません。
TextEncodeQwenImageEdit
(#77)ネガティブまたは保護的なガイダンスを提供します。モデルに何を避けるべきか、または重要な属性を保存するように指示します。良いパターン: 「肌のトーンを保持する」、「構図を変更しない」、「背景のテキストを無視する」。
LoraLoaderModelOnly
(#89)迅速な反復のためにQwen-Image-Lightning LoRAを適用します。即時の結果が必要な場合にオンにします。このLoRAがアクティブな場合は、サンプラーステップを大幅に減少させて、鮮明な編集を維持します。
ImageScaleToTotalPixels
(#93)品質を安定させるためにオーバーサイズの入力をターゲットメガピクセル予算にダウンスケールします。ソース画像が非常に大きい場合や重い圧縮を含む場合に使用します; しばしばエッジの滑らかさを向上させ、ハローを減少させます。
CFGNorm
(#75)分類器フリーガイダンスの動作を正規化し、モデルがアーティファクトを押し込まずにプロンプトに従うようにします。オーバーサチュレーションや「過剰編集」を見る場合は、強度を少し下げます; 編集が控えめに感じる場合は、少し上げます。
KSampler
(#3)拡散ループを実行します。fp8のために控えめなステップから始め、編集が不完全な場合のみ増やします。ガイダンスを中程度に保ちます; 非常に高い値は保存された領域を洗い流す可能性があります。Lightning LoRAがオンの場合は、その速度の利点をキャプチャするために非常に少ないステップを使用します。
このワークフローは、以下の作品とリソースを実装し、構築しています。QwenLMのQwen-Image-Edit、QwenLMのQwen-Image、およびComfyOrgのComfyUIネイティブワークフロー例の貢献と保守に感謝します。詳細については、以下にリンクされた元のドキュメントおよびリポジトリを参照してください。
注意: 参照されたモデル、データセット、コードの使用は、著者および保守者によって提供されたそれぞれのライセンスと条件に従います。
RunComfyは最高の ComfyUI プラットフォームです。次のものを提供しています: ComfyUIオンライン 環境とサービス、および ComfyUIワークフロー 魅力的なビジュアルが特徴です。 RunComfyはまた提供します AI Playground, アーティストが最新のAIツールを活用して素晴らしいアートを作成できるようにする。