FireRed Image Edit 1.1 in ComfyUI | 高速指示ベース編集

ComfyUI FireRed Image Edit 1.1 Workflow

FireRed Image Edit 1.1 in ComfyUI | Fast Instruction-Based Editing

Want to run this workflow?

Fully operational workflows
No missing nodes or models
No manual setups required
Features stunning visuals

ComfyUI FireRed Image Edit 1.1 Examples

firered-image-edit-1-1-in-comfyui-fast-instruction-based-editing-1377-example_01.webp

firered-image-edit-1-1-in-comfyui-fast-instruction-based-editing-1377-example_02.webp

firered-image-edit-1-1-in-comfyui-fast-instruction-based-editing-1377-example_03.webp

firered-image-edit-1-1-in-comfyui-fast-instruction-based-editing-1377-example_04.webp

firered-image-edit-1-1-in-comfyui-fast-instruction-based-editing-1377-example_05.webp

firered-image-edit-1-1-in-comfyui-fast-instruction-based-editing-1377-example_06.webp

FireRed Image Edit 1.1: ComfyUIでの高速、指示ベースの画像編集#

FireRed Image Edit 1.1は、ターゲットを絞った指示ベースの画像編集のためのComfyUIワークフローです。ソース画像と自然言語の指示を与えると、構図とアイデンティティを維持しながら正確な変更を適用します。FireRed Image Edit 1.1拡散トランスフォーマーとQwen2.5-VL 7B視覚言語エンコーダーによって駆動され、編集は画像が示すものとプロンプトが意図するものに従います。

ワークフローには、推論ステップを劇的に削減して迅速な反復を可能にするLightning LoRAターボモードも含まれています。FireRed Image Edit 1.1を使用して、衣装変更、スタイル転送、シーン調整、または微細な詳細の改善をComfyUI内で直接行うことができます。

Comfyui FireRed Image Edit 1.1ワークフローの主要モデル#

FireRed Image Edit 1.1拡散トランスフォーマー。指示に従った画像編集のために特化したコアジェネレーターであり、プロンプトとソース画像の両方に条件付けしてレイアウトとアイデンティティを維持します。 Model card
FireRed Image Edit 1.0 Lightning LoRA (8-step)。軽量化された加速アダプタで、ターボモードを可能にし、クイックプレビューのためのサンプリングステップを削減し、強力な編集の順守を実現します。 Model card
Qwen2.5-VL 7B。ここでエンコーダーとして使用され、指示を画像内容と一緒に解釈し、編集制御のための堅牢な条件付けを生成します。 Model card
Qwen Image VAE。編集のためにソース画像を潜在空間にエンコードし、最終結果をピクセルにデコードするために使用される画像オートエンコーダー。FireRed 1.0アセットに含まれています。 Files

Comfyui FireRed Image Edit 1.1ワークフローの使用方法#

一目で、ワークフローはソース画像をロードし、潜在空間にエンコードし、Qwen2.5‑VL 7Bを使用して指示から条件を構築し、FireRed Image Edit 1.1をサンプラーを通じて実行して編集された画像を生成します。シングルターボトグルは、Lightning LoRAがアクティブであるかどうかを制御し、ステップ数とガイダンスの強度を速度または品質のために切り替えます。

モデル#

このグループは、FireRed Image Edit 1.1拡散トランスフォーマーをロードし、オプションでLightning LoRAを注入します。ターボが有効な場合、LoRAはベースモデルに適用され、サンプリングを加速します。モデルサンプリングノードは、FireRedトランスフォーマーに合わせたスケジュールを設定し、編集が安定するようにします。ガイダンスの正規化ステップは、プロンプト全体で一貫した条件付けのためにモデルを準備します。

プロンプト#

このグループは、FireRed Image Edit 1.1を駆動する指示を書く場所です。Qwen2.5‑VL 7Bエンコーダーは、ソース画像とテキストを一緒に読み込み、存在するものと変更すべきものを理解します。オプションで、スタイル、衣装、照明、または他の属性を誘導するために最大2つの参照画像を追加できます。ワークフローには、出力をクリーンでターゲットに合わせるためのネガティブまたはカウンターバランスチャネルとして機能するコンパニオンエンコーダーパスも含まれています。

イメージエンコード#

ソース画像は自動的にモデルフレンドリーな解像度にリサイズされ、VAE潜在空間にエンコードされます。この潜在は、画像から画像への編集の開始点となり、FireRed Image Edit 1.1が構図、カメラジオメトリ、およびアイデンティティを保持することを可能にします。エンコードされた潜在は、編集が適用されるサンプラーに直接流れます。

ステップ設定#

このグループは、ターボトグルに基づいてサンプラーステップ数を切り替えます。ターボがオンの場合、ステップは高速プレビューのために最小限に抑えられます。ターボがオフの場合、最大の忠実度のために高いステップ数が使用されます。ターボを使用して方向をすばやく探索し、最終的な最高品質のレンダリングのために無効にします。

CFG設定#

分類子フリーガイダンスの強度も同じターボトグルによって切り替えられます。低いガイダンス値は、少ないステップで編集を安定させるためにターボモードとペアになり、より高い値は、強力なプロンプト順守のためにフルモデルと一緒に使用されます。ワークフローはこれを自動的に配線するため、パラメータを細かく管理するのではなく、指示に集中できます。

サンプラー設定#

サンプラーは、パッチが当てられたFireRedモデル、ポジティブおよびネガティブの条件付け、エンコードされた潜在を組み合わせて編集された画像を生成します。結果を再現可能にするためにシードを設定したり、代替案を探るために変更したりできます。デコードされた画像は、出力フォルダに明確なプレフィックスで保存されるため、バッチ処理や反復の比較が容易です。

Comfyui FireRed Image Edit 1.1ワークフローの主要ノード#

`TextEncodeQwenImageEditPlus (Positive)` (#118)#

このノードは、自然言語の編集指示と1〜3枚の画像をFireRed Image Edit 1.1の条件付けに変換します。「ジャケットを赤いレザーに変更し、銀のジッパーを付ける」や「水彩スタイルに変換し、柔らかいエッジを持たせる」といった簡潔で指示的な表現を使用します。オプションのimage2とimage3は、スタイル、衣装、または照明の参照を固定できます。それを視覚的に目標と一致させてください。編集が強すぎる場合は、記述の強度を減らすか、明確な制約を追加します。

`Enable Lightning LoRA?` (#153)#

このトグルは、Lightning LoRAターボパスをアクティブにします。オンにすると、ワークフローはモデルをLoRA拡張版に切り替え、サンプリングを約40ステップから約8ステップに減少させ、ガイダンスを下げて高速で安定した結果を得られます。プロンプトや参照を迅速に反復するために使用し、最終的な最高品質の出力のためにオフにしてください。

`LoraLoaderModelOnly` (#151)#

このノードは、FireRed Image Edit 1.0 Lightning LoRAをFireRed Image Edit 1.1ベースモデルに注入します。LoRAの強度を調整する場合、より高い値は編集の強度を増すが、スタイルを超えたりアーティファクトを導入する可能性があることを覚えておいてください。アイデンティティが重要な編集の場合、強度を中程度に保ち、LoRAを過度に押し進めるのではなく、明確な指示や追加の参照画像に依存してください。

`KSampler` (#130)#

サンプラーは、編集の強度、ガイダンス、ステップが集まる場所です。ターボがオフの場合、stepsを増やすことで細かいディテールが改善され、小さなアーティファクトが減少します。ターボがオンの場合、ステップを少なくして速度を優先し、プロンプトの明確さや参照に依存します。cfgは慎重に調整してください：より高い値は指示を強調し、低い値はソース画像への忠実度を優先します。大きなシーンの変更には、cfgを上げ、ステップを増やすことを検討してください。微細な調整には、cfgを下げ、ステップを少なくしてアイデンティティを保持します。

オプションの追加#

編集を明確な指示として書き、画像全体の詳細な記述ではないようにします。「Tシャツをネイビーブレザーに置き換え、ポーズと照明を維持する」は、長いナラティブより優れます。
オプションのimage2とimage3の入力を使用して、スタイルや衣装の詳細を固定します。ソースに最適な転送のためにカメラアングルとフレーミングを一致させます。
アイデアを探索するためにターボをオンにして開始し、最終化するためにターボを無効にします。ステップ数が増え、ガイダンスが強化されるため、わずかな違いが期待できます。
最大のアイデンティティ維持のために、cfgを保守的に保ち、短く具体的な指示を使用し、可能であれば近似した参照画像を提供してください。
方向が気に入ったら固定シードを保存し、ランごとに指示や参照画像のみをA/Bテストできます。

リソース

FireRed Image Edit 1.1モデル: FireRedTeam/FireRed-Image-Edit-1.1-ComfyUI
Lightning LoRAとVAEアセット: FireRedTeam/FireRed-Image-Edit-1.0-ComfyUI
Qwen2.5‑VL 7Bエンコーダー: Qwen/Qwen2.5-VL-7B-Instruct
ComfyUIプロジェクト（ノード参照）: comfy-org/ComfyUI

謝辞#

このワークフローは、以下の作品とリソースを実装および構築しています。FireRedTeamによるFireRed Image Edit 1.1 Diffusion Model、FireRedTeamによるFireRed Image Edit 1.0 Lightning LoRA、Comfy.orgによるComfy.org Official Workflowに感謝の意を表します。権威ある詳細については、以下のリンクされたオリジナルのドキュメントとリポジトリを参照してください。

リソース#

FireRedTeam/FireRed Image Edit 1.1 Diffusion Model
- GitHub: FireRedTeam/FireRed-Image-Edit
- Hugging Face: FireRedTeam/FireRed-Image-Edit-1.1-ComfyUI
- arXiv: 2602.13344
FireRedTeam/FireRed Image Edit 1.0 Lightning LoRA
- GitHub: FireRedTeam/FireRed-Image-Edit
- Hugging Face: FireRedTeam/FireRed-Image-Edit-1.0-ComfyUI
- arXiv: 2602.13344
Comfy.org/Comfy.org Official Workflow
- GitHub: Comfy-Org/workflow_templates
- Docs / Release Notes: FireRed Image Edit 1.1: Image Edit

注意: 参照されたモデル、データセット、コードの使用は、それぞれの著者および管理者によって提供されるライセンスおよび条件に従います。

Want More ComfyUI Workflows?

ACE++ キャラクターの一貫性

単一の写真からポーズ、角度、スタイルにわたって一貫性のあるキャラクター画像を生成します。

HiDream E1.1 | AI 画像編集

HiDream E1.1 モデルを使用して自然言語で画像を編集

InfiniteYou | アイデンティティ保持フェイス生成

InfiniteYouを使用したFace CombineとZero-Shotワークフローによるデュアルモードのアイデンティティ保持生成。

DreamO | 統合マルチタスク画像カスタマイズフレームワーク

1〜3枚の参照からアイデンティティ、スタイル、トライオン、マルチコンディション画像生成を実行

ACE++ 顔交換｜画像編集

自然言語の指示で画像内の顔を交換し、スタイルとコンテキストを保持します。

Era3D | ComfyUI 3D Pack

マルチビュー画像から詳細なメッシュまで、3Dコンテンツを生成します。

LTX 2.3 話すと歌うリップシンクビデオメーカー

顔を完璧なリップシンクマジックで歌ったり話したりするビデオに変えます。

Wan 2.1 LoRA

LoRAモデルを使用してWan 2.1ビデオ生成を強化し、スタイルとカスタマイズを向上させます。

フォローする

サポート