FLUX.2 [klein] 4B & 9B — ComfyUIでの高速・統合テキスト-画像変換とimage-to-image編集
このワークフローはFLUX.2 [klein] 4Bと9Bを単一のプロダクションレディなComfyUIグラフにパッケージし、高速な作成と精密な編集を実現します。インタラクティブな作業向けに設計されており:プロンプトを書いてゼロから生成したり、1つまたは2つのリファレンス画像をドロップしてスタイルやコンテンツを変換したり、低レイテンシでイテレーションできます。ベースと蒸留バリアントの両方が含まれており、最大の忠実度と速度のバランスを取ることができます。
ルック開発、製品ビジュアライゼーション、クリエイティブディレクションに取り組んでいる場合、FLUX.2 [klein] 4B & 9Bはクリーンなテキスト-画像変換、シングルリファレンス編集、マルチリファレンスコンポジティングを1つの一貫したインターフェースで提供します。サブグラフがモデルの配管をカプセル化するので、グラフがスケジューリング、ガイダンス、デコーディングを処理する間、プロンプトとリファレンスに集中できます。
ComfyUI FLUX.2 [klein] 4B & 9Bワークフローの主要モデル
- Black Forest Labs FLUX.2 klein 4B FP8。コンパクトで高速な生成と編集のための主要UNet。テキスト-画像変換や4Bの品質と速度のバランスが必要な編集に使用。black-forest-labs/FLUX.2-klein-base-4b-fp8
- Black Forest Labs FLUX.2 klein 4B FP8蒸留。テキスト-画像変換と編集中のさらに低いレイテンシに最適化された蒸留チェックポイント。black-forest-labs/FLUX.2-klein-4b-fp8
- Black Forest Labs FLUX.2 klein 9B FP8ベース。グローバルな一貫性と編集のロバスト性を向上させる大容量UNet。シーンが複雑な場合やアイデンティティ/ジオメトリを保持する必要がある場合に最適。black-forest-labs/FLUX.2-klein-base-9b-fp8
- Black Forest Labs FLUX.2 klein 9B FP8蒸留。編集とスタイライゼーションのための9Bの利点の大部分を維持しながら、ターンアラウンドを高速化する蒸留9B。black-forest-labs/FLUX.2-klein-9b-fp8
- Comfy VAE for FLUX.2。リファレンスのエンコードと出力のデコードに使用される共有VAE。Comfy-Org/flux2-dev
- プロンプト用Qwenテキストエンコーダー。モデルスケールに合わせた4Bルート用の小さいエンコーダーと9Bルート用のより大容量のエンコーダー。Comfy-Org/flux2-kleinおよびComfy-Org/flux2-klein-9B
ComfyUI FLUX.2 [klein] 4B & 9Bワークフローの使い方
ワークフローは独立して実行できる明確なグループに整理されています。各グループはサブグラフをラップしており、4Bまたは9B、ベースまたは蒸留のいずれを使用してもコアロジックが一貫しています。プロンプトが望む変更を駆動し、1つまたは2つのリファレンス画像がコンテンツ、スタイル、レイアウトの保持をガイドします。
Text to Image – 4B
- プロンプトからの高速なアイデア出しには
Text to Image (Flux.2 Klein 4B)(#75)を使用。サブグラフがテキストをエンコードし、マッチするレイテントキャンバスを作成し、FLUX.2スケジューラーでサンプリングしてからRGBにデコードします。リファレンスがまだない場合の初期ルックに最適。ダウンストリームのセーブノードで結果を保存。 - 速度を優先する場合は
Text to Image (Flux.2 Klein 4B Distilled)(#77)に切り替え。このパスはベースルートをミラーしますが、低レイテンシのために蒸留チェックポイントを使用。クイックプロンプト探索やバッチアイデア出しに適しています。
Image Edit – 4B Base
Image Edit (Flux.2 Klein 4B)(#81)は単一のリファレンス画像とプロンプトを取ります。内部的にリファレンスがVAEエンコードされ、コンディショニングに変換されるので、編集が構図とアイデンティティを尊重します。プロンプトは背景置換、リライティング、アクセサリースワップなど、望む変更を記述します。グラフがリファレンスに合わせてレイテントサイズを自動調整し、保存可能なコヒーレントな編集をデコードします。- 同じグループにマルチリファレンスの例が提供されています。一方の画像からカラー、ロゴ、テクスチャを転送しながら、もう一方のコンテンツを保持したい場合に2つのリファレンスを供給。サブグラフが制御可能なスタイルインジェクションのために両方のコンディショニングをブレンドします。
Image Edit – 4B Distilled
Image Edit (Flux.2 Klein 4B Distilled)(#84)は4Bベース編集パスをミラーしますが、レイテンシを削減するために蒸留4Bモデルを使用。プロンプトを微調整して複数のバリアントを比較するクイック「what-if」イテレーションに便利。- 追加の蒸留4B編集サブグラフ(#92、#93)はシングルリファレンスとマルチリファレンスのスタイライゼーションを示します。被写体のポーズとフレーミングの信頼性の高い保持で高速フィードバックが必要な場合に使用。
Image Edit – 9B Base
Image Edit (Flux.2 Klein 9B)(#100)はより大容量の編集ルート。同じエンコード-コンディション-サンプル-デコードパターンに従いますが、9BベースUNetとペアのテキストエンコーダーを活用して複雑なシーンでのグローバルな一貫性を向上。困難な構造編集や細かいアイデンティティ保持に推奨されるパス。- マルチリファレンス9Bベースバリアント
Image Edit (Flux.2 Klein 9B)(#101)では、リファレンス画像1からレイアウトを維持しながら、リファレンス画像2からブランディングやマテリアルを転送可能。製品のリカラー、ロゴ配置、スタイルの調和に使用。
Image Edit – 9B Distilled
Image Edit (Flux.2 Klein 9B Distilled)(#109)はより速い9B編集ループを提供し、インタラクティブなアートディレクションに最適。短いターンアラウンドで9Bの一貫性の多くを維持。- マルチリファレンス蒸留バリアント
Image Edit (Flux.2 Klein 9B Distilled)(#110)は、コンテンツとスタイルが別々のリファレンスから来るコンポジティングワークフローを可能にします。一貫したリカラーと制御されたスタイル転送に特に効果的。
結果の保存
- すべてのルートがパスごとにラベル付けされた
SaveImageノードで終了するため、複数のグループを実行しても出力が整理されます。
ComfyUI FLUX.2 [klein] 4B & 9Bワークフローの主要ノード
Text to Image (Flux.2 Klein 4B) (#75)
- 役割:コンパクトな4Bモデルでテキストのみから画像を生成。内部的にFLUX.2スケジューラーと
CFGガイダンスを組み合わせ、共有VAEでデコード。 - 調整:探索にはプロンプトと
noise_seedを調整。キャンバスの寸法をアップスケールする場合は、ダウンストリームのリファインメントに9B編集ルートへの切り替えを検討。
Image Edit (Flux.2 Klein 4B) (#81)
- 役割:レイアウトとアイデンティティを保持しながらプロンプト駆動の変更を適用するシングルリファレンス編集。リファレンスをレイテントコンディショニングにエンコードし、入力にレイテントサイズを自動的にマッチ。
- 調整:何が変わり何が同じでなければならないかを指定する簡潔で目標指向のプロンプトを使用。積極的なスタイル変更には、不要な領域やアーティファクトを保護するネガティブプロンプトを追加。
Image Edit (Flux.2 Klein 4B Distilled) (#84)
- 役割:高速イテレーションのための4B編集ルートの高速バージョン。ベースまたは9Bパスで最終化する前のプロンプトのワーディングテストや最適な方向性の選択に適しています。
- 調整:小さなプロンプト編集のA/Bテスト時にプロンプト効果を確率性から分離するために
noise_seedをロック。
Image Edit (Flux.2 Klein 9B) (#100)
- 役割:グローバルな一貫性と困難な変換を改善する大容量編集パス。カメラアングルの変更、大きな背景スワップ、ブランド統合に推奨。
- 調整:2つのリファレンスを混合する場合、両方のフレーミングとスケールが良好であることを確認。プロンプトでimage1とimage2の関係を説明、例えば「image 2のロゴをimage 1のオブジェクトに適用」。
Image Edit (Flux.2 Klein 9B Distilled) (#109)
- 役割:低レイテンシのインタラクティブ9B編集。アートディレクションセッション中に頻繁な更新が必要な場合に品質と速度のバランス。
- 調整:結果がリファレンスから逸脱しすぎる場合、「ポーズ、フレーミング、ライティングを変更しない」などの言語でプロンプトの制約を強化し、同じ
noise_seedで再実行。
オプションの追加機能
- 4B vs 9Bの選択:速度とコンセプティングには4Bを、シーンが複雑な場合や重い編集でもアイデンティティとジオメトリを維持する必要がある場合は9Bに移行。
- ベース vs 蒸留:最終品質パスにはベースを、高速イテレーションには蒸留を使用。蒸留でラフ作業を行い、同じプロンプトをベースで再実行可能。
- シングル vs マルチリファレンス:シングルは背景、ライティング、小さなディテールを変更しながら元の被写体を保持するのに最適。マルチリファレンスは2番目の画像からカラー、ロゴ、テクスチャを転送するため。
- プロンプトを具体的に:何が変わり何が変わらないかを明確に記述。これによりFLUX.2 [klein] 4B & 9Bでの編集の決定性が向上。
- バリエーションの制御:プロンプトをリンゴ対リンゴで比較するために
noise_seedを固定、またはランダム化してより幅広いルックを探索。 - アセットに関する注意:Hugging Face上の一部のモデルファイルは、ダウンロード前にリポジトリページでライセンス契約に同意する必要があります。上記リンクのBlack Forest Labs FLUX.2 kleinページを参照。
謝辞
このワークフローは以下の作品とリソースを実装・構築しています。FLUX.2 [klein] 4B & 9BのBlack Forest Labsの貢献とメンテナンスに感謝いたします。正式な詳細については、以下にリンクされた元のドキュメントとリポジトリを参照してください。
リソース
- Black Forest Labs/FLUX.2 [klein] 4B & 9B
- GitHub: black-forest-labs/flux2
- Hugging Face: black-forest-labs/FLUX.2-klein-4B • black-forest-labs/FLUX.2-klein-9B
- ドキュメント/リリースノート:[FLUX.2 [klein] 4B & 9B — Fast local image editing and generation](https://blog.comfy.org/p/flux2-klein-4b-fast-local-image-editing)
注意:参照されたモデル、データセット、コードの使用は、それぞれの著者およびメンテナーが提供する各ライセンスと利用規約に従います。




