Krea 2 スタイル転送 ComfyUI ワークフロー: 単一画像スタイル、新しいシーン#
この Krea 2 スタイル転送 ComfyUI ワークフローは、1つの参照画像のビジュアル言語を完全に新しい構成に転送します。ポスター、アニメセル、水彩画、粘土、油絵、または写真の外観からテクスチャ、パレット、レンダリングの手がかりを保持しながら、主題とフレーミングを新鮮に保ちます。RunComfy 用に構築され、Krea 2 Turbo と Qwen3-VL テキストエンコーディング、Qwen Image VAE、および信頼性の高いワンショットスタイルキャプチャのための Untwisting RoPE コンディショニングパスを組み合わせています。
クリエイターは、シーンレイアウトをコピー&ペーストすることなく、同じプロンプトに対して多くのスタイルをテストする効率的な方法を得ます。ワークフローの RF 反転と Untwisting RoPE スタックは、スタイルに焦点を当て、構造には焦点を当てないため、生成された画像が同じ美的ファミリーに属しているように感じられる新しい構成を維持します。
ComfyUI Krea 2 スタイル転送ワークフローの主要モデル#
- Krea 2 Turbo。ターゲット画像を合成するために使用される拡散バックボーンです。高速で高品質の生成を提供し、スタイル注入が変更する機能スペースを提供します。 Model card
- Qwen3-VL 4B テキストエンコーダー。Krea 2 に適したコンディショニングベクトルにプロンプトをエンコードし、強力なスタイル転送の余地を残しながら忠実なコンテンツガイダンスを可能にします。Krea 2 Comfy パックと共に配布されます。 Weights repo
- Qwen Image VAE。参照スタイルを抽出する際や最終結果をデコードする際に重要な画像から潜在空間および潜在空間から画像への変換を処理します。 Weights repo
ComfyUI Krea 2 スタイル転送 ComfyUI ワークフローの使用方法#
大まかに言うと、スタイル参照を1つ読み込み、ターゲット解像度にスケーリングし、潜在空間にエンコードし、RF 反転を通じてスタイル信号を抽出し、その信号を Untwisting RoPE で Krea 2 にアタッチし、プロンプトによってガイドされた新しい潜在空間からサンプリングします。以下のセクションは、入力からプレビューまでの主要な道筋に従います。
スタイル参照を読み込む (LoadImage (#612))#
転送したいルックの画像を1枚読み込みます。材料、照明、色が明確なスタイルフォワードフレームを選択し、反転が学習するための強力な信号を持っているようにします。異なる主題に対するスタイルの適応をテストするために、プロンプトを繰り返し使用しながら同じ参照を再利用できます。
参照をターゲット解像度にスケーリングする (ImageScaleToTotalPixelsX (#265))#
スタイル統計がターゲットキャンバスに一致するように、Scale Image to Total Pixels Advanced ノードを使用して参照をリサイズします。これにより、RF 反転が安定し、VAE が参照をエンコードする際のワーピングを回避できます。ターゲットが正方形またはシネマティックである場合は、生成予定のアスペクト比がここに反映されるようにスケーリングします。
参照を潜在空間にエンコードする (VAEEncode (#333))#
スケーリングされた参照は、Qwen Image VAE によって潜在表現にエンコードされます。エンコードとデコードで一貫した VAE を維持することにより、色とテクスチャの一貫性が保たれます。ここでの高忠実度の再構築は、下流のスタイル転送の品質に大きな利益をもたらします。
プロンプトをエンコードする (CLIPTextEncode (#607) と CLIPTextEncode (#259))#
ターゲットプロンプトは、Qwen3-VL テキストエンコーダーでエンコードされます。同じプロンプトを参照ブランチに入力して反転ステップを実行することもでき、学習したスタイルとレンダリングしたいシーンとの整合性を向上させることがよくあります。希望する場合はプロンプトを分割できますが、両方のために同じターゲットプロンプトを使用するのが堅実なデフォルトです。
スタイル信号を抽出する (RFInversion (#603))#
RF 反転は、参照潜在空間とプロンプトコンディショニングを読み取り、コンパクトなスタイルコードと軽く適応された基本モデルを抽出します。色、材料、ストロークのような特徴を強調し、レイアウトとオブジェクトの識別を軽視します。これは、単一フレームを再利用可能なスタイル記述子に変えるステップです。
モデルにスタイルをアタッチする (UntwistingRoPE (#623) と UnofficialExtensions (#632))#
Untwisting RoPE は、スタイルコードを U-Net ブロックのバンド全体にわたって注意を調整することで Krea 2 Turbo に注入します。この方法は、転送がレイアウト移植ではなくルックオーバーレイのように作用するように、回転位置エンコーディングを慎重に再調整します。オプションの拡張ノードは、同じ実装で使用される追加の制御を公開します。参照: ComfyUi-Untwisting-RoPE。
新しいキャンバスを初期化する (EmptyLatentImage (#634))#
スケーリングされた参照から派生した幅と高さで空の潜在空間を作成します。ノイズから始めることで、参照レイアウトをコピーしない新しい構成を保証します。これはスタイル転送の精神を維持しながら、オリジナルのシーンを提供します。
画像をサンプリングする (KSampler (#635) と ConditioningZeroOut (#636))#
サンプリングは、スタイルがアタッチされたモデルとポジティブコンディショニングを使用して、ノイズから新しい画像を描画します。ネガティブコンディショニングはデフォルトでゼロ化され、スタイルが低レベルの特徴に対抗することなく支配できるようにします。SDE スタイルやその他のノイズを加えるサンプラー(er_sde や euler_ancestral など)は、軌道を通じて転送アーティファクトを減少させるのに効果的です。
デコードとプレビュー (VAEDecode (#262) と PreviewImage (#617))#
最終的な潜在空間は、Qwen Image VAE によって RGB にデコードされ、レビュー用に表示されます。両方向で同じ VAE が使用されるため、色とテクスチャは意図されたルックに忠実に保たれます。シードやプロンプトを変更して、異なる主題やフレーミングにわたってスタイルを探索することで保存し、繰り返します。
ComfyUI Krea 2 スタイル転送 ComfyUI ワークフローの主要ノード#
RFInversion (#603)#
役割: 参照画像のスタイルのコンパクトな表現を学習し、軽く適応されたモデルとスタイル潜在を返します。スタイルが控えめに感じられる場合は影響を増やし、スタイルが主題の識別を圧倒している場合は減らします。ComfyUI 用の Untwisting RoPE 実装によりサポートされており、反転プリセットと動作を文書化しています。参照: ComfyUi-Untwisting-RoPE。
UntwistingRoPE (#623)#
役割: 学習したスタイルを選択された U-Net ブロック全体にわたって Krea 2 に注入し、回転位置効果を補正して構造が新しいままになるようにします。スタイルが適用される範囲を広げたり狭めたりするためにブロック範囲を調整し、パレットや材料の転送を持ち上げたり抑えたりするために適応インスタンス正規化制御を使用します。エッジが不安定に感じられる場合は、小さなキーサブスペースアライメント値が細部を安定させることができます。参照: ComfyUi-Untwisting-RoPE。
ImageScaleToTotalPixelsX (#265)#
役割: エンコード前にスタイル参照をターゲットピクセル予算とアスペクト比にスケーリングします。くっきりとしたエッジのために Lanczos のようなリサンプリング方法を選択し、意図した生成サイズに一致する寸法を指定します。この整合性により、VAE のエイリアシングが減少し、スタイルコードの安定性が向上します。参照: ComfyUi-Scale-Image-to-Total-Pixels-Advanced。
KSampler (#635)#
役割: スタイルがアタッチされたモデルとプロンプトコンディショニングを使用して拡散軌跡を実行します。パスに沿ってノイズを加えるサンプラーは、残留レイアウトのヒントを洗い流し、よりクリーンなスタイル転送を提供する傾向があります; er_sde や euler_ancestral を試してください。中程度のステップとバランスの取れたガイダンススケールは、スタイルとコンテンツの両方を軌道に乗せながら、シードを通じて多様性を維持します。
オプションの追加機能#
- クリーンな照明、強力な材料、最小限の混雑を示すスタイルフォワードの参照から始めます。
- スタイルとコンテンツを同期させるために、反転ブランチとメインブランチの両方に同じターゲットプロンプトを使用します。
- 転送アーティファクトを減少させるために、
er_sdeやeuler_ancestralなどの SDE またはノイズを加えるサンプラーを好みます。 - スタイルが適切に感じられるようになったら、スケーリングされた参照のアスペクト比をターゲット出力に一致させ、その後他の比率を探索してください。
- 結果が参照レイアウトをコピーする場合は、スタイルの影響を下げるか、
UntwistingRoPEでスタイルを狭いブロック範囲に移動します。
この Krea 2 スタイル転送 ComfyUI ワークフローで使用されるリソース:
- Krea 2 Turbo モデルカード: Hugging Face
- Krea 2 Comfy ウェイトパック、Qwen3-VL テキストエンコーダーおよび Qwen Image VAE を含む: Hugging Face
- Untwisting RoPE ComfyUI エクステンション: GitHub
- Scale Image to Total Pixels Advanced: GitHub
謝辞#
このワークフローは、以下の作品とリソースを実装および構築しています。Krea-2-Turbo モデルの krea、Krea-2 ComfyUI ウェイトの Comfy-Org、ComfyUI カスタムノード Untwisting RoPE と Scale Image to Total Pixels Advanced の BigStationW、最初のリリースとワークフローソースの r/StableDiffusion コミュニティに感謝します。権威ある詳細については、以下にリンクされているオリジナルのドキュメントとリポジトリを参照してください。
リソース#
- Reddit/最初のリリースとワークフローソース
- ドキュメント / リリースノート: r/StableDiffusion post
- krea/Krea-2-Turbo
- Hugging Face: krea/Krea-2-Turbo
- Comfy-Org/Krea-2
- Hugging Face: Comfy-Org/Krea-2
- BigStationW/ComfyUi-Untwisting-RoPE
- BigStationW/ComfyUi-Scale-Image-to-Total-Pixels-Advanced
注: 参照されたモデル、データセット、およびコードの使用は、それぞれの著者および管理者によって提供されたライセンスおよび条件に従います。










