Krea 2 風格轉換 ComfyUI 工作流程:單圖像風格,全新場景#
這個 Krea 2 風格轉換 ComfyUI 工作流程將一個參考圖像的視覺語言轉移到完全新穎的構圖中。它在保持主題和構圖新鮮的同時,帶入了海報、動畫原畫、水彩、黏土、油畫或攝影風格的紋理、色調和渲染線索。它是為 RunComfy 構建的,結合了 Krea 2 Turbo 與 Qwen3-VL 文本編碼、Qwen Image VAE 和一個 Untwisting RoPE 調節路徑,以實現可靠的一次性風格捕捉。
創作者可以有效地測試許多風格對同一提示的效果,而不需複製場景佈局。工作流程的 RF 反轉加上 Untwisting RoPE 堆疊專注於風格,而非結構,因此生成的圖像在組成上保持新穎,同時感覺像屬於同一美學系列。
ComfyUI Krea 2 風格轉換工作流程中的關鍵模型#
- Krea 2 Turbo。用於合成目標圖像的擴散骨幹。提供快速、高質量的生成,並提供風格注入修改的特徵空間。 Model card
- Qwen3-VL 4B 文本編碼器。將您的提示編碼為適合 Krea 2 的調節向量,實現忠實的內容指導,同時留有強風格轉換的空間。隨 Krea 2 Comfy 包分發。 Weights repo
- Qwen Image VAE。以高保真度處理圖像到潛在和潛在到圖像的轉換,這在提取參考風格和解碼最終結果時至關重要。 Weights repo
如何使用 ComfyUI Krea 2 風格轉換 ComfyUI 工作流程#
在高層次上,您加載一個單一風格參考,將其縮放到目標分辨率,編碼為潛在,通過 RF 反轉提取一個風格信號,將該信號附加到 Krea 2 並使用 Untwisting RoPE,然後從新潛在中取樣,受到您的提示引導。以下部分遵循從輸入到預覽的主要路徑。
加載風格參考 (LoadImage (#612))#
加載一個您希望轉移其外觀的圖像。選擇一個風格明確的框架,具有清晰的材質、光線和顏色,以便反轉有強信號可學習。您可以重複使用相同的參考,同時迭代提示以測試風格如何適應不同主題。
將參考縮放到目標分辨率 (ImageScaleToTotalPixelsX (#265))#
參考圖像通過先進圖像縮放到總像素節點進行縮放,以便風格統計數據與目標畫布匹配。這有助於穩定 RF 反轉,並在 VAE 編碼參考時避免變形。如果您的目標是方形或電影比例,請相應縮放,以便生成計劃的縱橫比在此處反映。
將參考編碼為潛在 (VAEEncode (#333))#
經過縮放的參考圖像由 Qwen Image VAE 編碼為潛在表示。保持 VAE 在編碼和解碼過程中的一致性,可維持色彩和紋理的一致性。此處的高保真重建在下游風格轉換的質量中產生了巨大的回報。
編碼您的提示 (CLIPTextEncode (#607) 和 CLIPTextEncode (#259))#
您的目標提示由 Qwen3-VL 文本編碼器編碼。相同的提示可以選擇性地在反轉步驟中輸入參考分支,這通常會改善學習到的風格與您想渲染的場景之間的對齊。如果您願意,可以拆分提示,但對於兩者使用相同的目標提示是一個穩固的默認選擇。
提取風格信號 (RFInversion (#603))#
RF 反轉讀取參考潛在和提示條件以提取一個緊湊的風格代碼和一個輕度調整的基本模型。這強調了顏色、材料和筆觸般的特徵,同時減弱了佈局和對象身份。這是將單一框架轉化為可重用風格描述符的步驟。
將風格附加到模型 (UntwistingRoPE (#623) 與 UnofficialExtensions (#632))#
Untwisting RoPE 通過調節 U-Net 區塊的注意力帶將風格代碼注入 Krea 2 Turbo。該方法仔細重新平衡旋轉位置編碼,使轉換作用如同外觀覆蓋而非佈局移植。可選擇的擴展節點揭示相同實現使用的額外控制。參考:ComfyUi-Untwisting-RoPE。
初始化新畫布 (EmptyLatentImage (#634))#
創建一個空白的潛在,寬度和高度來自於您的縮放參考。從噪聲開始確保新的構圖不會複製參考佈局。這在提供原創場景的同時保留了風格轉換的精髓。
取樣圖像 (KSampler (#635) 與 ConditioningZeroOut (#636))#
取樣使用風格附加模型和您的正向條件從噪聲中繪製新圖像。默認情況下,負向條件被歸零,這樣風格可以主導而不會在低層次特徵上產生爭鬥。SDE 式或其他噪聲添加取樣器如 er_sde 或 euler_ancestral 能夠很好地減少通過軌跡的轉移假象。
解碼和預覽 (VAEDecode (#262) 和 PreviewImage (#617))#
最終的潛在由 Qwen Image VAE 解碼回 RGB 並顯示以供檢查。由於兩種方式都使用相同的 VAE,顏色和紋理保持忠實於預期外觀。通過更改種子或提示來保存和迭代,以探索不同主題和構圖中的風格。
ComfyUI Krea 2 風格轉換 ComfyUI 工作流程中的關鍵節點#
RFInversion (#603)#
角色:學習參考圖像風格的緊湊表示,並返回一個輕度調整的模型加上風格潛在。如果風格感覺過於微妙,請增加其影響力;如果風格壓倒了主題身份,則減少其影響力。由 ComfyUI 的 Untwisting RoPE 實現支持,該實現記錄了反轉預設和行為。參考:ComfyUi-Untwisting-RoPE。
UntwistingRoPE (#623)#
角色:將學習到的風格注入 Krea 2 的選定 U-Net 區塊中,同時補償旋轉位置效果,以保持結構新穎。調整區塊範圍以擴大或縮小風格應用範圍,調整縮放參數以平衡遵循與自由,使用自適應實例正規化控制提升或抑制調色板和材料轉移。如果邊緣感覺不穩定,小的關鍵子空間對齊值可以穩定細節。參考:ComfyUi-Untwisting-RoPE。
ImageScaleToTotalPixelsX (#265)#
角色:在編碼之前將風格參考縮放到目標像素預算和縱橫比。選擇如 Lanczos 的重新採樣方法以獲得清晰邊緣,並提供與您預期生成尺寸匹配的尺寸。這種對齊減少了 VAE 中的混疊,並改善了風格代碼的穩定性。參考:ComfyUi-Scale-Image-to-Total-Pixels-Advanced。
KSampler (#635)#
角色:使用風格附加模型和您的提示條件執行擴散軌跡。沿路徑添加噪聲的取樣器傾向於沖淡殘留的佈局提示,並提供更清晰的風格轉移;嘗試 er_sde 或 euler_ancestral。適中的步驟和平衡的指導比例通常保持風格和內容在正軌上,同時通過種子保留多樣性。
可選附加項#
- 從一個風格明確的參考開始,展示清晰的光線、強烈的材質和最小的雜亂。
- 對反轉分支和主分支使用相同的目標提示,以保持風格和內容同步。
- 優先使用 SDE 或噪聲添加取樣器如
er_sde或euler_ancestral以減少轉移假象。 - 將縮放參考的縱橫比與目標輸出匹配,然後在風格感覺正確後探索其他比例。
- 如果結果複製了參考佈局,降低風格影響力或在
UntwistingRoPE中將風格移至較窄的區塊範圍。
這個 Krea 2 風格轉換 ComfyUI 工作流程中使用的資源:
- Krea 2 Turbo 模型卡:Hugging Face
- Krea 2 Comfy 權重包,包括 Qwen3-VL 文本編碼器和 Qwen Image VAE:Hugging Face
- Untwisting RoPE ComfyUI 擴展:GitHub
- Scale Image to Total Pixels Advanced:GitHub
致謝#
這個工作流程實現並基於以下作品和資源。我們對 krea 提供的 Krea-2-Turbo 模型、Comfy-Org 提供的 Krea-2 ComfyUI 權重、BigStationW 提供的 ComfyUI 自定義節點 Untwisting RoPE 和 Scale Image to Total Pixels Advanced 以及 r/StableDiffusion 社區的首次發佈和工作流程來源表示感謝。欲了解權威詳情,請參閱原始文件和下方鏈接的存儲庫。
資源#
- Reddit/首次發佈和工作流程來源
- 文檔 / 發佈說明:r/StableDiffusion post
- krea/Krea-2-Turbo
- Hugging Face: krea/Krea-2-Turbo
- Comfy-Org/Krea-2
- Hugging Face: Comfy-Org/Krea-2
- BigStationW/ComfyUi-Untwisting-RoPE
- BigStationW/ComfyUi-Scale-Image-to-Total-Pixels-Advanced
注意:所引用的模型、數據集和代碼的使用受其作者和維護者提供的各自許可和條款約束。









