Krea 2 style transfer ComfyUI workflow: stile di immagine singola, scene completamente nuove#
Questo flusso di lavoro di trasferimento di stile Krea 2 ComfyUI trasferisce il linguaggio visivo di un'immagine di riferimento su una composizione completamente nuova. Mantiene il soggetto e l'inquadratura freschi mentre trasferisce texture, palette e spunti di rendering da poster, cels anime, acquerello, argilla, pittura ad olio o look fotografici. È costruito per RunComfy e abbina Krea 2 Turbo con la codifica testo Qwen3-VL, Qwen Image VAE e un percorso di condizionamento Untwisting RoPE per una cattura di stile affidabile in un solo colpo.
I creatori ottengono un percorso efficiente per testare molti stili contro lo stesso prompt senza copiare e incollare i layout delle scene. L'inversione RF del flusso di lavoro più la pila Untwisting RoPE si concentrano sullo stile, non sulla struttura, quindi le immagini generate rimangono compositivamente nuove pur appartenendo alla stessa famiglia estetica.
Modelli chiave nel flusso di lavoro di trasferimento di stile ComfyUI Krea 2#
- Krea 2 Turbo. Il backbone di diffusione utilizzato per sintetizzare l'immagine target. Offre una generazione veloce e di alta qualità e fornisce lo spazio delle funzionalità che la modifica di stile altera. Model card
- Codificatore testo Qwen3-VL 4B. Codifica i tuoi prompt in vettori di condizionamento adatti per Krea 2, abilitando una guida dei contenuti fedele lasciando spazio per un forte trasferimento di stile. Distribuito con il pacchetto Krea 2 Comfy. Weights repo
- Qwen Image VAE. Gestisce le conversioni da immagine a latente e da latente a immagine con fedeltà, fondamentale quando si estrae lo stile di riferimento e quando si decodifica il risultato finale. Weights repo
Come usare il flusso di lavoro di trasferimento di stile ComfyUI Krea 2#
A livello generale, carichi un singolo riferimento di stile, lo ridimensioni alla risoluzione target, lo codifichi in latenti, estrai un segnale di stile tramite inversione RF, attacchi quel segnale a Krea 2 con Untwisting RoPE, quindi campioni da un latente fresco guidato dal tuo prompt. Le sezioni seguenti seguono il percorso dominante dagli input all'anteprima.
Carica il riferimento di stile (LoadImage (#612))#
Carica un'immagine il cui look vuoi trasferire. Scegli un frame orientato allo stile con materiali chiari, illuminazione e colore in modo che l'inversione abbia un segnale forte da cui imparare. Puoi riutilizzare lo stesso riferimento mentre iteri i prompt per testare come lo stile si adatta a soggetti diversi.
Ridimensiona il riferimento alla risoluzione target (ImageScaleToTotalPixelsX (#265))#
Il riferimento viene ridimensionato utilizzando il nodo Scale Image to Total Pixels Advanced in modo che le statistiche di stile corrispondano alla tela target. Questo aiuta a stabilizzare l'inversione RF ed evita distorsioni quando il VAE codifica il riferimento. Se il tuo target è quadrato o cinematografico, ridimensiona di conseguenza in modo che il rapporto d'aspetto che intendi generare sia riflesso qui.
Codifica il riferimento in latenti (VAEEncode (#333))#
Il riferimento scalato viene codificato da Qwen Image VAE in una rappresentazione latente. Mantenere il VAE coerente tra codifica e decodifica mantiene la coerenza di colore e texture. Una ricostruzione ad alta fedeltà qui paga dividendi nella qualità del trasferimento di stile a valle.
Codifica i tuoi prompt (CLIPTextEncode (#607) e CLIPTextEncode (#259))#
Il tuo prompt target viene codificato con il codificatore testo Qwen3-VL. Lo stesso prompt può opzionalmente essere alimentato nel ramo di riferimento per il passaggio di inversione, il che spesso migliora l'allineamento tra lo stile appreso e la scena che vuoi rendere. Se preferisci, puoi dividere i prompt, ma usare lo stesso prompt target per entrambi è un solido predefinito.
Estrai il segnale di stile (RFInversion (#603))#
L'inversione RF legge il latente di riferimento e il condizionamento del prompt per distillare un codice di stile compatto e un modello base leggermente adattato. Questo enfatizza caratteristiche di colore, materiale e simili a colpi di pennello mentre de-enfatizza il layout e l'identità degli oggetti. È il passaggio che trasforma un singolo frame in un descrittore di stile riutilizzabile.
Attacca lo stile al modello (UntwistingRoPE (#623) con UnofficialExtensions (#632))#
Untwisting RoPE inietta il codice di stile in Krea 2 Turbo modulando l'attenzione attraverso una banda di blocchi U-Net. Il metodo riequilibra attentamente la codifica posizionale rotatoria in modo che il trasferimento agisca come una sovrapposizione di look piuttosto che un trapianto di layout. Il nodo delle estensioni opzionali espone controlli extra usati dalla stessa implementazione. Riferimento: ComfyUi-Untwisting-RoPE.
Inizializza una tela fresca (EmptyLatentImage (#634))#
Un latente vuoto viene creato alla larghezza e altezza derivate dal tuo riferimento scalato. Partire dal rumore assicura nuove composizioni che non copiano il layout di riferimento. Questo preserva lo spirito del trasferimento di stile pur consegnando una scena originale.
Campiona l'immagine (KSampler (#635) con ConditioningZeroOut (#636))#
Il campionamento utilizza il modello con stile attaccato e il tuo condizionamento positivo per disegnare una nuova immagine dal rumore. Il condizionamento negativo è azzerato per impostazione predefinita, quindi lo stile può dominare senza lotte su caratteristiche di basso livello. I campionatori in stile SDE o altrimenti che aggiungono rumore come er_sde o euler_ancestral funzionano bene per ridurre gli artefatti di trasferimento lungo la traiettoria.
Decodifica e anteprima (VAEDecode (#262) e PreviewImage (#617))#
Il latente finale viene decodificato da Qwen Image VAE nuovamente in RGB e visualizzato per la revisione. Poiché lo stesso VAE viene utilizzato in entrambi i modi, colori e texture rimangono fedeli al look inteso. Salva e itera cambiando il seed o il prompt per esplorare lo stile su soggetti e inquadrature diverse.
Nodi chiave nel flusso di lavoro di trasferimento di stile ComfyUI Krea 2#
RFInversion (#603)#
Ruolo: apprende una rappresentazione compatta dello stile dell'immagine di riferimento e restituisce un modello leggermente adattato più un latente di stile. Aumenta la sua influenza se lo stile sembra troppo sottile, o riducilo se lo stile sopraffà l'identità del soggetto. Supportato dall'implementazione Untwisting RoPE per ComfyUI, che documenta i preset e i comportamenti di inversione. Riferimento: ComfyUi-Untwisting-RoPE.
UntwistingRoPE (#623)#
Ruolo: inietta lo stile appreso in Krea 2 attraverso blocchi U-Net selezionati compensando gli effetti posizionali rotatori in modo che la struttura rimanga nuova. Regola l'intervallo di blocco per ampliare o restringere dove si applica lo stile, regola i parametri di scala per bilanciare aderenza e libertà, e usa il controllo di normalizzazione adattiva delle istanze per sollevare o domare il trasferimento di palette e materiali. Piccoli valori di allineamento del sottospazio chiave possono stabilizzare i dettagli fini se i bordi sembrano tremolanti. Riferimento: ComfyUi-Untwisting-RoPE.
ImageScaleToTotalPixelsX (#265)#
Ruolo: scala il riferimento di stile a un budget di pixel target e rapporto d'aspetto prima della codifica. Scegli un metodo di ricampionamento come Lanczos per bordi nitidi e fornisci dimensioni che corrispondano alla tua dimensione di generazione prevista. Questo allineamento riduce l'aliasing nel VAE e migliora la stabilità del codice di stile. Riferimento: ComfyUi-Scale-Image-to-Total-Pixels-Advanced.
KSampler (#635)#
Ruolo: esegue la traiettoria di diffusione utilizzando il modello con stile attaccato e il tuo condizionamento del prompt. I campionatori che aggiungono rumore lungo il percorso tendono a lavare via i suggerimenti di layout residui e a fornire un trasferimento di stile più pulito; prova er_sde o euler_ancestral. Passi moderati e una scala di guida bilanciata di solito mantengono sia lo stile che il contenuto in pista mentre preservano la varietà attraverso il seed.
Extra opzionali#
- Inizia con un riferimento di stile orientato allo stile che mostri un'illuminazione pulita, materiali forti e ingombro minimo.
- Usa lo stesso prompt target sia per il ramo di inversione che per il ramo principale per mantenere stile e contenuto sincronizzati.
- Preferisci campionatori SDE o che aggiungono rumore come
er_sdeoeuler_ancestralper ridurre gli artefatti di trasferimento. - Abbina il rapporto d'aspetto del riferimento scalato alla tua uscita target, quindi esplora altri rapporti una volta che lo stile sembra giusto.
- Se il risultato copia il layout di riferimento, abbassa l'influenza dello stile o sposta lo stile in un intervallo di blocco più stretto in
UntwistingRoPE.
Risorse utilizzate in questo flusso di lavoro di trasferimento di stile ComfyUI Krea 2:
- Modello Krea 2 Turbo card: Hugging Face
- Pacchetto pesi Krea 2 Comfy, inclusi il codificatore testo Qwen3-VL e Qwen Image VAE: Hugging Face
- Estensione ComfyUI Untwisting RoPE: GitHub
- Scala Immagine al Totale di Pixel Avanzato: GitHub
Riconoscimenti#
Questo flusso di lavoro implementa e si basa sui seguenti lavori e risorse. Ringraziamo con gratitudine krea per il modello Krea-2-Turbo, Comfy-Org per i pesi Krea-2 ComfyUI, BigStationW per i nodi personalizzati ComfyUI Untwisting RoPE e Scala Immagine al Totale di Pixel Avanzato, e la comunità r/StableDiffusion per il primo rilascio e la fonte del flusso di lavoro. Per dettagli autorevoli, si prega di fare riferimento alla documentazione originale e ai repository collegati qui sotto.
Risorse#
- Reddit/primo rilascio e fonte del flusso di lavoro
- Documenti / Note di Rilascio: post r/StableDiffusion
- krea/Krea-2-Turbo
- Hugging Face: krea/Krea-2-Turbo
- Comfy-Org/Krea-2
- Hugging Face: Comfy-Org/Krea-2
- BigStationW/ComfyUi-Untwisting-RoPE
- BigStationW/ComfyUi-Scale-Image-to-Total-Pixels-Advanced
Nota: L'uso dei modelli, dataset e codice citati è soggetto alle rispettive licenze e condizioni fornite dai loro autori e manutentori.










