FireRed Image Edit 1.1: modifica delle immagini rapida e basata su istruzioni in ComfyUI
FireRed Image Edit 1.1 è un workflow ComfyUI per l'editing di immagini mirato e basato su istruzioni. Fornisci un'immagine sorgente e un'istruzione in linguaggio naturale, e applicherà modifiche precise preservando composizione e identità. È alimentato dal trasformatore di diffusione FireRed Image Edit 1.1 e guidato da un encoder visione-linguaggio Qwen2.5-VL 7B, così le tue modifiche seguono ciò che l'immagine mostra e ciò che il tuo prompt intende.
Il workflow include anche una modalità turbo Lightning LoRA che riduce drasticamente i passaggi di inferenza per rapide iterazioni. Usa FireRed Image Edit 1.1 quando hai bisogno di modifiche controllabili e ad alta fedeltà per cambi di abbigliamento, trasferimenti di stile, aggiustamenti di scena o raffinamenti di dettagli sottili direttamente all'interno di ComfyUI.
Modelli chiave nel workflow Comfyui FireRed Image Edit 1.1
- Trasformatore di diffusione FireRed Image Edit 1.1. Il generatore principale specializzato per modifiche di immagini seguendo istruzioni; si condiziona sia sul tuo prompt che sull'immagine sorgente per preservare layout e identità. Model card
- FireRed Image Edit 1.0 Lightning LoRA (8-step). Un adattatore di accelerazione leggero che abilita la modalità turbo, riducendo i passaggi di campionamento per anteprime rapide con forte aderenza alle modifiche. Model card
- Qwen2.5-VL 7B. Un modello multimodale visione-linguaggio usato qui come encoder per interpretare la tua istruzione insieme al contenuto dell'immagine, producendo un robusto condizionamento per il controllo delle modifiche. Model card
- Qwen Image VAE. L'autoencoder di immagini usato per codificare l'immagine sorgente in latenti per l'editing e per decodificare il risultato finale in pixel. Incluso negli asset FireRed 1.0. Files
Come usare il workflow Comfyui FireRed Image Edit 1.1
In sintesi, il workflow inizia caricando la tua immagine sorgente, la codifica in un latente, costruisce il condizionamento dalla tua istruzione con Qwen2.5-VL 7B, e poi esegue FireRed Image Edit 1.1 attraverso un campionatore per produrre l'immagine modificata. Un singolo interruttore turbo controlla se il Lightning LoRA è attivo, il che cambia anche il conteggio dei passaggi e la forza di guida per velocità o qualità.
Modello
Questo gruppo carica il trasformatore di diffusione FireRed Image Edit 1.1 e inietta opzionalmente il Lightning LoRA. Quando il turbo è abilitato, il LoRA viene applicato al modello base per accelerare il campionamento. Un nodo di campionamento del modello configura un programma su misura per il trasformatore FireRed affinché le modifiche rimangano stabili. Un passaggio di normalizzazione della guida quindi prepara il modello per un condizionamento coerente attraverso i prompt.
Prompt
Questo gruppo è dove scrivi l'istruzione che guida FireRed Image Edit 1.1. L'encoder Qwen2.5-VL 7B legge l'immagine sorgente insieme al tuo testo per comprendere sia ciò che è presente sia ciò che dovrebbe cambiare. Puoi aggiungere opzionalmente fino a due immagini di riferimento per guidare stile, abbigliamento, illuminazione o altri attributi. Il workflow include anche un percorso di encoder complementare che funge da canale negativo o di controbilanciamento per mantenere gli output puliti e mirati.
Codifica Immagine
La tua immagine sorgente viene automaticamente ridimensionata a una risoluzione adatta al modello e poi codificata nello spazio latente VAE. Questo latente diventa il punto di partenza per l'editing immagine-su-immagine, permettendo a FireRed Image Edit 1.1 di preservare composizione, geometria della fotocamera e identità. Il latente codificato fluisce direttamente al campionatore dove vengono applicate le modifiche.
Impostazione dei Passi
Questo gruppo cambia il conteggio dei passaggi del campionatore in base all'interruttore turbo. Quando il turbo è attivo, i passaggi sono mantenuti al minimo per anteprime rapide; quando il turbo è disattivato, viene utilizzato un conteggio dei passaggi più alto per la massima fedeltà. Usa il turbo per esplorare le direzioni rapidamente, poi disattivalo per il rendering finale della massima qualità.
Impostazione CFG
La forza della guida senza classificatore viene anch'essa commutata dallo stesso interruttore turbo. Un valore di guida più basso si abbina alla modalità turbo per mantenere le modifiche stabili sotto meno passaggi, mentre un valore più alto viene usato con il modello completo per una maggiore aderenza al prompt. Il workflow collega questo automaticamente così puoi concentrarti sull'istruzione piuttosto che sulla gestione dei parametri.
Impostazione Campionatore
Il campionatore combina il modello FireRed patchato, il tuo condizionamento positivo e negativo, e il latente codificato per produrre l'immagine modificata. Puoi impostare un seed per rendere i risultati ripetibili o variare per esplorare alternative. L'immagine decodificata viene salvata nella tua cartella di output con un prefisso chiaro così puoi batchare e confrontare le iterazioni facilmente.
Nodi chiave nel workflow Comfyui FireRed Image Edit 1.1
TextEncodeQwenImageEditPlus (Positive) (#118)
Questo nodo trasforma la tua istruzione di modifica in linguaggio naturale e da una a tre immagini in condizionamento per FireRed Image Edit 1.1. Usa una formulazione concisa e direttiva come "cambia la giacca in pelle rossa con cerniere argentate" o "converti in stile acquerello con bordi morbidi." Le opzioni image2 e image3 possono bloccare in stile, abbigliamento o riferimenti di illuminazione; mantienili visivamente coerenti con il tuo obiettivo. Se la modifica è troppo forte, riduci l'intensità descrittiva o aggiungi vincoli chiarificatori.
Enable Lightning LoRA? (#153)
Questo interruttore attiva il percorso turbo Lightning LoRA. Quando attivo, il workflow commuta il modello alla versione aumentata LoRA, riduce il campionamento da circa 40 passaggi a circa 8 passaggi, e abbassa la guida per mantenere i risultati stabili ad alta velocità. Usalo per iterare rapidamente su prompt e riferimenti, poi spegnilo per l'output finale della massima qualità.
LoraLoaderModelOnly (#151)
Questo nodo inietta il FireRed Image Edit 1.0 Lightning LoRA nel modello base FireRed Image Edit 1.1. Se regoli la forza del LoRA, ricorda che valori più alti aumentano l'intensità della modifica ma possono superare lo stile o introdurre artefatti. Per modifiche critiche per l'identità, mantieni la forza moderata e affidati a istruzioni più chiare o immagini di riferimento extra invece di spingere troppo il LoRA.
KSampler (#130)
Il campionatore è dove forza della modifica, guida e passi si uniscono. Con il turbo disattivato, aumentando i passi migliora i dettagli fini e riduce i piccoli artefatti; con il turbo attivato, mantieni i passi bassi per la velocità e affidati alla chiarezza del prompt e ai riferimenti. Regola cfg con parsimonia: valori più alti enfatizzano l'istruzione, mentre valori più bassi danno priorità alla fedeltà all'immagine sorgente. Per grandi cambiamenti di scena, alza cfg e considera più passi; per modifiche sottili, abbassa cfg e meno passi preservano l'identità.
Extra opzionali
- Scrivi modifiche come istruzioni chiare, non descrizioni complete dell'intera immagine. “Sostituisci la maglietta con un blazer blu navy; mantieni posa e illuminazione” supera una lunga narrazione.
- Usa gli input opzionali
image2eimage3per ancorare dettagli di stile o abbigliamento. Abbina angolo di ripresa e inquadratura alla sorgente per il miglior trasferimento. - Inizia con il turbo attivo per esplorare idee, poi disattivalo per finalizzare. Aspettati lievi differenze dovute al conteggio dei passaggi più alto e alla guida più forte.
- Per la massima conservazione dell'identità, mantieni
cfgconservativo, usa un'istruzione breve e specifica, e fornisci un'immagine di riferimento che si abbina strettamente quando possibile. - Salva un seed fisso una volta che ti piace la direzione così puoi testare solo l'istruzione o le immagini di riferimento tra le esecuzioni.
Risorse
- Modello FireRed Image Edit 1.1: FireRedTeam/FireRed-Image-Edit-1.1-ComfyUI
- Asset Lightning LoRA e VAE: FireRedTeam/FireRed-Image-Edit-1.0-ComfyUI
- Encoder Qwen2.5-VL 7B: Qwen/Qwen2.5-VL-7B-Instruct
- Progetto ComfyUI (riferimenti ai nodi): comfy-org/ComfyUI
Ringraziamenti
Questo workflow implementa e si basa su i seguenti lavori e risorse. Ringraziamo con gratitudine FireRedTeam per il modello di diffusione FireRed Image Edit 1.1, FireRedTeam per FireRed Image Edit 1.0 Lightning LoRA, e Comfy.org per il workflow ufficiale Comfy.org per i loro contributi e manutenzione. Per dettagli autorevoli, si prega di fare riferimento alla documentazione originale e ai repository collegati di seguito.
Risorse
- FireRedTeam/FireRed Image Edit 1.1 Diffusion Model
- GitHub: FireRedTeam/FireRed-Image-Edit
- Hugging Face: FireRedTeam/FireRed-Image-Edit-1.1-ComfyUI
- arXiv: 2602.13344
- FireRedTeam/FireRed Image Edit 1.0 Lightning LoRA
- GitHub: FireRedTeam/FireRed-Image-Edit
- Hugging Face: FireRedTeam/FireRed-Image-Edit-1.0-ComfyUI
- arXiv: 2602.13344
- Comfy.org/Comfy.org Official Workflow
- GitHub: Comfy-Org/workflow_templates
- Docs / Note di rilascio: FireRed Image Edit 1.1: Image Edit
Nota: L'uso dei modelli, dataset e codice di riferimento è soggetto alle rispettive licenze e termini forniti dai loro autori e manutentori.
