Z-Image I2I Ultimate Photorealism: raffinamento del volto sicuro per l'identità nei ritratti
Z-Image I2I Ultimate Photorealism è un flusso di lavoro a due stadi in ComfyUI per il miglioramento fedele dei ritratti da immagine a immagine. Preserva l'identità e l'aspetto complessivo del soggetto aggiungendo dettagli realistici al volto, correggendo le espressioni e evitando gli artefatti inquietanti comuni ai cambi di volto. Costruito attorno a Z-Image Turbo con guida specializzata LoRA per il volto, è ideale per l'editing fotorealistico dei ritratti, il ritocco e gli aggiornamenti coerenti con l'identità da un'unica immagine di origine.
La pipeline riproduce prima la tua foto di input con alta fedeltà, quindi affina selettivamente il volto utilizzando mascheramento automatico del volto e inpainting consapevole delle espressioni. Il risultato è un ritratto naturale e realistico che mantiene intatta la somiglianza di base. Questo README spiega come eseguire e adattare il flusso di lavoro ComfyUI Z-Image I2I Ultimate Photorealism.
Nota: Questo flusso di lavoro richiede un face LoRA per funzionare. Carica il tuo character LoRA nel nodo del gruppo
InputsCharacter Lora here.
Modelli chiave nel flusso di lavoro ComfyUI Z-Image I2I Ultimate Photorealism
- Modello di diffusione Z-Image Turbo. Generatore principale da immagine a immagine che riproduce la composizione e l'illuminazione di origine consentendo sottili miglioramenti fotorealistici.
- ZImageTurbo VAE. Codificatore/decodificatore abbinato per conversione latente fedele che minimizza la deriva di colore e contrasto in I2I.
- Adattatori Face LoRA. LoRA specifici per il soggetto opzionali che rinforzano le caratteristiche di identità senza introdurre stilizzazione.
- Famiglia Qwen3-VL Instruct. Utilizzata per descrivere automaticamente l'espressione facciale e lo sguardo affinché i miglioramenti si allineino a ciò che è effettivamente nella foto. Vedi le schede modello per Qwen3-VL-2B-Instruct e Qwen3-VL-4B-Instruct. L'integrazione del nodo ComfyUI è fornita da ComfyUI-QwenVL.
- Segment Anything Model 3 (SAM3). Segmentazione a vocabolario aperto che isola la regione del volto dal passaggio di base per inpainting preciso e non distruttivo. Vedi facebookresearch/sam3 e il wrapper ComfyUI ComfyUI-SAM3.
Come utilizzare il flusso di lavoro ComfyUI Z-Image I2I Ultimate Photorealism
Il flusso di lavoro si svolge in due fasi coordinate: un render base I2I che riproduce fedelmente la tua immagine, seguito da un passaggio di raffinamento solo del volto guidato da mascheramento automatico e un prompt consapevole delle espressioni. Una sandbox separata ti consente di testare i face LoRA senza toccare l'immagine di origine.
Inputs
Carica il tuo ritratto in LoadImage (#958). L'immagine è normalizzata con ImageResizeKJv2 (#973) a una dimensione di lavoro stabile preservando la composizione. Un nodo vision-language genera quindi un prompt positivo strutturato e fotorealistico dall'immagine; il prompt automatico a lungo termine proviene da AILab_QwenVL (#962), progettato per descrivere ciò che è nella foto piuttosto che inventare nuovi contenuti. Puoi lasciarlo com'è per modifiche coerenti con l'identità o sostituirlo con il tuo prompt per variazioni creative. Un codificatore di testo basato su GGUF fornisce incorporamenti di prompt, quindi ottieni un condizionamento coerente anche in ambienti a basso VRAM.
Render
Il passaggio base ricrea la foto di input come punto di partenza pulito e denoised. CLIPTextEncode (#6) codifica il prompt automatico, CLIPTextEncode (#7) aggiunge un prompt negativo di sicurezza e SeedVarianceEnhancer (#978) inietta una piccola quantità controllata di variazione iniziale per evitare la bassa diversità dei semi tipica dei modelli turbo. L'immagine di origine è codificata con VAEEncode (#960) e il campionatore principale ClownsharKSampler_Beta (#979) produce un latente ad alta fedeltà che decodifica nell'immagine pre-raffinata tramite VAEDecode (#860). Questo risultato intermedio è salvato come "Output 1 Pre-Face Detail" per un rapido confronto A/B.
Face Refiner
La fase di raffinamento rileva e migliora solo il volto, lasciando intatti capelli, abbigliamento e sfondo. LoadSAM3Model (#940) con SAM3Grounding (#939) trova una precisa maschera del volto dall'immagine pre-raffinata utilizzando il prompt di testo "face". La maschera è ammorbidita con GrowMaskWithBlur (#1008) e la regione del volto è ritagliata in contesto utilizzando InpaintCropImproved (#942) per un campionamento più veloce e ad alta risoluzione prima di essere reintegrata. Un secondo AILab_QwenVL (#975) crea una descrizione compatta focalizzata solo su espressione e sguardo, che CLIPTextEncode (#944) trasforma in condizionamento positivo mentre ConditioningZeroOut (#945) azzera intenzionalmente il canale negativo per evitare la soppressione eccessiva dei micro-dettagli facciali. InpaintModelConditioning (#943) prepara i latenti mascherati; DifferentialDiffusion (#949) spinge il modello verso la coerenza strutturale; ClownsharKSampler_Beta (#985) esegue l'inpainting del volto raffinato; VAEDecode (#947) e InpaintStitchImproved (#950) fondono il volto migliorato senza alterare le aree non mascherate. L'immagine finale è salvata da SaveImage (#989).
Test LoRA
Usa la sandbox "Test Lora" per valutare un face LoRA senza toccare la tua sorgente. CLIPTextEncode (#999, #1000) fornisce un semplice paio di prompt di test, EmptyLatentImage (#1001) crea una tela pulita e ClownsharKSampler_Beta (#1007) rende campioni rapidi che puoi visualizzare in anteprima. Questo è utile per regolare la scelta e il peso del LoRA prima di eseguire un passaggio completo di raffinamento dell'identità.
Nodi chiave nel flusso di lavoro ComfyUI Z-Image I2I Ultimate Photorealism
SAM3Grounding(#939). Rileva il volto da un prompt in linguaggio naturale utilizzando SAM3, producendo maschere pulite robuste all'occlusione e alla posa. Se la maschera è troppo stretta o include artefatti della linea dei capelli, espandila o sfumala delicatamente a monte conGrowMaskWithBlurper evitare cuciture. Riferimento: facebookresearch/sam3 e ComfyUI-SAM3.InpaintCropImproved(#942) eInpaintStitchImproved(#950). Flusso di lavoro ritaglia-e-cuci che campiona solo la regione mascherata a una risoluzione ottimale, quindi fonde il risultato nell'originale. Usalo per impostare la risoluzione del volto di destinazione e il contesto assicurando che i pixel non mascherati non siano mai ricodificati. Riferimento: ComfyUI-Inpaint-CropAndStitch.ClownsharKSampler_Beta(#979, #985). Campionatore avanzato RES4LYF con campionatori espliciti ad alta precisione e opzioni SDE robuste che eccellono in I2I fotorealistico e inpainting. Per lavori critici per l'identità, scegli un campionatore RES stabile e un denoise conservativo; aumenta il denoise solo se intendi cambiare espressione o dettagli della pelle in modo significativo. Riferimento: RES4LYF.SeedVarianceEnhancer(#978). Aggiunge rumore controllato agli incorporamenti positivi nei primi passaggi per contrastare la bassa varianza dei semi in Z-Image Turbo, ottenendo variazioni naturali senza derapare l'identità. Aumenta la sua forza quando i risultati sembrano troppo simili tra i semi; riducila se l'aderenza al prompt si indebolisce. Riferimento: ChangeTheConstants/SeedVarianceEnhancer.DifferentialDiffusion(#949). Modifica il modello per un denoising differenziale che aiuta a preservare la struttura sottostante durante le modifiche mascherate. Mantienilo abilitato per raffinamenti del volto sottili e sicuri per l'identità; considera di disabilitarlo se desideri intenzionalmente cambiamenti stilistici più forti. Riferimento: comportamento del nodo documentato nei vari ecosistemi ComfyUI e utilizzato qui come aiuto per la conservazione strutturale.AILab_QwenVL(#962, #975). Prompt vision-language che leggono il contenuto reale dell'immagine per mantenere la guida ancorata alla realtà, specialmente per micro-espressioni e direzione dello sguardo. Preferisci una formulazione concisa e letterale nel passaggio del volto per evitare di introdurre nuovi attributi. Riferimento: ComfyUI-QwenVL e schede modello Qwen3-VL (2B, 4B).
Extra opzionali
- Usa l'immagine "Output 1 Pre-Face Detail" per verificare la fedeltà di base prima di affinare il volto; questo aiuta a separare i problemi di denoise di base dalle impostazioni di maschera o inpainting.
- Se il volto raffinato sembra troppo liscio, espandi leggermente la maschera del volto e riduci la sua sfocatura per aumentare la responsabilità del bordo, quindi esegui nuovamente solo il passaggio del volto.
- Mantieni i prompt fattuali per modifiche che preservano l'identità; sposta lo stile creativo su guardaroba, illuminazione o sfondo piuttosto che sugli attributi facciali.
- Valida nuovi face LoRA nella sandbox Test LoRA prima, quindi applica il LoRA scelto e il peso alla pipeline principale per un rinforzo coerente dell'identità.
- Per un'inquadratura coerente su un batch, mantieni il rapporto d'aspetto delle immagini di input vicino agli obiettivi di ridimensionamento del flusso di lavoro per minimizzare la pressione del ritaglio e preservare le proporzioni.
Ringraziamenti
Questo flusso di lavoro implementa e si basa sui seguenti lavori e risorse. Ringraziamo RetroGazzaSpurs per il flusso di lavoro "Z-Image IMG2IMG for Characters: Endgame V3 - Ultimate Photorealism" per i loro contributi e manutenzione. Per dettagli autorevoli, si prega di fare riferimento alla documentazione originale e ai repository collegati di seguito.
Risorse
- RetroGazzaSpurs/Z-Image IMG2IMG for Characters: Endgame V3 - Ultimate Photorealism
- Documenti / Note di rilascio: Workflow Source
Nota: L'uso dei modelli, dataset e codice di riferimento è soggetto alle rispettive licenze e termini forniti dai loro autori e manutentori.





