Consistent Character Creator 3.8: Personaggi AI iperrealistici e consistenti nell'identità da una foto
Consistent Character Creator 3.8 è un flusso di lavoro modulare ComfyUI che trasforma un'unica immagine di riferimento in un pacchetto di personaggi completo e consistente nell'identità. Si concentra sulla velocità e ripetibilità mentre preserva le proporzioni del soggetto, l'abbigliamento e i tratti del viso attraverso viste e scene.
Costruito attorno a Qwen‑Image‑Edit‑2511, questa versione aggiunge giri completi più ricchi, varianti di scena multiple, primi piani, percorsi di prova e posa e un'utilità di esportazione dataset. Il risultato è un sistema a tela unica per artisti di personaggi, sviluppatori di giochi e creatori che necessitano di risultati iperrealistici e consistenti rapidamente.
Modelli chiave nel flusso di lavoro Comfyui Consistent Character Creator 3.8
- Qwen-Image-Edit-2511 (GGUF) UNet. Il generatore guidato dall'immagine che ancora l'identità e lo stile dalla tua foto di riferimento. Usato tramite i nodi "Qwen Image Edit" con pesi GGUF ottimizzati per ComfyUI. unsloth/Qwen-Image-Edit-2511-GGUF
- Encoder di immagini Qwen e VAE. Encoder di testo e il VAE che si accoppiano con il Qwen image-edit UNet per interpretare correttamente l'immagine di riferimento e decodificare pixel di alta qualità. Comfy-Org/Qwen-Image_ComfyUI
- Qwen-Image-Edit-2511-Lightning LoRA. Un LoRA leggero che accelera e stabilizza le modifiche alle immagini Qwen mantenendo l'identità. lightx2v/Qwen-Image-Edit-2511-Lightning
- FLUX.1‑dev checkpoint. Usato nel pipeline del dataset per l'upscaling e il raffinamento consapevoli dello stile. Comfy-Org/flux1-dev
- Patch del modello proiettore USO FLUX. Collega le caratteristiche di stile CLIP‑Vision in FLUX per il raffinamento consistente nello stile e la preparazione del dataset. Comfy-Org/USO_1.0_Repackaged
- SigCLIP Vision 384. Estrae caratteristiche visive per riferimento e guida dello stile nel percorso del dataset. Comfy-Org/sigclip_vision_384
- Florence‑2‑FLUX‑Large. Genera didascalie automatiche di alta qualità per l'esportazione del dataset. gokaygokay/Florence-2-Flux-Large
- Upscaler 4x-UltraSharp. Upscaling nitido e naturale usato nel flusso del dataset. Qualsiasi upscaler compatibile può essere sostituito.
Come usare il flusso di lavoro Comfyui Consistent Character Creator 3.8
La logica generale è semplice: importa un'immagine di riferimento pulita, dai al personaggio un nome breve (usato per cartelle e didascalie), opzionalmente aggiungi un prompt di stile di una frase, quindi esegui qualsiasi gruppo di cui hai bisogno. Ogni gruppo è autonomo e può essere attivato indipendentemente per creare primi piani, giri completi, pose, scene ed esportazioni di dataset che rimangono visivamente consistenti.
Carica modelli
Questo gruppo di utilità inizializza gli encoder image-edit di Qwen, il VAE accoppiato e le backbone di testo/visione CLIP. I pesi GGUF di Qwen-Image-Edit-2511 e il Lightning LoRA vengono caricati e combinati in modo da poter iterare rapidamente senza configurazione manuale. Non devi cambiare nulla qui a meno che non desideri sostituire checkpoint o encoder.
Modelli GGUF
Questo gruppo punta il grafico all'UNet GGUF di Qwen-Image-Edit-2511 utilizzato da tutti i percorsi di generazione. Mantiene il campionamento stabile su tutta la tela mentre il Lightning LoRA accelera i passaggi. Trattalo come la spina dorsale che impone l'identità.
Modelli di Upscaling
Carica il checkpoint FLUX.1‑dev, la patch del modello proiettore USO FLUX, un encoder CLIP‑Vision e l'upscaler scelto. Questi asset sono usati principalmente all'interno del pipeline del dataset per produrre immagini di allenamento più nitide e consistenti nello stile e didascalie. Puoi lasciare i default come sono a meno che non preferisci un upscaler diverso o devi sostituire il proiettore di stile.
CARATTERISTICA TURNAROUND
Genera un foglio multi-visione pulito dalla tua immagine di input singola. L'encoder Qwen si condiziona sulla referenza e su un'istruzione breve che chiede un allineamento uniforme con sfondo bianco. Usalo quando desideri un controllo rapido dell'identità prima di eseguire scene e pose. I risultati vengono salvati sotto il nome del tuo personaggio per un facile riutilizzo in gruppi successivi.
PRIMO PIANO
Crea un primo piano frontale e neutro che blocca il tono della pelle, i tratti del viso e i micro-dettagli. L'encoder dà priorità alla tua immagine di riferimento rispetto al testo in modo che la somiglianza rimanga fedele. Usalo per miniature, carte d'identità o per valutare se l'identità è pronta per scene più ampie.
PROFILO
Produce un primo piano laterale della testa per la verifica del profilo e della silhouette. Il prompt chiede un'inquadratura pulita per mantenere le proporzioni consistenti. Eseguilo presto per confermare la forma dell'orecchio, del naso e della mascella prima di passare a scatti a figura intera.
DIETRO
Renderizza una vista posteriore o sopra la spalla per completare la gamma di ritratti. Questo aiuta a convalidare la silhouette dei capelli, le cuciture dell'abbigliamento e le proporzioni posteriori. È particolarmente utile se prevedi di generare animazioni o giri completi in seguito.
T‑POSE
Genera una posa a T a figura intera, neutra, su sfondo bianco per rigging, prova o lavoro di modello. Poiché è condizionato dalla stessa referenza, le proporzioni e l'abbigliamento si trasferiscono senza deriva. Usalo come base prima di tentare movimenti o pose stilizzate.
MODEL POSE
Posiziona il personaggio in pose da studio rilassate per scatti di prova e in stile lookbook. È progettato per mantenere intatti abbigliamento, acconciatura e stile mentre cambia la postura del corpo. Ottimo per visualizzazione di abbigliamento o test di direzione artistica.
VISTA LATERALE
Costruisce una vista laterale a figura intera per l'allineamento di scala e postura. Eseguire VISTA LATERALE più VISTA POSTERIORE ti dà riferimenti ortografici che puoi usare per modellazione o rigging 2D. L'identità è preservata tramite lo stesso stack di condizionamento usato altrove.
VISTA POSTERIORE
Crea una vista posteriore a figura intera per completare la copertura ortografica. Utile per dettagli posteriori di indumenti, zaini o controlli di lunghezza dei capelli. Usa insieme a VISTA LATERALE e T-POSE quando assembli fogli di giro completo.
CAMMINATA
Genera un fotogramma cinematografico laterale in movimento che mantiene l'abbigliamento e la silhouette. L'istruzione incoraggia un movimento naturale senza rompere l'identità. Utile per storyboard rapidi e test di scatti.
SCENA_02
Sposta il personaggio in un interno atmosferico con cambiamenti di illuminazione mantenendo abbigliamento e volto. Usalo per testare come il tuo personaggio resiste sotto l'illuminazione stilizzata. La coerenza dell'identità è mantenuta dal condizionamento basato sull'immagine.
SCENA_03
Posiziona il personaggio all'aperto con luce calda e oggetti di primo piano mantenendo lo stesso look e guardaroba. È un buon test di stress per gli spostamenti di bilanciamento del colore e mantiene comunque stabile il volto. Sostituisci questo quando vuoi risultati luminosi e saturi.
SCENA_04
Ti offre un'ambientazione di parco soleggiato con un diverso angolo della fotocamera per controllare la stabilità facciale a bassa angolazione. Eseguilo dopo il pacchetto neutro per confermare la somiglianza sotto scatti verso l'alto. Utile per contesti sociali, di stile di vita o di prodotto.
SCENA_05
Aggiunge un ambiente da caffè accogliente e una guida di prop a mano mantenendo outfit e stile. Questo è un controllo di realismo che mescola illuminazione interna e interazione manuale senza perdere l'identità. Usalo quando hai bisogno di fotogrammi di narrazione naturalistica.
SCENA_06
Sposta il personaggio nel trasporto pubblico con abbigliamento e palette di colori mantenuti. Verifica l'identità in sfondi più stretti e più affollati. Utile per pannelli editoriali o narrativa urbana.
ARTE CONCETTUALE
Produce una variante diretta dall'arte che estrapola lo stile rispettando ancora le proporzioni originali e l'outfit. È destinato a mood board, key art o schizzi di pre-produzione. Poiché sfrutta la stessa referenza, il tuo personaggio rimane riconoscibile.
04_EMOZIONI
Crea più variazioni di primo piano con cambiamenti di espressione sottili. È utile per avatar UI, fogli di reazione o ritratti di dialogo mantenendo fedele al soggetto. Attiva questo gruppo quando desideri un pacchetto di emozioni compatto che corrisponda alla stessa identità.
B - CREAZIONE DATASET
Dopo aver generato il tuo pacchetto, questo gruppo carica le immagini selezionate, le migliora e le normalizza, aggiunge automaticamente didascalie con Florence-2 e scrive una cartella pronta per l'addestramento. Usa un percorso di riferimento di stile in modo che il tuo dataset mantenga lo stesso aspetto del pacchetto generato. Imposta il nome del personaggio una volta e l'esportatore salverà immagini e didascalie in una cartella dataset dedicata per futuri perfezionamenti.
Nodi chiave nel flusso di lavoro Comfyui Consistent Character Creator 3.8
TextEncodeQwenImageEditPlus(#1199). Alimenta Qwen con la tua immagine di riferimento più un'istruzione breve in modo che il modello sappia cosa cambiare e cosa mantenere. Mantieniimage1connesso alla tua foto del personaggio e scrivi un testopromptconciso quando hai bisogno di cambiamenti di posa o scena piuttosto che riscritture di stile. Meno descrivi eccessivamente l'identità, più consistenti rimangono i risultati.FluxKontextMultiReferenceLatentMethod(#1351). Blocca le caratteristiche di identità all'inizio del programma di campionamento in modo che il soggetto sopravviva tra angoli e illuminazioni. Usalo come fornito per l'identità più forte; rilassati solo se vuoi intenzionalmente più restyling.KSampler(#199). Converte il condizionamento in immagini attraverso tutti i pacchetti. Se hai bisogno di più fedeltà, regola ipassaggi; se vuoi una aderenza più libera all'istruzione, regolacfg. Piccole modifiche coordinate qui influenzano ogni gruppo in modi prevedibili.LoraLoaderModelOnly(#547). Attacca il Qwen-Image-Edit-2511-Lightning LoRA all'UNet. Se vedi un'eccessiva nitidezza o l'aspetto si sposta, abbassa leggermentestrength_model; alzalo se le modifiche sembrano troppo deboli. Questo è il principale quadrante velocità-qualità per le modifiche Qwen. lightx2v/Qwen-Image-Edit-2511-LightningUSOStyleReference(sottografo). Combina le caratteristiche CLIP‑Vision con FLUX tramite il proiettore USO per preservare lo stile del tuo pacchetto mentre si migliora per l'esportazione del dataset. Se i volti ritagliano troppo stretti o troppo larghi, regola l'opzionecropnell'encoder CLIP‑Vision per un'inquadratura più stabile. Comfy-Org/USO_1.0_RepackagedFlorence2Run(#1413). Genera automaticamente didascalie usate dallo scrittore del dataset. Lascia iltaskdidascalia in modalità dettagliata per i dataset di addestramento; passa a modalità più brevi solo se hai bisogno di tag compatti. gokaygokay/Florence-2-Flux-LargeSaveImageTextDataSetToFolder(#1440). Scrive immagini e didascalie abbinate in una cartella pulita usando il nome del tuo personaggio. Impostafolder_nameper mantenere i dataset separati per carattere efilename_prefixper nomi riproducibili.
Extra opzionali
- Inizia con PRIMO PIANO e PROFILO per convalidare la somiglianza, quindi esegui CARATTERISTICA TURNAROUND prima di esplorare scene e pose.
- Mantieni i prompt brevi e descrittivi della fotocamera, posa o ambiente; lascia che l'immagine di riferimento definisca l'identità.
- Usa un NOME semplice e unico; diventa la cartella di output e un token di attivazione conveniente per le didascalie.
- Quando sei soddisfatto del pacchetto, esegui B - CREAZIONE DATASET una volta per esportare immagini e didascalie normalizzate per il perfezionamento.
- Per look "try-on", esegui prima MODEL POSE o T-POSE per bloccare le proporzioni, quindi passa al tuo gruppo di scena preferito.
Ringraziamenti
Questo flusso di lavoro implementa e si basa sui seguenti lavori e risorse. Ringraziamo sinceramente MickMumpitz per la pagina sorgente del flusso di lavoro New Video Create e l'archivio sorgente allegato per i loro contributi e manutenzione. Per dettagli autorevoli, si prega di fare riferimento alla documentazione originale e ai repository collegati di seguito.
Risorse
- MickMumpitz/Pagina sorgente del flusso di lavoro
- Documenti / Note di rilascio: Pagina sorgente del flusso di lavoro da MickMumpitz
- MickMumpitz/Archivio sorgente
- File sorgente locale usato per la configurazione:
260106_MICKMUMPITZ_CCC_3-8_SMPL.json
- File sorgente locale usato per la configurazione:
Nota: L'uso dei modelli, dataset e codice referenziati è soggetto alle rispettive licenze e termini forniti dai loro autori e manutentori.


