Wan Alpha è un workflow ComfyUI appositamente costruito che genera video con un canale alpha nativo utilizzando la famiglia Wan 2.1. Produce congiuntamente RGB e alpha così che personaggi, oggetti di scena ed effetti si inseriscano direttamente nelle timeline senza chiave o rotoscoping. Per VFX, motion graphics e app interattive, Wan Alpha offre bordi puliti, effetti semi-trasparenti e maschere precise pronte per la produzione.
Costruito attorno a Wan2.1‑T2V‑14B e a un paio di VAE consapevoli dell'alpha, Wan Alpha bilancia fedeltà e velocità. L'accelerazione opzionale LightX2V LoRA riduce il campionamento pur preservando i dettagli, e il workflow esporta sequenze di frame RGBA più un'anteprima animata WebP per una revisione rapida.
Questo grafico ComfyUI segue un percorso semplice dal prompt ai frame RGBA: carica modelli, codifica testo, alloca un video latente, campiona, decodifica RGB e alpha in sincronia, quindi salva.
Caricamento di modelli e LoRA
Load Wan 2.1 t2v 14B
(#37) per portare nel modello base. Se utilizzi accelerazioni o affinamenti di stile, applicali con LoraLoaderModelOnly
(#59) e LoraLoaderModelOnly
(#65) in sequenza. Il modello passa quindi attraverso ModelSamplingSD3
(#48), che configura un campionatore compatibile con il checkpoint caricato. Questo stack definisce il moto e lo stile di rendering che Wan Alpha affinerà nei passaggi successivi.Codifica del prompt
Load Text Encoder
(#38) carica l'encoder di testo UMT5‑XXL. Inserisci la tua descrizione in CLIP Text Encode (Positive Prompt)
(#6); mantieni il tuo soggetto, azione, inquadratura e la frase "sfondo trasparente" concise. Usa CLIP Text Encode (Negative Prompt) Useless s
(#7) per evitare aloni o ingombri di sfondo se necessario. Queste codifiche condizionano sia la generazione di RGB che di alpha affinché i bordi e gli indizi di trasparenza seguano la tua intenzione.Impostazione della tela video
EmptyHunyuanLatentVideo
(#40) per definire la tela video latente. Imposta width
, height
, frames
e fps
per adattarsi al tuo scatto; risoluzioni più alte o clip più lunghe richiedono più memoria. Questo nodo alloca un volume latente temporalmente coerente che Wan Alpha riempirà di movimento e aspetto. Considera di abbinare durata e frame rate al tuo montaggio per evitare il ricampionamento successivo.Generazione
KSampler
(#3) esegue la diffusione sul video latente utilizzando il tuo stack di modelli e la codifica del prompt. Regola il seed
per le variazioni e seleziona un sampler
e un scheduler
che bilanciano velocità e dettaglio. Quando il LightX2V LoRA è attivo, puoi usare meno passaggi per rendering più veloci mantenendo la stabilità. L'output è un unico flusso latente condiviso dalla fase di decodifica successiva per garantire l'allineamento perfetto RGBA.Decodifica RGB e alpha
RGB VAE Decode
(#8) si accoppia con VAELoader
(#39) per ricostruire i frame RGB. In parallelo, Alpha VAE Decode
(#52) si accoppia con VAELoader
(#51) per ricostruire il canale alpha. Entrambi i decoder leggono lo stesso latente così che il matte si allinei esattamente con i pixel di colore, un'idea centrale nel design di Wan‑Alpha per una trasparenza coerente. Questa decodifica a doppio percorso è ciò che rende Wan Alpha pronto per il compositing diretto.Salvataggio e anteprima
SavePNGZIP_and_Preview_RGBA_AnimatedWEBP
(#73) scrive due deliverables: un archivio zip di frame PNG RGBA e un'anteprima animata WebP compatta. La sequenza di frame è amichevole per la produzione per NLE e compositori, mentre l'anteprima accelera le revisioni. Nomina il tuo set di output, scegli una lunghezza e qualità di anteprima, e esegui il nodo per confezionare il tuo risultato.EmptyHunyuanLatentVideo
(#40)
width
, height
, frames
e fps
per adattarsi alla consegna. Tele più grandi e durate più lunghe aumentano le necessità di VRAM; considera bozze più brevi per lo sviluppo dell'aspetto, quindi scala per i finali.KSampler
(#3)
seed
per esplorazioni, steps
per scambiare velocità per dettaglio, sampler
e scheduler
per stabilità, e cfg
per bilanciare l'adesione al prompt con il movimento naturale. Con il LightX2V LoRA attivo, puoi ridurre significativamente steps
preservando la qualità grazie alla distillazione dei passaggi. Vedi LightX2V per il contesto sul campionamento veloce. ModelTC/LightX2VLoraLoaderModelOnly
(#59)
strength
per mescolare il suo effetto se vedi sovraffilature o artefatti di tempo. Mantieni questo LoRA più vicino al modello base nella catena così che i LoRA a valle ereditino i suoi benefici di velocità.LoraLoaderModelOnly
(#65)
strength
per evitare di sovrastare la coerenza del movimento; combina con il tuo prompt piuttosto che sostituirlo. Se appaiono artefatti, abbassa questo LoRA prima di cambiare il campionatore.VAELoader
(#39) RGB
RGB VAE Decode
(#8). Mantieni questo accoppiato con il VAE alpha Wan‑Alpha per garantire che entrambi i decoder interpretino i latenti in modo coerente. Cambiare a VAE non correlati può disallineare i bordi o ammorbidire la trasparenza. Il background sul design congiunto RGB–alpha è nel rapporto Wan‑Alpha. Wan‑Alpha (arXiv)VAELoader
(#51) Alpha
Alpha VAE Decode
(#52). Ricostruisce il matte dallo stesso spazio latente di RGB così che la trasparenza corrisponda a movimento e dettaglio. Se personalizzi i VAE, testa che RGB e alpha si allineino ancora su bordi subpixel come i capelli.SavePNGZIP_and_Preview_RGBA_AnimatedWEBP
(#73)
output_name
per il versioning, scegli qualità e frame rate dell'anteprima che riflettano il clip generato e mantieni l'esportazione PNG come tuo master per il compositing senza perdita. Evita di ridimensionare tra decodifica e salvataggio per preservare la fedeltà dei bordi.Risorse utilizzate in Wan Alpha
Questo workflow implementa e si basa sui seguenti lavori e risorse. Ringraziamo con gratitudine WeChatCV per Wan-Alpha per i loro contributi e la manutenzione. Per dettagli autorevoli, si prega di fare riferimento alla documentazione originale e ai repository collegati di seguito.
Nota: L'uso dei modelli, dataset e codice di riferimento è soggetto alle rispettive licenze e termini forniti dai loro autori e manutentori.
RunComfy è la piattaforma principale ComfyUI che offre ComfyUI online ambiente e servizi, insieme a workflow di ComfyUI con visuali mozzafiato. RunComfy offre anche AI Playground, consentire agli artisti di sfruttare gli ultimi strumenti di AI per creare arte incredibile.