Wan2.2 Fun Inp: Generazione di Video da Primo a Ultimo Fotogramma in ComfyUI
Wan2.2 Fun Inp trasforma due immagini fisse in un video coerente guidando il modello da un primo fotogramma a un ultimo fotogramma con interpolazione naturale tra di essi. È progettato per artisti, animatori e registi che vogliono coerenza cinematografica mantenendo il controllo del prompt. Il workflow viene fornito con due preset paralleli così puoi dare priorità alla sintesi ultra-veloce a 4 passaggi o a una generazione più generale scalata fp8, entrambi alimentati da Wan 2.2 Fun Inpaint.
Wan2.2 Fun Inp: Generazione di Video da Primo a Ultimo Fotogramma in ComfyUI
Wan2.2 Fun Inp trasforma due immagini fisse in un video coerente guidando il modello da un primo fotogramma a un ultimo fotogramma con interpolazione naturale tra di essi. È progettato per artisti, animatori e registi che vogliono coerenza cinematografica mantenendo il controllo del prompt. Il workflow viene fornito con due preset paralleli così puoi dare priorità alla sintesi ultra-veloce a 4 passaggi o a una generazione più generale scalata fp8, entrambi alimentati da Wan 2.2 Fun Inpaint.
Modelli chiave nel workflow Comfyui Wan2.2 Fun Inp
- Wan 2.2 Fun Inpaint 14B (fp8 scalato) Il principale backbone di diffusione specializzato per la generazione video “Fun Inpaint”. Sono incluse due varianti: alto rumore per movimenti più ampi e transizioni creative, e basso rumore quando hai bisogno di maggiore fedeltà ai tuoi fotogrammi iniziali/finali. • Alto rumore: wan2.2_fun_inpaint_high_noise_14B_fp8_scaled.safetensors • Basso rumore: wan2.2_fun_inpaint_low_noise_14B_fp8_scaled.safetensors
- Lightning 4-Step LoRA per I2V Un LoRA opzionale che comprime il programma di campionamento a soli quattro passaggi per iterazioni rapide, ideale per anteprime e bozze veloci. • LoRA a basso rumore: wan2.2_i2v_lightx2v_4steps_lora_v1_low_noise.safetensors • LoRA ad alto rumore: wan2.2_i2v_lightx2v_4steps_lora_v1_high_noise.safetensors
- Wan VAE Il VAE gestisce le conversioni latente-pixel utilizzate dai modelli Wan; preserva dettaglio e tono durante la decodifica/codifica. Vedi il pacchetto Wan 2.2 su Hugging Face.
- CLIP text encoder Codifica i tuoi prompt positivi e negativi in vettori di condizionamento che guidano la narrazione visiva. Implementazione di riferimento: openai/CLIP.
- ComfyUI Video Helper Suite (export) Combina i fotogrammi generati in un MP4 alla frequenza dei fotogrammi scelta. Repo: ComfyUI-VideoHelperSuite.
Come utilizzare il workflow Comfyui Wan2.2 Fun Inp
Il grafico contiene due gruppi paralleli che puoi attivare a seconda della velocità rispetto alla generalità. Attiva solo uno alla volta per esecuzioni pulite.
Gruppo: Wan2.2_fun_Inp fp8_scaled + 4 steps LoRA
Usa questo per anteprime molto veloci. Il gruppo carica il backbone Wan 2.2 più un Lightning 4-Step LoRA e instrada i tuoi prompt attraverso il percorso del campionatore breve. Fornisci le tue immagini iniziali e finali, quindi regola i parametri di alto livello secondo necessità. Internamente, WanFunInpaintToVideo (#111) semina la traiettoria dal primo all'ultimo fotogramma, mentre un campionatore breve affina il movimento e la struttura in pochi passaggi.
Gruppo: Wan2.2_fun_Inp fp8_scaled
Scegli questo quando vuoi un intervallo operativo più ampio senza il vincolo dei 4 passaggi. Questo percorso utilizza direttamente il modello Wan 2.2 scalato fp8, mantenendo la stessa guida da primo a ultimo fotogramma ma con un budget di campionamento standard per un recupero di dettagli più sfumato e una modellatura del movimento. Il nodo WanFunInpaintToVideo (#148) ancora la traiettoria e passa al campionatore a valle per la rifinitura.
Step 2 — Carica immagini iniziali e finali
Entrambi i gruppi includono una sezione Carica immagini iniziali e finali. Collega un immagine iniziale che imposta la composizione di apertura e un immagine finale che definisce la posa o la scena finale. Il workflow interpolerà il movimento e l'aspetto tra di esse, rispettando i tuoi prompt di testo. Per i migliori risultati, mantieni il rapporto d'aspetto coerente tra entrambe le immagini.
Step 3 — Prompt
Scrivi ciò che vuoi vedere nel Prompt Positivo e ciò che vuoi evitare nel Prompt Negativo. I nodi CLIP Text Encode (Positive Prompt) e CLIP Text Encode (Negative Prompt) trasformano il tuo testo in condizionamenti che guidano contenuto, stile e dinamiche. Usa frasi concise, orientate alla scena (azioni, suggerimenti di telecamera, materiali, atmosfera) piuttosto che liste lunghe.
Step 4 — Dimensione e durata del video
Imposta width, height, e length nel nodo WanFunInpaintToVideo per definire la risoluzione spaziale e il conteggio dei fotogrammi. I predefiniti sono ottimizzati per un video alto 576×1024 con circa 3–4 secondi di movimento a 24 fps. Sequenze più lunghe generalmente beneficiano del percorso scalato fp8; le anteprime brevi sono ottime con il gruppo LoRA a 4 passaggi.
Esporta in MP4
VHS_VideoCombine assembla i fotogrammi in un MP4 con un predefinito di 24 fps e un CRF amichevole alla qualità. I nomi dei file sono prefissati per ciascun ramo (ad esempio, Fun_Inp e Fun_Inp_4_Step) così puoi confrontare facilmente i risultati. Regola la frequenza dei fotogrammi se hai bisogno di una riproduzione più lenta o più veloce.
Esecuzione di un solo ramo
Seleziona un gruppo e usa Ctrl+B per abilitarlo o disabilitarlo. Se abiliti il gruppo fp8_scaled, disabilita il gruppo fp8_scaled + 4 steps LoRA, e viceversa. Puoi anche utilizzare le funzionalità di esecuzione parziale di ComfyUI per eseguire solo le sezioni che stai modificando.
Nodi chiave nel workflow Comfyui Wan2.2 Fun Inp
WanFunInpaintToVideo (#111 e #148)
Il motore principale che fonde la tua start_image e end_image in una traiettoria latente continua. Accetta width, height, e length per impostare la dimensione e la durata del video, quindi emette una sequenza latente più condizionamenti positivi/negativi aggiornati. Inizia qui quando regoli la continuità, il ritmo o la composizione attraverso la ripresa.
UNETLoader (#101, #102)
Sceglie la variante del modello Wan 2.2 Fun Inpaint. Usa alto rumore per movimenti più audaci e interpolazioni più trasformative. Usa basso rumore quando la priorità è preservare l'identità e la texture del fotogramma iniziale e finale. Abbina uno dei due con o senza il 4-step LoRA a seconda delle esigenze di velocità.
ModelSamplingSD3 (#93)
Configura il programma del campionatore utilizzato a valle. Mantienilo allineato con il LoRA o il percorso fp8 scelto. Se vedi sfarfallio temporale, modeste regolazioni della modalità del campionatore o dei passaggi possono rendere le transizioni più fluide senza sovra-affilare i dettagli.
KSamplerAdvanced (#150)
Applica un passaggio di rifinitura alla sequenza latente. Aumenta leggermente i passaggi se hai bisogno di micro-dettagli più nitidi su volti, mani, o strutture sottili; riduci i passaggi per movimenti più morbidi e sognanti. Evita CFG o conteggi di passaggi estremi che possono destabilizzare la coerenza temporale.
VHS_VideoCombine (#159)
Unisce i fotogrammi resi in un MP4. Regola frame_rate per il feeling del movimento e la velocità di riproduzione, e mantieni il pix_fmt predefinito per una compatibilità ampia dei lettori. CRF più bassi producono file più grandi con gradienti più fini; CRF più alti comprimono più aggressivamente.
Extra opzionali
- Abbina il rapporto d'aspetto delle tue immagini iniziali e finali alla
width×heightselezionata per ridurre ritagli o distorsioni indesiderate. - Per scatti di personaggi, mantieni abbigliamento, illuminazione, e angolo della telecamera ampiamente coerenti tra i primi e ultimi fotogrammi per incoraggiare un'identità stabile.
- Inizia con un'anteprima breve Wan2.2 Fun Inp utilizzando il gruppo LoRA a 4 passaggi, poi passa al gruppo scalato fp8 per il tuo finale.
- Se la parte centrale della clip sembra troppo statica, prova il modello alto rumore; se le transizioni sembrano caotiche, prova basso rumore e semplifica il prompt.
- Mantieni i prompt focalizzati sull'intento della scena (azione, atmosfera, movimenti di telecamera) piuttosto che catene lunghe di aggettivi; Wan2.2 Fun Inp risponde meglio a direzioni chiare.
Riconoscimenti
Il workflow Wan 2.2 Inp Fun espande le possibilità creative della generazione video AI collegando il controllo da fotogramma a fotogramma con interpolazione naturale. È uno strumento versatile per artisti, animatori e registi che vogliono coerenza cinematografica nei loro progetti guidati dall'AI.
Un ringraziamento speciale ai team ComfyUI e Wan per aver abilitato un'integrazione senza soluzione di continuità del workflow Inp Fun nei pipeline creativi di nuova generazione.
