SCAIL 2 Trasferimento Azione di Riferimento Multi-ruolo in ComfyUI

ComfyUI SCAIL 2 Multi-role Reference Action Transfer Workflow

SCAIL 2 Multi-role Reference Action Transfer in ComfyUI | Coordinated Motion Transfer

Want to run this workflow?

Fully operational workflows
No missing nodes or models
No manual setups required
Features stunning visuals

ComfyUI SCAIL 2 Multi-role Reference Action Transfer Examples

SCAIL 2 Trasferimento Azione di Riferimento Multi-ruolo: trasferimento di movimento multi-personaggio che preserva l'identità per ComfyUI#

Questo flusso di lavoro offre il SCAIL 2 Trasferimento Azione di Riferimento Multi-ruolo: prende un video di guida e trasferisce le azioni a uno o più personaggi di riferimento mantenendo l'identità visiva di ciascun soggetto. Supporta il trasferimento di movimento e la sostituzione completa del personaggio, gestisce riferimenti di identità multi-immagine e produce scene coerenti e multi-ruolo adatte alla narrazione, ai dialoghi e alle performance di gruppo.

Costruito attorno alla generazione video Wan 2.1 con incorporamenti SCAIL_2, guida visiva CLIP Vision e maschere di ruolo basate sulla segmentazione, la pipeline si concentra su identità coerente, movimento naturale e interazioni controllabili in tutto il clip.

Modelli chiave nel flusso di lavoro di Comfyui SCAIL 2 Trasferimento Azione di Riferimento Multi-ruolo#

Backbone video Wan 2.1 tramite ComfyUI-WanVideoWrapper. Il generatore sintetizza fotogrammi video dagli incorporamenti immagine SCAIL_2, condizionamento visivo e testo prompt mentre gestisce contesti lunghi e uso efficiente della memoria. GitHub
Codificatore CLIP Vision. Fornisce robusti incorporamenti visivi dall'immagine di riferimento primaria o collage per guidare identità e aspetto durante la generazione. Vedi il documento CLIP per il background sull'apprendimento della rappresentazione immagine-testo. arXiv
Codificatore di testo della famiglia mT5. Codifica i prompt positivi e negativi usati per indirizzare il contenuto verso i soggetti e le azioni desiderate nei fotogrammi. arXiv
Segmentazione nello stile Segment Anything per il tracciamento degli oggetti video. Il flusso di lavoro utilizza un checkpoint della famiglia SAM per rilevare e tracciare i soggetti e produrre maschere per ruolo che guidano il trasferimento di azioni multi-personaggio. Background sulla segmentazione SAM: GitHub
Adattatori LoRA. Adattatori opzionali specializzano il generatore per la preservazione dell'identità e la fedeltà dell'azione senza riaddestrare il modello completo. Background sulla regolazione LoRA: arXiv
Utilità FeiHou Toolbox. Utilità di collage e maschera facilitano i riferimenti di identità multi-immagine e maschere colorate e consapevoli del ruolo per SCAIL 2. GitHub
Utilità di immagine KJNodes. Il ridimensionamento di alta qualità allinea gli input e le maschere alle dimensioni del video per un campionamento stabile. GitHub

Come usare il flusso di lavoro di Comfyui SCAIL 2 Trasferimento Azione di Riferimento Multi-ruolo#

Il flusso di lavoro ha quattro fasi principali: caricare risorse e il generatore, costruire riferimenti e maschere multi-ruolo, compilare incorporamenti SCAIL_2, quindi campionare ed esportare il video finale. I gruppi funzionano dall'alto verso il basso, con anteprime utili a ogni passaggio.

Area di Caricamento Modelli#

Questa area prepara il backbone Wan 2.1 e il suo VAE. Usa WanAnimatePlus ModelLoader (#37) per scegliere il modello base e la precisione, e WanAnimatePlus VAELoader (#71) per il VAE corrispondente. Se intendi influenzare ulteriormente identità o movimento, aggiungi adattatori con WanAnimatePlus LoraSelectMulti (#66), quindi applicali al modello tramite WanAnimatePlus SetLoRAs (#69). WanVideoTorchCompileSettings opzionale (#72) può ridurre la latenza compilando blocchi di attenzione.

Caricamento Immagine Singola#

Fornisci un'immagine di identità primaria con LoadImage nel gruppo Caricamento Immagine Singola. Questa immagine ancora l'aspetto del tuo soggetto principale. Se preferisci costruire un collage di più identità o ruoli, passa nel gruppo Quick Toggle per instradare dall'Ingresso Collage invece dell'immagine singola.

Ingresso Collage#

Usa AutoRefCollage (#370) per assemblare fino a diverse immagini di riferimento in un unico layout, rilevando automaticamente le persone e posizionando i ritagli in una tela pulita. Il collage funge da bacheca di identità multi-ruolo: ogni soggetto contribuisce con segnali di aspetto per la fase di SCAIL 2 Trasferimento Azione di Riferimento Multi-ruolo. Un nodo di anteprima mostra il collage assemblato così puoi controllare l'inquadratura prima di procedere.

Riferimento Multi-Immagine#

Qui puoi anche caricare tre o più ritratti curati con LoadImage e confezionarli usando ImageBatchMulti (#331). ImageResizeKJv2 allinea la loro dimensione per adattarsi alla risoluzione video prevista. Questo percorso è utile quando desideri un controllo più stretto su quali identità e angolazioni informano il modello di aspetto.

Caricamento Video#

VHS_LoadVideo (#297) importa il video e l'audio di guida. Puoi forzare un frame rate target per un movimento più fluido, limitare i fotogrammi totali per limitare la durata, saltare un segmento introduttivo o campionare ogni N-esimo fotogramma per iterazioni più rapide. Una sottopipeline “Reference Video Preview” combina e riproduce i fotogrammi caricati così puoi confermare che il clip sembri corretto prima del tracciamento.

Area Maschera#

Il flusso di lavoro rileva e traccia i soggetti per creare le maschere consapevoli del ruolo che alimentano SCAIL 2 Trasferimento Azione di Riferimento Multi-ruolo. Tre nodi SAM3_VideoTrack (#315, #316, #306) tracciano oggetti nel video di guida, immagini di riferimento e fotogrammi di prefisso opzionali. SCAIL2ColoredMaskV2 (#354) fonde queste tracce in tre uscite: una maschera video di posa, una maschera immagine di riferimento colorata e una maschera di prefisso per avvii caldi. Le anteprime per maschere a ruolo singolo e multi-ruolo ti aiutano a verificare che ogni colore corrisponda al personaggio corretto prima del campionamento.

Trasferimento di Movimento - Elaborazione degli Incorporamenti#

WanAnimatePlus SCAIL_2 Embeds (#342) trasforma i tuoi input in incorporamenti immagine SCAIL_2 usati dal generatore. Combina caratteristiche VAE, incorporamenti CLIP Vision, la tua immagine di riferimento o collage, la sostituzione dello sfondo (opzionale), i fotogrammi di posa tracciati e le maschere colorate. Puoi eseguire in due modalità: trasferimento di movimento (usa l'aspetto di riferimento con il movimento di guida) o sostituzione del personaggio (sostituisci la persona nel video di input con il tuo riferimento). Esistono anche opzioni per preservare lo sfondo di riferimento principale e per ritagliare o riquadrare fotogrammi di prefisso per esecuzioni lunghe o ad alta risoluzione.

Area di Campionamento#

WanVideoTextEncodeCached codifica i prompt, e WanVideoContextOptions (#290) controlla le finestre temporali tra i fotogrammi. WanAnimatePlus SamplerSettings (#332) raccoglie il modello, gli incorporamenti immagine SCAIL_2 e gli incorporamenti di testo insieme ai parametri iperparametri di campionamento e al programma; WanAnimatePlus SamplerFromSettings (#311) esegue la generazione. WanAnimatePlus Decode (#267) trasforma i latenti in fotogrammi; puoi abilitare il tiling VAE qui se affronti limiti di memoria. Il video viene finalizzato tramite VHS_VideoCombine ed esportato dall'Area di Anteprima; un combinato compagno può esportare un clip solo maschera per un debug rapido.

Quick Toggle e Dimensioni Video#

L'interruttore “true = Sostituzione del Personaggio | false = Trasferimento di Movimento” (#341) cambia istantaneamente come i ruoli sono gestiti a valle. Le costanti di larghezza e altezza alimentano tutti i nodi di ridimensionamento e maschera per mantenere gli allineamenti delle forme. Un FastGroupsBypassSwitch (#351) ti consente di passare tra un'immagine singola e un input collage senza dover rifare i collegamenti.

Nodi chiave nel flusso di lavoro di Comfyui SCAIL 2 Trasferimento Azione di Riferimento Multi-ruolo#

`SCAIL2ColoredMaskV2` (#354)#

Genera maschere consapevoli del ruolo fondendo tracce di oggetti dal video di guida, immagini di riferimento e fotogrammi di prefisso opzionali. Usa object_indices per scegliere quali ID tracciati diventano ruoli e il prefix_mask_mode per specificare un layout a singola immagine e multi-colore quando guidi diversi personaggi contemporaneamente. Mantieni replacement_mode coerente con il toggle globale in modo che la semantica della maschera corrisponda alla fase di incorporamento.

`WanAnimatePlus SCAIL_2 Embeds` (#342)#

Fonde VAE, CLIP Vision, riferimenti multi-immagine, fotogrammi di posa e maschere in incorporamenti SCAIL_2 per il generatore. Aumenta ref_strength quando l'identità si sposta; aumenta pose_strength quando la fedeltà del movimento è bassa. Per scene che dovrebbero mantenere uno sfondo di riferimento, abilita la preservazione dello sfondo; quando si parte da un singolo fotogramma di prefisso, abilita la codifica del prefisso a singolo fotogramma.

`SAM3_VideoTrack` (#315, #316, #306)#

Rileva e traccia i soggetti nei fotogrammi per alimentare il generatore di maschere. Se rilevi meno personaggi, abbassa la detection_threshold o consenti più max_objects; se il tracciamento è rumoroso, aumenta il detect_interval per ridurre il jitter di rilevamento. Controlla sempre l'anteprima della maschera colorata per garantire che ogni ruolo rimanga stabile nel tempo.

`VHS_LoadVideo` (#297)#

Controlla il clip di guida. force_rate imposta gli FPS di lavoro, frame_load_cap limita la durata, skip_first_frames taglia le introduzioni, e select_every_nth ti consente di sottocampionare i fotogrammi per test più rapidi. Questi controlli influenzano direttamente le finestre di contesto e la memoria, quindi regolali prima del campionamento.

`WanAnimatePlus SamplerSettings` (#332)#

Contiene i comandi principali di generazione. steps, scheduler e cfg guidano il dettaglio, la morbidezza e l'aderenza ai prompt; denoise_strength governa quanto la guida SCAIL_2 può rimodellare i fotogrammi. Usa l'input seed per la riproducibilità quando affini scene multi-personaggio.

`WanAnimatePlus BlockSwap` (#67)#

Risparmiatore di memoria opzionale che scambia blocchi di calcolo durante il campionamento. Su budget VRAM limitati o intervalli di fotogrammi lunghi, aumenta lo scambio per prevenire errori di memoria insufficiente; su GPU ad alta VRAM, riducilo o disabilitalo per velocità.

`WanAnimatePlus Decode` (#267)#

Decodifica i latenti in fotogrammi RGB. Se la tua risoluzione o la lunghezza del clip è alta e la decodifica causa OOM, abilita la decodifica VAE a tile e imposta dimensioni e passi di tile appropriati in modo che i tile si sovrappongano correttamente.

Extra opzionali#

Per clip multi-personaggio, dai a ciascun ruolo almeno un ritratto pulito e frontale e mantieni l'illuminazione coerente nel collage.
Inizia con la modalità di trasferimento di movimento per convalidare maschere e qualità del movimento, quindi passa alla sostituzione del personaggio se hai bisogno di sostituire completamente il performer.
Usa l'anteprima video solo maschera per confermare assegnazioni di ruolo e stabilità del colore prima di un lungo rendering.
Mantieni tutti gli input allineati alla stessa larghezza e altezza; usa i nodi di ridimensionamento forniti piuttosto che strumenti esterni per evitare discrepanze sottili di forma.
Se i risultati sembrano troppo stilizzati o fuori identità, abbassa la forza del prompt e aumenta l'enfasi del riferimento nella fase di incorporamento; regola il mix LoRA se hai abilitato gli adattatori.
I clip lunghi beneficiano di finestre di contesto più grandi in WanVideoContextOptions; bilancia questo con la memoria abilitando il tiling VAE e, se necessario, uno scambio di blocchi modesto.

Questo flusso di lavoro di SCAIL 2 Trasferimento Azione di Riferimento Multi-ruolo è progettato per rendere il trasferimento di movimento multi-ruolo ripetibile e prevedibile: prepara riferimenti chiari, verifica le maschere, quindi campiona con impostazioni stabili per un movimento naturale e fedele all'identità tra i personaggi.

Riconoscimenti#

Questo flusso di lavoro implementa e si basa sui seguenti lavori e risorse. Ringraziamo SCAIL 2 per il SCAIL 2 Multi-role Reference Action Transfer Workflow Source per i loro contributi e la manutenzione. Per dettagli autorevoli, si prega di fare riferimento alla documentazione originale e ai repository collegati di seguito.

Risorse#

SCAIL 2/SCAIL 2 Multi-role Reference Action Transfer Workflow Source
- Documenti / Note di rilascio: SCAIL 2 Multi-role Reference Action Transfer Workflow Source

Nota: L'uso dei modelli, dei set di dati e del codice di riferimento è soggetto alle rispettive licenze e ai termini forniti dai loro autori e manutentori.

Want More ComfyUI Workflows?

LTX 2.3 MSR | Generatore Video Multi-Soggetto

Mantiene ogni personaggio coerente in scene video complesse.

HunyuanCustom | Generatore di Video Multi-Soggetto

Crea video a doppio soggetto con eccezionale preservazione dell'identità.

Bernini Video Edit Pro | Generatore Multimodale

Trasforma i tuoi video in capolavori intelligenti consapevoli dell'identità.

LTX 2.3 IC-LoRA | Generatore Video AI con Tracciamento del Movimento

Strumento video guidato dal movimento V2V per creazioni AI ultra-precise e senza stile

WAN 2.2 Smooth Workflow v5.0 | Generatore Video AI

Trasforma testo o immagini in brevi video fluidi all'istante.

LTX 2.3 Primo Ultimo Frame | Generatore Video Senza Soluzione di Continuità

Trasforma i keyframe in transizioni video ultra-fluide e realistiche velocemente.

AnimateDiff + ControlNet TimeStep KeyFrame | Animazione morfologica

Imposta i fotogrammi chiave di ControlNet Timestep, come il primo e l'ultimo fotogramma, per creare animazioni di trasformazione.

Character AI Ovi | Generatore di Avatar Parlanti

Trasforma qualsiasi foto in avatar parlanti realistici con emozione e voce.

Supporto

Risorse

Legale

RunComfy

RunComfy è la piattaforma principale ComfyUI che offre ComfyUI online ambiente e servizi, insieme a workflow di ComfyUI con visuali mozzafiato. RunComfy offre anche AI Models, consentire agli artisti di sfruttare gli ultimi strumenti di AI per creare arte incredibile.

SCAIL 2 Trasferimento Azione di Riferimento Multi-ruolo | Animazione Multi-Personaggio