LTX 2.3 MSR fluxo de trabalho de vídeo de identidade multi-sujeito para ComfyUI#
Este fluxo de trabalho transforma várias referências de personagens ou objetos em um único vídeo consistente e pronto para histórias usando LTX 2.3 MSR. Preserva a identidade entre múltiplos sujeitos enquanto aproveita o modelo audiovisual LTX‑2.3 para movimento, cinematografia e som sincronizado. Criadores podem combinar até quatro imagens de sujeitos mais um fundo, então guiar a cena com prompts para diálogo, tomadas de grupo e sequências de estilo de vida dinâmicas.
Construído para contadores de histórias, anunciantes e criadores sociais, o gráfico monta referências em um guia MSR, injeta identidade via uma passagem LoRA condicionada por imagem, e amostra um latente audiovisual que decodifica para quadros e áudio opcional. LTX 2.3 MSR é a âncora para a fidelidade de identidade; o restante do pipeline lida com composição, orientação de movimento e exportação.
Modelos chave no fluxo de trabalho Comfyui LTX 2.3 MSR#
- LTX‑2.3 22B destilado (1.1) por Lightricks. O modelo base de fundação audiovisual que gera movimento, visuais e áudio sincronizado. Os pesos são publicados no Hugging Face sob LTX‑2.3. Lightricks/LTX-2.3
- Gemma 3 12B Instruct codificador de texto (fp4 misto). Usado para codificação de prompts na pilha LTX para traduzir texto em sinais de condicionamento para geração. Empacotado com os ativos LTX para ComfyUI. Comfy-Org/ltx-2
- LTX 2.3 MSR LoRA (Licon MSR V1). Um LoRA de Referência Multi-Sujeito especializado para LTX‑2.3 que fixa múltiplas identidades de uma vez, estabilizando rostos, roupas e características de objetos em todo o clipe. liconstudio/ComfyUI-Licon-MSR
- LTX‑2 Áudio VAE. Fornece o espaço latente de áudio e decodificação usado ao gerar ou anexar som sincronizado com ativos LTX‑2.x. Comfy-Org/ltx-2
Como usar o fluxo de trabalho Comfyui LTX 2.3 MSR#
Este gráfico tem três fases: construir um guia MSR a partir de referências, condicionar o latente de vídeo com orientação de múltiplas imagens e prompts, então amostrar e decodificar para quadros e áudio.
- Comfig
- Defina sua
largura,altura, total dequadros, efpsnos nós de configuração. Estes alimentam os latentes de vídeo e áudio vazios e a etapa de exportação, mantendo o tempo consistente do condicionamento até o render final. - Escolha aspecto e duração que se encaixem em sua história. Contagens de quadros mais altas aumentam a continuidade do movimento, mas também VRAM e tempo de execução.
- Defina sua
- Carregadores de referência
- Carregue até quatro imagens de sujeitos (
img1,img2,img3,img4) e um fundo (bg). Estes mapeiam para gettersrefimg1..4erefbgpara que você possa trocar rapidamente as fontes sem refazer a fiação. - Use imagens claras e bem iluminadas com o sujeito centralizado e desobstruído. Para roupas ou adereços que você deseja preservar, certifique-se de que estejam visíveis em pelo menos uma referência.
- Carregue até quatro imagens de sujeitos (
- Compositor MSR
LiconMSR(#28) monta as referências de sujeitos e o fundo em uma única saída de imagem MSR. Isso se torna o roteiro de identidade visual para LTX 2.3 MSR, alinhando características faciais, trajes e detalhes de objetos antes da amostragem.- Um pequeno
VHS_VideoCombine(#66) cria uma prévia rápida de baixa FPS a partir da saída MSR para que você possa verificar a composição antes de executar o render completo.
- Condicionamento de múltiplos guias
LTXVAddGuideMulti(#108) ingere até cinco imagens (seus quatro sujeitos mais o fundo) junto com os prompts positivos e negativos para produzir um latente inicial de vídeo com orientação espacial e de aparência.- O texto do prompt positivo descreve cena, câmera e vibe; texto negativo evita artefatos e aparências fora de estilo.
LTXVConditioning(#7) anexa seufpspara que o tempo de movimento corresponda ao exportador.
- Controle de identidade LoRA
- O LTX 2.3 MSR LoRA é carregado no modelo, e
LTXAddVideoICLoRAGuide(#9) aplica uma passagem LoRA condicionada por imagem usando a imagem MSR. Isso reforça a identidade entre os quadros sem congelar o movimento. - Use esta etapa para equilibrar a força de identidade com liberdade para movimento natural e expressões.
- O LTX 2.3 MSR LoRA é carregado no modelo, e
- Amostragem
- A pilha de amostradores usa
CFGGuider(#37),KSamplerSelect(#13),ManualSigmas(#27), eRandomNoise(#15) alimentandoSamplerCustomAdvanced(#16). O resultado é um latente audiovisual conjunto que reflete suas referências, prompts e restrições MSR. - Se você precisar de novas variações, mude a semente de ruído ou amostrador enquanto mantém as referências e configurações MSR fixas para consistência.
- A pilha de amostradores usa
- Orientação de corte e decodificação
LTXVCropGuides(#17) ajusta o latente de vídeo para o tamanho de quadro alvo, evitando cortes indesejados. Os latentes de vídeo e áudio são então divididos porLTXVSeparateAVLatent(#24).VAEDecode(#38) converte latentes de vídeo para quadros;LTXVAudioVAEDecode(#25) reconstrói o áudio.
- Exportar
VHS_VideoCombine(#96) monta quadros e áudio opcional em H.264 MP4 nofpsescolhido, usando seufilename_prefix. Este é o vídeo final produzido pelo fluxo de trabalho LTX 2.3 MSR.
Nós chave no fluxo de trabalho Comfyui LTX 2.3 MSR#
LiconMSR (#28)#
Monta de 1 a 4 referências de sujeitos mais um fundo em um único guia MSR. Defina largura e altura para corresponder ao seu canvas alvo para que o guia composto e os quadros finais se alinhem. Se você perceber desvio de identidade, reveja as referências de entrada ou aumente a proeminência dos sujeitos principais em suas imagens fonte.
LTXVAddGuideMulti (#108)#
Combina múltiplas imagens de orientação com seus prompts para formar o latente inicial de vídeo. Use para priorizar quais referências dominam a cena favorecendo ligeiramente os sujeitos principais. Mantenha a orientação do fundo ativa para ambientes estáveis e menos saltos de cena.
LTXAddVideoICLoRAGuide (#9)#
Injeta o MSR LoRA condicionado por imagem usando a imagem MSR composta. Aumente força para apertar a preservação de identidade para rostos, trajes ou adereços; reduza se o movimento parecer muito restrito. As escolhas de corte devem refletir onde os sujeitos aparecem com mais frequência no quadro.
CFGGuider (#37)#
Controla quão fortemente o amostrador segue seus prompts. Valores cfg mais altos melhoram a aderência à intenção textual, mas podem reduzir a variedade; valores moderados mantêm uma aparência natural enquanto honram a orientação MSR.
SamplerCustomAdvanced (#16)#
Executa o processo de remoção de ruído usando seu amostrador escolhido, sigmas e semente de ruído. Amostradores no estilo Euler ou DPM funcionam bem com LTX‑2.3; explore sementes para alternar enquanto mantém as mesmas referências para reter identidade.
VHS_VideoCombine (#96)#
Constrói o MP4 final com áudio opcional. Combine taxa_de_quadros com a etapa de condicionamento e defina um filename_prefix claro para versionamento. Use a pré-visualização deste nó para revisar o ritmo e a consistência de identidade antes de compartilhar.
Extras opcionais#
- Prepare referências com ângulos neutros, de frente e mínima oclusão; adicione um segundo ângulo para penteados ou acessórios complexos.
- Mantenha as referências de guarda-roupa e adereços grandes o suficiente para que texturas e logos sejam visíveis; evite borrões de movimento pesado em imagens fonte.
- Quando a identidade estiver perfeita, mas o movimento estiver rígido, diminua ligeiramente a força do guia LoRA na etapa LTX 2.3 MSR e adicione dicas de prompt para movimento.
- Para histórias mais longas, aumente
quadrose mantenhafpsconstante para preservar o tempo; para edições mais rápidas, aumentefpse encurtequadros. - Use uma referência de fundo semelhante em iluminação e perspectiva à sua cena pretendida para menos inconsistências.
Agradecimentos#
Este fluxo de trabalho implementa e constrói sobre os seguintes trabalhos e recursos. Agradecemos ao projeto LTX pelo fluxo de trabalho LTX 2.3 MSR (Referência Multi-Sujeito) por suas contribuições e manutenção. Para detalhes autoritativos, consulte a documentação original e repositórios vinculados abaixo.
Recursos#
- LTX/LTX 2.3 MSR Workflow Source
- Docs / Release Notes: RunningHub post
Nota: O uso dos modelos, conjuntos de dados e código referenciados está sujeito às respectivas licenças e termos fornecidos por seus autores e mantenedores.

