LTX 2.3 MSR Workflow in ComfyUI | 다중 주제 정체성 비디오

ComfyUI LTX 2.3 MSR 워크플로우

LTX 2.3 MSR Workflow in ComfyUI | Multi-Subject Identity Video

이 워크플로우를 실행하고 싶으신가요?

완전히 작동 가능한 워크플로우
누락된 노드 또는 모델 없음
수동 설정 불필요
멋진 시각 효과 제공

ComfyUI LTX 2.3 MSR 예제

ComfyUI용 LTX 2.3 MSR 다중 주제 정체성 비디오 워크플로우#

이 워크플로우는 LTX 2.3 MSR을 사용하여 여러 캐릭터 또는 객체 참조를 단일 일관성 있는 스토리 준비 비디오로 변환합니다. LTX-2.3 오디오-비주얼 모델을 활용하여 여러 주제 간의 정체성을 보존하면서 동작, 영화 촬영 및 동기화된 사운드를 제공합니다. 창작자는 최대 네 개의 주제 이미지와 배경을 결합한 후, 대화, 그룹 샷 및 동적 라이프스타일 시퀀스를 위한 프롬프트로 장면을 안내할 수 있습니다.

스토리텔러, 광고주 및 소셜 창작자를 위해 구축된 이 그래프는 참조를 MSR 가이드로 구성하고, 이미지 조건부 LoRA 패스를 통해 정체성을 주입하며, 오디오-비주얼 잠재를 샘플링하여 프레임 및 선택적 오디오로 디코딩합니다. LTX 2.3 MSR은 정체성 충실도의 앵커 역할을 하며, 나머지 파이프라인은 구성, 동작 안내 및 내보내기를 처리합니다.

ComfyUI LTX 2.3 MSR 워크플로우의 주요 모델#

LTX-2.3 22B distilled (1.1) by Lightricks. 동작, 비주얼 및 동기화된 오디오를 생성하는 기본 오디오-비주얼 기초 모델입니다. Weights는 LTX-2.3에서 Hugging Face에 게시되었습니다. Lightricks/LTX-2.3
Gemma 3 12B Instruct text encoder (fp4 mixed). LTX 스택에서 텍스트를 생성 조건 신호로 번역하기 위해 프롬프트 인코딩에 사용됩니다. ComfyUI용 LTX 자산과 함께 패키지됩니다. Comfy-Org/ltx-2
LTX 2.3 MSR LoRA (Licon MSR V1). LTX-2.3에 특화된 다중 주제 참조 LoRA로, 여러 정체성을 한 번에 고정하여 전체 클립 전반에 걸쳐 얼굴, 의상 및 객체 특징을 안정화합니다. liconstudio/ComfyUI-Licon-MSR
LTX-2 Audio VAE. LTX-2.x 자산과 함께 동기화된 사운드를 생성하거나 부착할 때 사용되는 잠재 오디오 공간과 디코딩을 제공합니다. Comfy-Org/ltx-2

ComfyUI LTX 2.3 MSR 워크플로우 사용 방법#

이 그래프는 세 단계로 구성됩니다: 참조에서 MSR 가이드를 작성하고, 다중 이미지 안내 및 프롬프트로 비디오 잠재를 조건화한 후, 샘플링 및 프레임과 오디오로 디코딩합니다.

Comfig
- 구성 노드에서 width, height, 전체 frames, fps를 설정합니다. 이는 빈 비디오 및 오디오 잠재와 내보내기 단계를 공급하며, 조건화부터 최종 렌더링까지 타이밍을 일관되게 유지합니다.
- 이야기와 맞는 비율과 지속 시간을 선택하세요. 프레임 수가 많을수록 동작 연속성이 증가하지만 VRAM 및 실행 시간도 증가합니다.
참조 로더
- 최대 네 개의 주제 이미지 (img1, img2, img3, img4)와 배경 (bg)을 로드합니다. 이는 refimg1..4 및 refbg getter에 매핑되어 소스를 빠르게 교체할 수 있습니다.
- 명확하고 잘 조명된 이미지로 주제가 중앙에 있고 방해받지 않도록 하세요. 보존하고자 하는 의상이나 소품은 최소한 하나의 참조에서 보이도록 하세요.
MSR 컴포저
- LiconMSR (#28)은 주제 참조와 배경을 단일 MSR 이미지 출력으로 조립합니다. 이는 LTX 2.3 MSR의 시각적 정체성 청사진이 되어, 샘플링 전에 얼굴 특징, 복장 및 객체 세부 사항을 정렬합니다.
- 작은 VHS_VideoCombine (#66)은 MSR 출력에서 빠른 저 FPS 미리보기를 생성하여 전체 렌더링을 실행하기 전에 구성을 점검할 수 있습니다.
다중 가이드 조건화
- LTXVAddGuideMulti (#108)은 최대 다섯 개의 이미지(네 개의 주제와 배경)를 긍정 및 부정 프롬프트와 함께 수집하여 공간 및 외관 안내와 함께 초기 비디오 잠재를 생성합니다.
- 긍정적 프롬프트 텍스트는 장면, 카메라 및 분위기를 설명하며, 부정적 텍스트는 아티팩트와 스타일 벗어남을 피합니다. LTXVConditioning (#7)은 fps를 붙여서 동작 타이밍이 익스포터와 일치하도록 합니다.
LoRA 정체성 제어
- LTX 2.3 MSR LoRA는 모델에 로드되고, LTXAddVideoICLoRAGuide (#9)는 MSR 이미지를 사용하여 이미지 조건부 LoRA 패스를 적용합니다. 이는 프레임 전반에 걸쳐 정체성을 강화하면서 동작을 고정하지 않습니다.
- 이 단계를 사용하여 자연스러운 움직임과 표현을 위해 정체성 강도를 균형 있게 조절하세요.
샘플링
- 샘플러 스택은 CFGGuider (#37), KSamplerSelect (#13), ManualSigmas (#27), RandomNoise (#15)를 사용하여 SamplerCustomAdvanced (#16)에 공급합니다. 결과는 참조, 프롬프트 및 MSR 제약을 반영하는 공동 오디오-비주얼 잠재입니다.
- 새로운 변형이 필요하면, 참조와 MSR 설정을 고정하여 일관성을 유지하면서 노이즈 시드나 샘플러를 변경하세요.
자르기 안내 및 디코드
- LTXVCropGuides (#17)는 비디오 잠재를 목표 프레임 크기에 맞추어 조정하여 불필요한 트림을 피합니다. 그런 다음 LTXVSeparateAVLatent (#24)로 비디오 및 오디오 잠재를 분할합니다.
- VAEDecode (#38)는 비디오 잠재를 프레임으로 변환하고; LTXVAudioVAEDecode (#25)는 오디오를 재구성합니다.
내보내기
- VHS_VideoCombine (#96)은 프레임과 선택적 오디오를 H.264 MP4로 조립하여 선택한 fps로 내보냅니다. 이는 LTX 2.3 MSR 워크플로우에서 생성된 최종 비디오입니다.

Comfyui LTX 2.3 MSR 워크플로우의 주요 노드#

`LiconMSR` (#28)#

1–4개의 주제 참조와 배경을 단일 MSR 가이드로 조립합니다. 구성된 가이드와 최종 프레임이 정렬되도록 목표 캔버스에 맞게 width와 height를 설정하세요. 정체성 드리프트가 보이면 입력 참조를 다시 방문하거나 소스 이미지에 주요 주제가 더 두드러지게 나타나도록 증가시키세요.

`LTXVAddGuideMulti` (#108)#

여러 안내 이미지를 프롬프트와 결합하여 초기 비디오 잠재를 형성합니다. 이를 사용하여 어느 참조가 장면을 지배할지를 우선시하고, 배경 안내를 활성화하여 안정적인 환경과 장면 점프를 줄이세요.

`LTXAddVideoICLoRAGuide` (#9)#

조립된 MSR 이미지를 사용하여 이미지 조건부 MSR LoRA를 주입합니다. 얼굴, 복장 또는 소품의 정체성 보존을 강화하기 위해 strength를 증가시키고, 동작이 너무 제한되면 줄이세요. 자르기 선택은 주제가 프레임에 가장 자주 나타나는 위치를 반영해야 합니다.

`CFGGuider` (#37)#

샘플러가 프롬프트를 얼마나 강하게 따르는지를 제어합니다. 높은 cfg는 텍스트 의도에 대한 준수를 향상시키지만 다양성을 줄일 수 있습니다; 중간 값은 자연스러운 외관을 유지하면서 MSR 안내를 존중합니다.

`SamplerCustomAdvanced` (#16)#

선택한 샘플러, 시그마 및 노이즈 시드를 사용하여 디노이징 프로세스를 실행합니다. Euler 또는 DPM 스타일 샘플러는 LTX-2.3과 잘 작동하며, 동일한 참조를 유지하여 정체성을 유지하면서 시드를 탐색하세요.

`VHS_VideoCombine` (#96)#

선택적 오디오와 함께 최종 MP4를 구성합니다. frame_rate를 조건화 단계에 맞추고 버전 관리를 위한 명확한 filename_prefix를 설정하세요. 이 노드의 미리보기를 사용하여 공유 전에 속도와 정체성 일관성을 검토하세요.

선택적 추가 사항#

중립적이고 정면을 향한 각도로 최소한의 가림이 있는 참조를 준비하세요; 복잡한 헤어스타일이나 액세서리를 위해 두 번째 각도를 추가하세요.
의상 및 소품 참조는 텍스처와 로고가 보일 만큼 충분히 크게 유지하고, 소스 이미지에서 과도한 모션 블러를 피하세요.
정체성이 완벽하지만 동작이 경직된 경우, LTX 2.3 MSR 단계에서 LoRA 가이드 강도를 약간 낮추고 동작을 위한 프롬프트 큐를 추가하세요.
더 긴 스토리를 위해 frames를 늘리고 fps를 일정하게 유지하여 타이밍을 보존하세요; 더 빠른 편집을 위해 fps를 높이고 frames를 줄이세요.
의도된 장면과 조명 및 관점이 유사한 배경 참조를 사용하여 불일치를 줄이세요.

감사#

이 워크플로우는 다음 작업 및 리소스를 구현하고 구축합니다. 우리는 LTX 프로젝트의 LTX 2.3 MSR (다중 주제 참조) 워크플로우에 대한 기여 및 유지 관리를 진심으로 감사드립니다. 권위 있는 세부 사항은 아래에 연결된 원본 문서 및 저장소를 참조하세요.

리소스#

LTX/LTX 2.3 MSR 워크플로우 소스
- 문서 / 릴리즈 노트: RunningHub post

참고: 참조된 모델, 데이터세트 및 코드는 해당 작성자 및 유지 관리자가 제공하는 라이선스 및 조건을 따릅니다.

Want More ComfyUI Workflows?

HunyuanCustom | 다중 주제 비디오 생성기

탁월한 정체성 보존을 통해 이중 주제 비디오를 생성하십시오.

HiDream-I1 | T2I

17B 파라미터 모델을 사용한 고품질 이미지 생성.

ComfyUI Phantom | 주제에서 비디오로

Wan2.1 14B를 사용한 참조 기반 비디오 생성

Bernini Video Edit Pro | Multimodal Generator

비디오를 스마트한 정체성 인식 걸작으로 변환합니다.

SteadyDancer | 현실적인 이미지-비디오 생성기

초상화를 부드럽고 생동감 있는 동작 비디오로 즉시 변환합니다.

Segment Anything V2 (SAM2) | 비디오 세그먼테이션

비디오의 객체 세그먼테이션을 뛰어난 정확도로 제공합니다.

Stable Diffusion 3.5

고품질, 다양한 이미지 생성을 위한 Stable Diffusion 3.5 (SD3.5).

Hunyuan Video | 텍스트에서 비디오로

텍스트 프롬프트에서 비디오를 생성합니다.

팔로우하기

지원

리소스

법적 고지

RunComfy

RunComfy는 최고의 ComfyUI 플랫폼으로서 ComfyUI 온라인 환경과 서비스를 제공하며 ComfyUI 워크플로우 멋진 비주얼을 제공합니다. RunComfy는 또한 제공합니다 AI Models, 예술가들이 최신 AI 도구를 활용하여 놀라운 예술을 창조할 수 있도록 지원합니다.

LTX 2.3 MSR | 다중 주제 비디오 생성기