SCAIL 2 다중 역할 참조 동작 전송 in ComfyUI

ComfyUI SCAIL 2 Multi-role Reference Action Transfer Workflow

SCAIL 2 Multi-role Reference Action Transfer in ComfyUI | Coordinated Motion Transfer

Want to run this workflow?

Fully operational workflows
No missing nodes or models
No manual setups required
Features stunning visuals

ComfyUI SCAIL 2 Multi-role Reference Action Transfer Examples

SCAIL 2 다중 역할 참조 동작 전송: ComfyUI를 위한 다중 캐릭터, 정체성 유지 모션 전송#

이 워크플로우는 SCAIL 2 다중 역할 참조 동작 전송을 제공합니다: 드라이빙 비디오를 가져와 하나 이상의 참조 캐릭터에게 동작을 전송하면서 각 주제의 시각적 정체성을 유지합니다. 모션 전송 및 전체 캐릭터 교체를 지원하며, 다중 이미지 정체성 참조를 처리하고 스토리텔링, 대화, 그룹 공연에 적합한 일관된 다중 역할 장면을 제작합니다.

SCAIL_2 임베딩, CLIP Vision 지침, 세분화 기반 역할 마스크를 사용한 Wan 2.1 비디오 생성에 기반하여 파이프라인은 전체 클립에 걸쳐 일관된 정체성, 자연스러운 동작, 제어 가능한 상호작용에 중점을 둡니다.

Comfyui SCAIL 2 다중 역할 참조 동작 전송 워크플로우의 주요 모델#

Wan 2.1 비디오 백본을 ComfyUI-WanVideoWrapper를 통해 제공합니다. 생성기는 SCAIL_2 이미지 임베딩, 시각적 컨디셔닝 및 프롬프트 텍스트에서 비디오 프레임을 합성하며 긴 컨텍스트와 효율적인 메모리 사용을 처리합니다. GitHub
CLIP Vision 인코더. 주 참조 이미지 또는 콜라주에서 강력한 시각적 임베딩을 제공하여 생성 중 정체성과 외모를 유도합니다. 이미지-텍스트 표현 학습에 대한 배경은 CLIP 논문을 참조하세요. arXiv
mT5 패밀리 텍스트 인코더. 프레임 전반에 걸쳐 원하는 주제와 동작으로 콘텐츠를 편향시키기 위한 긍정적 및 부정적 프롬프트를 인코딩합니다. arXiv
비디오 객체 추적을 위한 Segment Anything 스타일 세분화. 이 워크플로우는 SAM 패밀리 체크포인트를 사용하여 주제를 감지하고 추적하며 다중 캐릭터 동작 전송을 구동하는 역할별 마스크를 생성합니다. SAM 세분화에 대한 배경: GitHub
LoRA 어댑터. 선택적 어댑터는 전체 모델을 재훈련하지 않고 정체성 유지 및 동작 충실도에 대해 생성기를 전문화합니다. LoRA 튜닝에 대한 배경: arXiv
FeiHou Toolbox 유틸리티. 콜라주 및 마스크 유틸리티는 다중 이미지 정체성 참조 및 SCAIL 2를 위한 색상 역할 인식 마스크를 용이하게 합니다. GitHub
KJNodes 이미지 유틸리티. 고품질 리사이징은 입력 및 마스크를 비디오 차원에 맞춰 안정적인 샘플링을 보장합니다. GitHub

Comfyui SCAIL 2 다중 역할 참조 동작 전송 워크플로우 사용법#

이 워크플로우는 네 가지 주요 단계로 구성됩니다: 자산 및 생성기 로드, 다중 역할 참조 및 마스크 구축, SCAIL_2 임베딩 컴파일, 그런 다음 최종 비디오를 샘플링하고 내보내기. 그룹은 위에서 아래로 실행되며 각 단계에서 유용한 미리보기를 제공합니다.

모델 로딩 영역#

이 영역은 Wan 2.1 백본과 그 VAE를 준비합니다. WanAnimatePlus ModelLoader (#37)를 사용하여 기본 모델과 정밀도를 선택하고, WanAnimatePlus VAELoader (#71)로 일치하는 VAE를 로드합니다. 정체성이나 동작을 더욱 편향시키려면 WanAnimatePlus LoraSelectMulti (#66)를 통해 어댑터를 추가한 다음 WanAnimatePlus SetLoRAs (#69)를 통해 모델에 적용하세요. 선택적 WanVideoTorchCompileSettings (#72)는 주의 블록을 컴파일하여 지연 시간을 줄일 수 있습니다.

단일 이미지 로드#

단일 이미지 로드 그룹에서 LoadImage로 주요 정체성 이미지를 제공하세요. 이 이미지는 주 피사체의 외모를 고정합니다. 여러 정체성 또는 역할의 콜라주를 구축하려면 콜라주 입력 대신 단일 이미지를 경로로 변경하기 위해 빠른 토글 그룹에서 전환하세요.

콜라주 입력#

AutoRefCollage (#370)를 사용하여 여러 참조 이미지를 하나의 레이아웃으로 조립하고, 사람을 자동으로 감지하여 깨끗한 캔버스에 크롭을 배치합니다. 콜라주는 다중 역할 정체성 보드로 작용하며, 각 주제가 SCAIL 2 다중 역할 참조 동작 전송 단계에 대한 외모 단서를 제공합니다. 프리뷰 노드는 조립된 콜라주를 보여주어 다음 단계로 진행하기 전에 프레이밍을 확인할 수 있게 합니다.

다중 이미지 참조#

여기에서 LoadImage로 세 개 이상의 큐레이션된 초상화를 로드하고 ImageBatchMulti (#331)를 사용하여 포장할 수 있습니다. ImageResizeKJv2는 의도된 비디오 해상도에 맞춰 그들의 크기를 정렬합니다. 이 경로는 외모 모델에 정보를 제공하는 정체성과 각도를 더 엄격하게 제어하고자 할 때 유용합니다.

비디오 로드#

VHS_LoadVideo (#297)는 드라이빙 비디오와 오디오를 가져옵니다. 더 부드러운 동작을 위해 목표 프레임 속도를 강제하고, 총 프레임 수를 제한하여 지속 시간을 제한하며, 도입부 세그먼트를 건너뛰거나 더 빠른 반복을 위해 N번째 프레임마다 샘플링할 수 있습니다. 별도의 "참조 비디오 미리보기" 하위 파이프라인은 로드된 프레임을 결합하여 트래킹 전에 클립이 올바르게 보이는지 확인할 수 있게 합니다.

마스크 영역#

이 워크플로우는 주제를 감지하고 추적하여 SCAIL 2 다중 역할 참조 동작 전송을 구동하는 역할 인식 마스크를 생성합니다. 세 개의 SAM3_VideoTrack 노드 (#315, #316, #306)는 드라이빙 비디오, 참조 이미지, 선택적 접두사 프레임에서 객체를 추적합니다. SCAIL2ColoredMaskV2 (#354)는 이러한 트랙을 세 가지 출력으로 융합합니다: 포즈 비디오 마스크, 색상 참조 이미지 마스크 및 따뜻한 시작을 위한 접두사 마스크. 단일 역할 및 다중 역할 마스크의 미리보기는 샘플링 전에 각 색상이 올바른 캐릭터에 해당하는지 확인할 수 있게 합니다.

모션 전송 - 임베딩 처리#

WanAnimatePlus SCAIL_2 Embeds (#342)는 입력을 SCAIL_2 이미지 임베딩으로 변환하여 생성기에 사용합니다. VAE 기능, CLIP Vision 임베딩, 참조 이미지 또는 콜라주, 배경 교체 (선택적), 추적된 포즈 프레임 및 색상 마스크를 결합합니다. 두 가지 모드로 실행할 수 있습니다: 모션 전송 (참조 외모를 사용하여 드라이빙 동작) 또는 캐릭터 교체 (입력 비디오의 사람을 참조로 교체). 주요 참조 배경을 유지하고 싶을 때 옵션도 있으며, 긴 또는 고해상도 실행을 위해 접두사 프레임을 자르거나 타일링할 수 있습니다.

샘플링 영역#

WanVideoTextEncodeCached는 프롬프트를 인코딩하고, WanVideoContextOptions (#290)는 프레임 전반에 걸쳐 시간 창을 제어합니다. WanAnimatePlus SamplerSettings (#332)는 모델, SCAIL_2 이미지 임베드 및 텍스트 임베드와 함께 샘플링 하이퍼파라미터 및 일정을 수집합니다; WanAnimatePlus SamplerFromSettings (#311)는 생성을 수행합니다. WanAnimatePlus Decode (#267)는 잠재를 프레임으로 변환합니다; 메모리 제한이 있는 경우 VAE 타일링을 활성화할 수 있습니다. 비디오는 미리보기 영역에서 VHS_VideoCombine을 통해 마무리되며, 빠른 디버깅을 위해 마스크 전용 클립을 내보낼 수 있는 동반 결합을 제공합니다.

빠른 토글 및 비디오 차원#

"true = 캐릭터 교체 | false = 모션 전송" 스위치 (#341)는 역할이 하류에서 처리되는 방식을 즉시 변경합니다. 너비 및 높이 상수는 모든 리사이즈 및 마스크 노드에 피드를 제공하여 형태가 정렬되도록 합니다. FastGroupsBypassSwitch (#351)를 사용하면 단일 이미지와 콜라주 입력 간에 배선을 변경하지 않고 전환할 수 있습니다.

Comfyui SCAIL 2 다중 역할 참조 동작 전송 워크플로우의 주요 노드#

`SCAIL2ColoredMaskV2` (#354)#

드라이빙 비디오, 참조 이미지 및 선택적 접두사 프레임에서 객체 트랙을 병합하여 역할 인식 마스크를 생성합니다. object_indices를 사용하여 추적된 ID 중 어떤 것을 역할로 만들지 선택하고, prefix_mask_mode를 사용하여 여러 캐릭터를 동시에 구동할 때 단일 이미지, 다중 색상 레이아웃을 지정합니다. 마스크 의미가 임베딩 단계와 일치하도록 replacement_mode를 전역 토글과 일관되게 유지하세요.

`WanAnimatePlus SCAIL_2 Embeds` (#342)#

VAE, CLIP Vision, 다중 이미지 참조, 포즈 프레임 및 마스크를 생성기를 위한 SCAIL_2 임베딩으로 융합합니다. 정체성이 흐려질 때 ref_strength를 증가시키고, 모션 충실도가 낮을 때 pose_strength를 증가시키세요. 참조 배경을 유지해야 하는 장면의 경우 배경 보존을 활성화하고, 단일 접두사 프레임에서 시작할 때는 단일 프레임 접두사 인코딩을 활성화하세요.

`SAM3_VideoTrack` (#315, #316, #306)#

프레임 전반에 걸쳐 주제를 감지하고 추적하여 마스크 생성기를 피드합니다. 캐릭터를 감지하지 못할 경우 detection_threshold를 낮추거나 더 많은 max_objects를 허용하세요; 추적이 불안정할 경우 detect_interval을 증가시켜 재감지 떨림을 줄이세요. 각 역할이 시간에 따라 안정적으로 유지되는지 확인하려면 항상 색상 마스크 미리보기를 검토하세요.

`VHS_LoadVideo` (#297)#

드라이빙 클립을 제어합니다. force_rate는 작동하는 FPS를 설정하고, frame_load_cap은 지속 시간을 제한하며, skip_first_frames는 도입부를 자르고, select_every_nth는 더 빠른 테스트를 위해 프레임을 하위 샘플링할 수 있게 합니다. 이러한 제어는 컨텍스트 창과 메모리에 직접 영향을 미치므로 샘플링 전에 조정하세요.

`WanAnimatePlus SamplerSettings` (#332)#

핵심 생성 노브를 보유합니다. steps, scheduler, 및 cfg는 세부 사항, 부드러움 및 프롬프트에 대한 준수를 조정합니다; denoise_strength는 SCAIL_2 지침이 프레임을 재구성할 수 있는 정도를 지배합니다. 다중 캐릭터 장면을 세밀하게 조정할 때 재현성을 위해 seed 입력을 사용하세요.

`WanAnimatePlus BlockSwap` (#67)#

샘플링 중 계산 블록을 교환하는 선택적 메모리 절약 장치입니다. VRAM 예산이 빡빡하거나 긴 프레임 범위에서는 스왑을 증가시켜 메모리 부족 오류를 방지하세요; VRAM이 높은 GPU에서는 속도를 위해 스왑을 줄이거나 비활성화하세요.

`WanAnimatePlus Decode` (#267)#

잠재를 RGB 프레임으로 디코딩합니다. 해상도나 클립 길이가 높고 디코드 OOM이 발생할 경우 타일드 VAE 디코딩을 활성화하고 타일 크기 및 스트라이드가 타일이 깔끔하게 겹치도록 적절하게 설정하세요.

선택적 추가 항목#

다중 캐릭터 클립의 경우 각 역할에 적어도 하나의 깨끗하고 정면을 향하는 초상화를 제공하고, 콜라주 전반에 걸쳐 조명을 일관되게 유지하세요.
먼저 모션 전송 모드로 시작하여 마스크 및 모션 품질을 검증한 다음, 퍼포머를 완전히 교체해야 하는 경우 캐릭터 교체 모드로 전환하세요.
긴 렌더링 전에 역할 할당 및 색상 안정성을 확인하기 위해 마스크 전용 비디오 미리보기를 사용하세요.
모든 입력을 동일한 너비와 높이로 정렬하세요; 외부 도구 대신 제공된 리사이즈 노드를 사용하여 미세한 형태 불일치를 피하세요.
결과가 지나치게 스타일화되거나 정체성에서 벗어난 것처럼 보일 경우 임베딩 단계에서 프롬프트 강도를 낮추고 참조 강조를 높이세요; 어댑터를 활성화한 경우 LoRA 믹스를 조정하세요.
긴 클립은 WanVideoContextOptions에서 더 큰 컨텍스트 창의 혜택을 받을 수 있습니다; 메모리를 균형 있게 하기 위해 VAE 타일링을 활성화하고 필요한 경우 적당한 블록 스왑을 사용하세요.

이 SCAIL 2 다중 역할 참조 동작 전송 워크플로우는 다중 역할 모션 전송을 반복 가능하고 예측 가능하게 만듭니다: 명확한 참조를 준비하고, 마스크를 확인한 다음, 정체성을 충실히 유지하는 자연스러운 동작을 가진 캐릭터에 대해 안정적인 설정으로 샘플링하세요.

감사의 글#

이 워크플로우는 다음의 작업 및 리소스를 구현하고 기반으로 합니다. 우리는 SCAIL 2 Multi-role Reference Action Transfer Workflow Source에 감사드리며 그들의 기여와 유지에 감사드립니다. 권위 있는 세부 사항은 아래에 링크된 원본 문서 및 저장소를 참조하세요.

리소스#

SCAIL 2/SCAIL 2 Multi-role Reference Action Transfer Workflow Source
- 문서 / 릴리스 노트: SCAIL 2 Multi-role Reference Action Transfer Workflow Source

참고: 참조된 모델, 데이터셋 및 코드의 사용은 해당 저자 및 유지 관리자가 제공한 라이선스 및 약관에 따릅니다.

Want More ComfyUI Workflows?

LTX 2.3 MSR | 다중 주제 비디오 생성기

복잡한 비디오 장면 전반에 걸쳐 모든 캐릭터의 일관성을 유지합니다.

HunyuanCustom | 다중 주제 비디오 생성기

탁월한 정체성 보존을 통해 이중 주제 비디오를 생성하십시오.

Bernini Video Edit Pro | Multimodal Generator

비디오를 스마트한 정체성 인식 걸작으로 변환합니다.

LTX 2.3 IC-LoRA | 모션 트랙 AI 비디오 생성기

초정밀, 스타일 자유 AI 생성을 위한 V2V 모션 기반 비디오 도구

WAN 2.2 원활한 워크플로우 v5.0 | AI 비디오 생성기

텍스트나 이미지를 즉시 부드러운 짧은 비디오로 변환하세요.

LTX-2.3 ICLoRA LipDub 워크플로우 | 립싱크 비디오 생성기

어떤 비디오든 완벽한 립싱크 걸작으로 변환하세요.

UNO | 일관된 주제 및 객체 생성

주제 및 객체 참조에서 안정적이고 일관된 이미지를 생성합니다.

DreamO | 통합 다중 작업 이미지 맞춤화 프레임워크

1-3개의 참조에서 ID, 스타일, 착용 및 다중 조건 이미지 생성 수행

팔로우하기

지원

리소스

법적 고지

RunComfy

RunComfy는 최고의 ComfyUI 플랫폼으로서 ComfyUI 온라인 환경과 서비스를 제공하며 ComfyUI 워크플로우 멋진 비주얼을 제공합니다. RunComfy는 또한 제공합니다 AI Models, 예술가들이 최신 AI 도구를 활용하여 놀라운 예술을 창조할 수 있도록 지원합니다.

SCAIL 2 다중 역할 참조 동작 전송 | 다중 캐릭터 애니메이션