일관된 캐릭터 생성기 3.8: 초현실적이고 정체성이 일관된 AI 캐릭터를 한 장의 사진으로부터#
일관된 캐릭터 생성기 3.8은 단일 참조 이미지를 완전한 정체성 일관성 캐릭터 팩으로 전환하는 모듈식 ComfyUI 워크플로우입니다. 이 워크플로우는 속도와 반복성을 중시하며, 다양한 각도와 장면에서도 주제의 비율, 의상 및 얼굴 특징을 보존합니다.
Qwen‑Image‑Edit‑2511을 기반으로 구축된 이 버전은 풍부한 턴어라운드, 다양한 장면 변형, 클로즈업, 착용 및 포즈 경로, 데이터세트 내보내기 유틸리티를 추가합니다. 결과적으로 캐릭터 아티스트, 게임 개발자 및 초현실적이고 일관된 결과를 빠르게 필요로 하는 창작자를 위한 하나의 캔버스 시스템이 됩니다.
Comfyui 일관된 캐릭터 생성기 3.8 워크플로우의 주요 모델#
- Qwen-Image-Edit-2511 (GGUF) UNet. 참조 사진에서 정체성과 스타일을 고정하는 이미지 안내 생성기입니다. GGUF 가중치가 최적화된 "Qwen Image Edit" 노드를 통해 사용됩니다. unsloth/Qwen-Image-Edit-2511-GGUF
- Qwen 이미지 인코더 및 VAE. Qwen 이미지 편집 UNet과 쌍을 이루어 참조 이미지를 올바르게 해석하고 고품질 픽셀을 디코드하는 텍스트 인코더 및 VAE입니다. Comfy-Org/Qwen-Image_ComfyUI
- Qwen-Image-Edit-2511-Lightning LoRA. 정체성을 유지하면서 Qwen 이미지 편집을 가속화하고 안정화하는 경량 LoRA입니다. lightx2v/Qwen-Image-Edit-2511-Lightning
- FLUX.1‑dev 체크포인트. 스타일 인식 업스케일링 및 세련화를 위한 데이터세트 파이프라인에서 사용됩니다. Comfy-Org/flux1-dev
- USO FLUX 프로젝터 모델 패치. 스타일 일관성 세련화 및 데이터세트 준비를 위해 CLIP‑Vision 스타일 기능을 FLUX에 연결합니다. Comfy-Org/USO_1.0_Repackaged
- SigCLIP Vision 384. 데이터세트 경로에서 스타일 참조 및 안내를 위한 시각적 기능을 추출합니다. Comfy-Org/sigclip_vision_384
- Florence‑2‑FLUX‑Large. 데이터세트 내보내기를 위한 고품질 자동 캡션을 생성합니다. gokaygokay/Florence-2-Flux-Large
- 4x-UltraSharp 업스케일러. 데이터세트 흐름에서 사용되는 선명하고 자연스러운 업스케일링. 호환 가능한 업스케일러로 교체할 수 있습니다.
Comfyui 일관된 캐릭터 생성기 3.8 워크플로우 사용 방법#
전체 논리는 간단합니다: 깨끗한 참조 이미지를 가져와 캐릭터에 짧은 이름을 지정하고(폴더 및 캡션에 사용됨), 선택적으로 한 문장으로 스타일 프롬프트를 추가한 후 필요한 그룹을 실행합니다. 각 그룹은 독립적으로 트리거할 수 있으며, 클로즈업, 턴어라운드, 포즈, 장면 및 데이터세트 내보내기를 생성하여 시각적 일관성을 유지합니다.
모델 로드#
이 유틸리티 그룹은 Qwen 이미지 편집 인코더, 쌍을 이루는 VAE, CLIP 텍스트/비전 백본을 초기화합니다. Qwen-Image-Edit-2511 GGUF 가중치와 Lightning LoRA가 로드되어 결합되므로 수동 설정 없이 빠르게 반복할 수 있습니다. 체크포인트나 인코더를 교체하고 싶지 않다면 여기에 변경할 필요가 없습니다.
GGUF 모델#
이 그룹은 모든 생성 경로에서 사용하는 Qwen-Image-Edit-2511 GGUF UNet에 그래프를 지시합니다. Lightning LoRA가 단계를 가속화하는 동안 캔버스 전체에서 샘플링을 안정적으로 유지합니다. 정체성을 강화하는 백본으로 취급하십시오.
업스케일 모델#
FLUX.1‑dev 체크포인트, USO FLUX 프로젝터 모델 패치, CLIP‑Vision 인코더 및 선택한 업스케일러를 로드합니다. 이러한 자산은 주로 데이터세트 파이프라인 내에서 사용되어 더 선명하고 스타일 일관성이 있는 학습 이미지와 캡션을 생성합니다. 다른 업스케일러를 선호하거나 스타일 프로젝터를 교체해야 하는 경우를 제외하고 기본값을 그대로 두십시오.
캐릭터 턴어라운드#
단일 입력 이미지에서 깨끗한 다중 뷰 시트를 생성합니다. Qwen 인코더는 참조와 균일한 흰색 배경 정렬을 요청하는 짧은 지침에 따라 조건을 설정합니다. 장면 및 포즈를 실행하기 전에 빠른 정체성 확인을 원할 때 사용하십시오. 출력은 나중에 그룹에서 쉽게 재사용할 수 있도록 캐릭터 이름으로 저장됩니다.
클로즈업#
피부 톤, 얼굴 특징 및 미세 디테일을 고정하는 정면 중립 클로즈업을 생성합니다. 인코더는 텍스트보다 참조 이미지를 우선시하여 유사성을 유지합니다. 썸네일, ID 카드 또는 더 넓은 장면에 대한 준비 상태를 판단하는 데 사용하십시오.
프로필#
프로필 및 실루엣 확인을 위한 측면 뷰 클로즈업을 생성합니다. 프롬프트는 비율을 일관되게 유지하기 위해 깨끗한 프레이밍을 요청합니다. 귀, 코 및 턱선 모양을 확인하기 위해 전체 신체 촬영으로 이동하기 전에 이 작업을 실행하십시오.
뒤#
초상화 범위를 완성하기 위해 어깨 너머 또는 뒤쪽 뷰를 렌더링합니다. 이 작업은 특히 애니메이션이나 턴어라운드를 생성할 계획인 경우 머리카락 실루엣, 의복 솔기 및 뒤쪽 비율을 확인하는 데 유용합니다.
T-POSE#
리깅, 착용 또는 템플릿 작업을 위한 전체 신체 중립 T-포즈를 흰색으로 생성합니다. 동일한 참조로 조건이 설정되므로 비율과 의복이 드리프트 없이 전환됩니다. 움직임이나 스타일화된 포즈를 시도하기 전에 기본으로 사용하십시오.
모델 포즈#
착용 및 룩북 스타일 촬영을 위한 릴랙스된 스튜디오 포즈로 캐릭터를 배치합니다. 의상, 헤어스타일 및 스타일링을 변경하지 않고 신체 자세를 변경하도록 설계되었습니다. 의상 시각화 또는 아트 디렉션 테스트에 적합합니다.
측면 뷰#
척도 및 자세 정렬을 위한 전체 신체 측면 뷰를 구축합니다. 측면 뷰와 뒤쪽 뷰를 실행하면 모델링이나 2D 리깅에 사용할 수 있는 정사영 참조를 얻을 수 있습니다. 다른 곳에서 사용된 동일한 조건 스택을 통해 정체성이 보존됩니다.
뒤쪽 뷰#
정사영 범위를 완성하기 위해 전체 신체 뒤쪽 뷰를 생성합니다. 의복 뒤쪽 세부 사항, 배낭 또는 머리카락 길이 확인에 유용합니다. 턴어라운드 시트를 조립할 때 측면 뷰 및 T-POSE와 함께 사용하십시오.
걷기#
의상 및 실루엣을 유지하면서 시네마틱 측면 걷기 프레임을 생성합니다. 지침은 정체성을 손상시키지 않고 자연스러운 움직임을 장려합니다. 빠른 스토리보드 및 샷 테스트에 유용합니다.
SCENE_02#
옷과 얼굴을 보존하면서 조명 변화를 통해 캐릭터를 분위기 있는 실내로 이동시킵니다. 스타일화된 조명 하에서 캐릭터가 어떻게 유지되는지 테스트하는 데 사용하십시오. 정체성 일관성은 이미지 우선 조건을 통해 유지됩니다.
SCENE_03#
같은 외모와 옷장을 유지하면서 따뜻한 빛과 전경 소품을 사용하여 캐릭터를 야외로 배치합니다. 색상 균형 이동에 대한 스트레스 테스트에 좋으며 얼굴을 안정적으로 유지합니다. 밝고 포화된 결과를 원할 때 이 작업을 교체하십시오.
SCENE_04#
낮은 각도의 얼굴 안정성을 확인하기 위해 다른 카메라 각도로 햇볕이 잘 드는 공원 설정을 제공합니다. 중립 팩 후에 실행하여 위쪽을 보는 샷에서 유사성을 확인하십시오. 소셜, 라이프스타일 또는 제품 컨텍스트에 유용합니다.
SCENE_05#
옷과 스타일을 보존하면서 아늑한 카페 환경과 손으로 들고 있는 소품 안내를 추가합니다. 정체성을 잃지 않고 실내 조명과 손 상호작용을 혼합한 현실감 확인입니다. 자연스러운 스토리텔링 프레임이 필요할 때 사용하십시오.
SCENE_06#
옷과 색상 팔레트를 유지하면서 대중교통으로 캐릭터를 이동시킵니다. 더 타이트하고 바쁜 배경에서 정체성을 확인합니다. 편집 또는 도시 내러티브 패널에 유용합니다.
컨셉 아트#
원래의 비율과 의상을 존중하면서 스타일을 추론하는 아트 디렉션 변형을 생성합니다. 무드 보드, 주요 아트 또는 사전 제작 스케치용으로 의도되었습니다. 동일한 참조를 활용하기 때문에 캐릭터는 여전히 인식 가능합니다.
04_감정#
미세한 표현 변화를 가진 여러 클로즈업 변형을 생성합니다. UI 아바타, 반응 시트 또는 대화 초상화에 유용하며 주제에 충실합니다. 동일한 정체성을 일치시키는 compact 감정 팩이 필요할 때 이 그룹을 트리거하십시오.
B - 데이터세트 생성#
팩을 생성한 후 이 그룹은 선택한 이미지를 로드하고 업스케일 및 정규화하며 Florence-2로 자동 캡션을 생성하고 준비된 학습 폴더에 씁니다. 스타일 참조 경로를 사용하여 데이터세트가 생성된 팩과 동일한 외형을 유지합니다. 캐릭터 이름을 한 번 설정하면 내보내기가 이미지와 캡션을 전용 데이터세트 폴더에 저장하여 향후 미세 조정을 할 수 있습니다.
Comfyui 일관된 캐릭터 생성기 3.8 워크플로우의 주요 노드#
TextEncodeQwenImageEditPlus(#1199). Qwen에 참조 이미지와 짧은 지침을 제공하여 모델이 무엇을 변경하고 무엇을 유지할지 파악할 수 있도록 합니다.image1을 캐릭터 사진에 연결하고 포즈나 장면 변경이 필요할 때는 간결한prompt텍스트를 작성하십시오. 정체성을 과도하게 설명하지 않을수록 출력이 더 일관되게 유지됩니다.FluxKontextMultiReferenceLatentMethod(#1351). 샘플링 일정 초기에 정체성 기능을 잠그어 주제가 각도와 조명에 걸쳐 생존할 수 있도록 합니다. 가장 강력한 정체성을 위해 제공된 대로 사용하십시오; 더 많은 재스타일링을 의도적으로 원할 경우에만 완화하십시오.KSampler(#199). 모든 팩에 걸쳐 조건을 이미지로 변환합니다. 더 높은 충실도가 필요하면steps를 조정하십시오; 지침에 대한 느슨한 준수가 필요하면cfg를 조정하십시오. 여기에 작은 조정이 모든 그룹에 예측 가능한 방식으로 영향을 미칩니다.LoraLoaderModelOnly(#547). Qwen-Image-Edit-2511-Lightning LoRA를 UNet에 연결합니다. 과도한 샤프닝이 발생하거나 외형이 변동하면strength_model을 약간 낮추십시오; 편집이 너무 약하게 느껴지면 높이십시오. 이것이 Qwen 편집의 주된 속도 대 품질 조절기입니다. lightx2v/Qwen-Image-Edit-2511-LightningUSOStyleReference(subgraph). CLIP‑Vision 기능을 FLUX와 결합하여 업스케일링을 통해 팩의 스타일을 유지합니다. 얼굴이 너무 꽉 차거나 너무 느슨하게 잘려진 경우, CLIP‑Vision 인코더의crop옵션을 조정하여 더 안정적인 프레이밍을 얻으십시오. Comfy-Org/USO_1.0_RepackagedFlorence2Run(#1413). 데이터세트 작성자가 사용하는 캡션을 자동 생성합니다. 학습 데이터세트를 위해 캡션task를 자세한 모드로 두십시오; 간결한 태그가 필요할 경우에만 짧은 모드로 전환하십시오. gokaygokay/Florence-2-Flux-LargeSaveImageTextDataSetToFolder(#1440). 캐릭터 이름을 사용하여 이미지와 페어링된 캡션을 깔끔한 폴더에 씁니다.folder_name을 설정하여 캐릭터별로 데이터세트를 분리하고,filename_prefix를 설정하여 재현 가능한 이름을 만드십시오.
선택적 추가 기능#
- 유사성을 검증하기 위해 CLOSE UP과 PROFILE부터 시작한 후 캐릭터 턴어라운드를 실행한 후 장면 및 포즈를 탐색하십시오.
- 프롬프트를 카메라, 포즈 또는 환경을 설명하는 간단하고 묘사적인 것으로 유지하십시오; 참조 이미지가 정체성을 정의하도록 하십시오.
- 간단하고 고유한 NAME을 사용하십시오; 이는 출력 폴더가 되고 캡션의 편리한 트리거 토큰이 됩니다.
- 팩에 만족하면 B - 데이터세트 생성을 한 번 실행하여 학습 조정을 위한 정규화된 이미지와 캡션을 내보내십시오.
- "착용" 외형을 위해 MODEL POSE 또는 T-POSE를 먼저 실행하여 비율을 고정한 후 선호하는 장면 그룹으로 전환하십시오.
감사의 글#
이 워크플로우는 다음 작업과 리소스를 구현하고 확장합니다. 우리는 New Video Create 워크플로우 소스 페이지 및 관련 소스 아카이브에 대한 기여와 유지 관리에 대해 MickMumpitz에게 감사의 말씀을 드립니다. 권위 있는 세부 사항은 아래에 링크된 원본 문서 및 저장소를 참조하십시오.
리소스#
- MickMumpitz/워크플로우 소스 페이지
- 문서 / 릴리스 노트: MickMumpitz의 워크플로우 소스 페이지
- MickMumpitz/소스 아카이브
- 설정에 사용된 로컬 소스 파일: `260106_MICKMUMPITZ_CCC_3-8_SMPL.jsonjson
참고: 참조된 모델, 데이터세트 및 코드는 해당 저자 및 유지 관리자가 제공한 라이선스 및 조건에 따릅니다.









