ComfyUI를 위한 Z-Image 텍스트-이미지 워크플로우
이 ComfyUI 워크플로우는 빠르고 고품질 이미지 생성을 위해 설계된 차세대 확산 변환기인 Z-Image를 보여줍니다. 약 60억 개의 매개변수를 가진 확장 가능한 단일 스트림 아키텍처를 기반으로 하여 사실주의, 강력한 프롬프트 준수 및 이중 언어 텍스트 렌더링을 균형 있게 유지합니다.
기본적으로, 그래프는 일반적인 GPU에서 효율성을 유지하면서 품질을 최대화하기 위해 Z-Image Base로 설정되어 있습니다. 속도가 중요한 경우 Z-Image Turbo 변형과도 잘 작동하며, 구조가 이미지-이미지 작업을 위한 Z-Image Edit로 확장하기 쉽게 되어 있습니다. 명확한 프롬프트를 명확한 결과로 변환하는 신뢰할 수 있는 최소 그래프를 원한다면 이 Z-Image 워크플로우는 확고한 시작점입니다.
Comfyui Z-Image 워크플로우의 주요 모델
- Z-Image Base 확산 변환기 (bf16). Z-Image의 단일 스트림 토폴로지 및 프롬프트 제어로 잠재를 이미지로 노이즈 제거하는 핵심 생성기. 모델 페이지 • bf16 가중치
- Qwen 3 4B 텍스트 인코더. Z-Image에 대한 프롬프트를 인코딩하며 강력한 이중 언어 범위와 명확한 토큰화를 제공합니다. 인코더 가중치
- Z-Image 오토인코더 VAE. 픽셀 공간과 Z-Image 잠재 공간 사이에서 이미지를 압축하고 재구성합니다. VAE 가중치
Comfyui Z-Image 워크플로우 사용 방법
고수준에서, 그래프는 Z-Image 구성 요소를 로드하고, 잠재 캔버스를 준비하며, 긍정적 및 부정적 프롬프트를 인코딩하고, Z-Image에 맞춰 조정된 샘플러를 실행한 다음 결과를 디코딩하고 저장합니다. 주로 프롬프트를 제공하고 출력 크기를 선택하면 나머지는 합리적인 기본값으로 연결되어 있습니다.
Step1 - 모델 로드
이 그룹은 Z-Image UNet, Qwen 3 4B 텍스트 인코더 및 VAE를 초기화하여 모든 구성 요소가 정렬되도록 합니다. UNETLoader (#66)은 기본적으로 Z-Image Base를 가리키며, 이는 충실도와 편집 여유를 선호합니다. CLIPLoader (#62)는 다국어 프롬프트와 텍스트 토큰을 잘 처리하는 Qwen 기반 인코더를 가져옵니다. VAELoader (#63)는 나중에 디코딩에 사용되는 오토인코더를 설정합니다. 빠른 초안을 위해 Z-Image Turbo를 시도하려면 여기에서 가중치를 교체하십시오.
Step2 - 이미지 크기
이 그룹은 EmptySD3LatentImage (#68)를 통해 잠재 캔버스를 설정합니다. 생성하고자 하는 너비와 높이를 선택하고, 구성을 위해 종횡비를 염두에 두십시오. Z-Image는 일반적인 창의적 크기에서 잘 작동하므로 스토리보드나 전달 형식에 맞는 크기를 선택하십시오. 더 큰 크기는 세부 사항과 계산 비용을 증가시킵니다.
Step3 - 프롬프트
여기에서 당신의 이야기를 작성합니다. CLIP Text Encode (Positive Prompt) (#67) 노드는 Z-Image를 위한 장면 설명 및 스타일 지시문을 수용합니다. CLIP Text Encode (Negative Prompt) (#71)는 아티팩트나 원치 않는 요소를 피하도록 도와줍니다. Z-Image는 이중 언어 텍스트 렌더링에 맞춰 조정되어 있으므로 필요할 때 여러 언어로 텍스트 내용을 프롬프트에 직접 포함할 수 있습니다. 프롬프트를 구체적이고 시각적으로 유지하여 가장 일관된 결과를 얻으십시오.
샘플 및 노이즈 제거
ModelSamplingAuraFlow (#70)는 Z-Image의 단일 스트림 디자인에 맞춰 조정된 샘플링 정책을 적용한 다음 KSampler (#69)는 노이즈를 프롬프트에 맞는 이미지로 변환하는 노이즈 제거 프로세스를 구동합니다. 샘플러는 긍정적 및 부정적 조건을 잠재 캔버스와 결합하여 구조와 세부 사항을 반복적으로 정제합니다. 샘플러 설정을 조정하여 여기서 속도와 품질을 교환할 수 있습니다. 이 단계는 Z-Image의 프롬프트 준수와 텍스트 명확성이 정말로 나타나는 곳입니다.
디코딩 및 저장
VAEDecode (#65)는 최종 잠재를 RGB 이미지로 변환합니다. SaveImage (#9)는 노드에 설정된 접두사를 사용하여 파일을 기록하므로 Z-Image 출력물을 쉽게 찾고 정리할 수 있습니다. 이는 프롬프트에서 픽셀로의 전체 과정을 완료합니다.
Comfyui Z-Image 워크플로우의 주요 노드
UNETLoader (#66)
실제 노이즈 제거를 수행하는 Z-Image 백본을 로드합니다. 속도나 편집 사용 사례를 탐색할 때 여기에서 다른 Z-Image 변형으로 전환하십시오. 변형을 변경할 경우, 색상이나 대비 변화를 피하기 위해 인코더와 VAE를 호환되게 유지하십시오.
CLIP Text Encode (Positive Prompt) (#67)
Z-Image를 위한 주요 설명을 인코딩합니다. 주제, 조명, 카메라, 분위기 및 이미지의 텍스트를 명확히 지정하는 간결하고 시각적인 문구를 작성하십시오. 텍스트 렌더링을 위해 원하는 단어를 따옴표로 묶고 가독성을 위해 짧게 유지하십시오.
CLIP Text Encode (Negative Prompt) (#71)
피해야 할 것을 정의하여 Z-Image가 올바른 세부 사항에 집중할 수 있도록 합니다. 흐림, 추가 사지, 난잡한 타이포그래피 또는 스타일에서 벗어난 요소를 억제하는 데 사용하십시오. 구성에 과도한 제약을 주지 않도록 간결하고 주제에 맞게 유지하십시오.
EmptySD3LatentImage (#68)
Z-Image가 그림을 그릴 잠재 캔버스를 만듭니다. 최종 사용에 적합한 크기를 선택하고 효율적인 메모리 사용을 위해 64px의 배수로 유지하십시오. 더 넓거나 더 높은 캔버스는 구성과 관점에 영향을 미치므로 프롬프트를 적절히 조정하십시오.
ModelSamplingAuraFlow (#70)
Z-Image의 훈련 및 잠재 공간과 일치하는 샘플러 프리셋을 선택합니다. 대안 샘플러를 테스트하는 경우를 제외하고는 거의 변경할 필요가 없습니다. 안정적이고 아티팩트 없는 결과를 위해 제공된 대로 두십시오.
KSampler (#69)
Z-Image의 품질-속도 절충을 제어합니다. 세부 사항과 안정성을 위해 steps를 증가시키고, 빠른 초안을 위해 감소시킵니다. 자연스러운 질감과 프롬프트 준수를 균형 있게 유지하기 위해 cfg를 중간 수준으로 유지하십시오; 이 그래프의 일반적인 값은 steps: 30에서 50 및 cfg: 3에서 5입니다. 재현성을 위해 고정된 seed를 설정하거나 변화를 탐색하기 위해 무작위로 설정하십시오.
VAEDecode (#65)
Z-Image에서 최종 잠재를 RGB 이미지로 변환합니다. VAE를 변경할 경우, 색상 정확도와 선명도를 유지하기 위해 모델 계열과 맞추어 유지하십시오.
SaveImage (#9)
명확한 파일 이름 접두사로 결과를 기록하여 Z-Image 출력물을 쉽게 분류할 수 있습니다. 실험, 모델 변형 또는 종횡비를 구분하기 위해 접두사를 조정하십시오.
선택적 추가 사항
- 빠른 아이디어 구상을 위해 Z-Image Turbo를 사용한 다음, Z-Image Base로 전환하고 최종 렌더링을 위해 단계를 올리십시오.
- 이중 언어 프롬프트 및 이미지 내 텍스트의 경우, 프롬프트에서 단어를 짧고 고대비로 유지하여 Z-Image가 선명한 타이포그래피를 렌더링하도록 돕습니다.
- 작은 프롬프트 수정을 비교할 때 차이가 새로운 노이즈보다는 변경 사항을 반영하도록 시드를 잠그십시오.
- 과도한 채도나 할로가 보이면
cfg를 약간 낮추거나 부정적 프롬프트를 강화하여 균형을 회복하십시오.
감사의 말
이 워크플로우는 다음 작업 및 리소스를 구현하고 기반으로 합니다. 우리는 그들의 기여와 유지 관리에 대해 Comfy-Org의 Z-Image Day-0 ComfyUI 워크플로우 템플릿을 감사히 인정합니다. 권위 있는 세부 사항은 아래에 링크된 원래 문서 및 저장소를 참조하십시오.
리소스
- Comfy-Org/Z-Image Day-0 ComfyUI 지원
- GitHub: Comfy-Org/workflow_templates
- 문서 / 릴리스 노트: 출처
주의: 참조된 모델, 데이터셋 및 코드의 사용은 저자와 유지 관리자가 제공한 각각의 라이선스 및 조건에 따릅니다.

