이 워크플로우는 Z 이미지 터보를 ComfyUI에 도입하여 몇 단계만으로 고해상도, 사진과 같은 비주얼을 생성할 수 있도록 합니다. 이는 개념 아트, 광고 컴프, 인터랙티브 미디어 및 빠른 A/B 테스트를 위한 빠르고 일관된 렌더링이 필요한 크리에이터를 위해 설계되었습니다.
그래프는 텍스트 프롬프트에서 이미지로 가는 깔끔한 경로를 따릅니다: Z 이미지 모델과 지원 구성 요소를 로드하고, 긍정적 및 부정적 프롬프트를 인코딩하고, 잠재 캔버스를 생성하고, AuraFlow 스케줄로 샘플링한 다음, 저장을 위해 RGB로 디코딩합니다. 그 결과는 세부 사항을 희생하지 않으면서 속도를 중시하는 간소화된 Z 이미지 파이프라인입니다.
높은 수준에서 경로는 프롬프트에서 조건화로, Z 이미지 샘플링을 통해, 그런 다음 이미지로 디코딩됩니다. 노드는 작업을 단순하게 유지하기 위해 단계로 클러스터링됩니다.
UNETLoader (#16), CLIPLoader (#18), VAELoader (#17)이 단계에서는 핵심 Z 이미지 터보 체크포인트, 텍스트 인코더 및 오토인코더를 로드합니다. BF16 체크포인트가 있다면 그것을 선택하세요. 이는 소비자 GPU에 대해 속도와 품질의 균형을 유지합니다. CLIP 스타일 인코더는 장면과 스타일에 대한 단어 선택을 보장합니다. 샘플링이 끝나면 잠재 상태를 다시 RGB로 변환하는 데 AE가 필요합니다.
CLIP Text Encode (Positive Prompt) (#6) 및 CLIP Text Encode (Negative Prompt) (#7)구체적인 명사, 스타일 큐, 카메라 힌트 및 조명을 사용하여 긍정적 프롬프트에 원하는 것을 작성하세요. 부정적 프롬프트를 사용하여 블러 또는 원치 않는 물체와 같은 일반적인 아티팩트를 억제하세요. 공식 예제의 지시문 헤더와 같은 프롬프트 서문이 보이면 유지, 편집 또는 제거할 수 있으며, 워크플로우는 계속 작동할 것입니다. 이 인코더들은 샘플링 중 Z 이미지를 조정하는 조건을 생성합니다.
EmptySD3LatentImage (#13) 및 ModelSamplingAuraFlow (#11)잠재 캔버스를 설정하여 출력 크기를 선택하세요. 스케줄러 노드는 모델을 AuraFlow 스타일 샘플링 전략으로 전환하여 단계 효율적인 증류 모델과 잘 맞습니다. 이는 낮은 단계 수에서 궤적을 안정적으로 유지하면서 세부 사항을 보존합니다. 캔버스와 일정이 설정되면 파이프라인은 소음 제거를 준비합니다.
KSampler (#3)이 노드는 로드된 Z 이미지 모델, 선택된 스케줄러 및 프롬프트 조건을 사용하여 실제 소음 제거를 수행합니다. 필요에 따라 속도를 위해 세부 사항을 교환하려면 샘플러 유형과 단계 수를 조정하세요. 안내 척도는 이전에 대한 프롬프트 강도를 제어합니다; 중간 값은 일반적으로 충실도와 창의적 변형의 균형을 가장 잘 맞춥니다. 탐색을 위해 시드를 무작위화하거나 반복 가능한 결과를 위해 고정하세요.
VAEDecode (#8) 및 SaveImage (#9)샘플링 후 AE는 잠재 상태를 이미지로 디코딩합니다. 저장 노드는 파일을 출력 디렉토리에 기록하여 반복을 비교하거나 결과를 다운스트림 작업에 공급할 수 있습니다. 업스케일하거나 후처리를 계획하는 경우, 작업 해상도로 디코드를 유지하고 품질 유지에 가장 좋은 무손실 형식으로 내보내세요.
UNETLoader (#16)Z 이미지 터보 체크포인트 (z_image_turbo_bf16.safetensors)를 로드합니다. 정밀도 변형 또는 업데이트된 가중치가 제공될 때 이를 전환하는 데 사용하세요. 시드와 프롬프트가 비교 가능하게 유지되기를 원한다면 세션 동안 모델을 일관되게 유지하세요. 기본 모델을 변경하면 외관, 색상 반응 및 세부 밀도가 변경됩니다.
ModelSamplingAuraFlow (#11)빠른 수렴에 적합한 AuraFlow 스타일 일정으로 샘플링 전략을 설정합니다. 이는 Z 이미지를 낮은 단계 수에서도 효율적으로 만들면서 세부 사항과 일관성을 유지하는 핵심입니다. 나중에 일정을 교체하는 경우, 유사한 출력 특성을 유지하기 위해 단계 수 및 지침을 다시 확인하세요.
KSampler (#3)샘플러 알고리즘, 단계, 지침 및 시드를 제어합니다. 빠른 아이디어를 위해 단계를 줄이고, 더 많은 마이크로 세부 사항이나 더 엄격한 프롬프트 준수가 필요할 때만 증가시키세요. 다른 샘플러는 다른 외관을 선호합니다; 몇 가지를 시도하고 결과를 비교할 때 나머지 파이프라인을 고정하세요.
CLIP Text Encode (Positive Prompt) (#6)Z 이미지를 구동하는 창의적 의도를 인코딩합니다. 주제, 매체, 렌즈, 조명, 구성 및 브랜드 또는 디자인 제약에 중점을 두세요. 부정적 프롬프트 노드와 함께 사용하여 목표 외관으로 이미지를 밀어붙이면서 알려진 아티팩트를 필터링하세요.
이 워크플로우는 다음 작업 및 리소스를 구현하고 기반으로 합니다. 우리는 Tongyi-MAI의 Z-Image-Turbo에 대한 기여 및 유지보수에 진심으로 감사드립니다. 권위 있는 세부 사항은 아래에 링크된 원본 문서 및 리포지토리를 참조하세요.
참고: 참조된 모델, 데이터세트 및 코드는 작성자 및 유지보수자의 해당 라이선스 및 조건에 따라 사용됩니다.
RunComfy는 최고의 ComfyUI 플랫폼으로서 ComfyUI 온라인 환경과 서비스를 제공하며 ComfyUI 워크플로우 멋진 비주얼을 제공합니다. RunComfy는 또한 제공합니다 AI Playground, 예술가들이 최신 AI 도구를 활용하여 놀라운 예술을 창조할 수 있도록 지원합니다.