ERNIE-Image ComfyUI: 명령을 따르는 텍스트에서 이미지로, 선명한 텍스트 렌더링
이 ERNIE-Image ComfyUI 워크플로우는 짧은 프롬프트를 고품질 이미지로 변환하여 명령을 따르고 텍스트를 신뢰성 있게 렌더링합니다. Comfy-Org의 ERNIE-Image 확산 모델과 강력한 텍스트 인코더, 선택적 프롬프트 향상기 및 현대적 Flux2 VAE를 결합하여 세부 사항과 타이포그래피를 보존합니다.
빠른 반복을 위해 설계된 ERNIE-Image ComfyUI는 프롬프트를 수용하고, 선택적으로 더 풍부한 지침을 위해 확장하며, 인코딩하고, ERNIE-Image로 샘플링하고, 최종 이미지로 디코딩합니다. 프롬프트 향상 경로는 포함되어 있으며, 그래프를 변경하지 않고 원본과 향상된 프롬프트를 비교할 수 있도록 토글 가능합니다.
Comfyui ERNIE-Image ComfyUI 워크플로우의 주요 모델
- ERNIE-Image 확산 모델. 명령을 따르고 텍스트를 렌더링하도록 조정된 이미지로 라텐트를 디노이즈하는 핵심 생성기입니다. Model card
- Ministral-3-3B 텍스트 인코더. 프롬프트를 ERNIE-Image의 조건으로 변환하는 주요 텍스트 인코더입니다. File
- ERNIE-Image 프롬프트 향상기. 간결한 프롬프트를 설명적인 지침으로 확장하기 위해 향상 브랜치에서 사용하는 보조 인코더입니다. File
- Flux2 VAE. 샘플러에서 라텐트를 픽셀로 변환하면서 세부 사항과 판독 가능한 텍스트를 보존하는 디코더입니다. File
Comfyui ERNIE-Image ComfyUI 워크플로우 사용 방법
높은 수준에서, 프롬프트는 선택적 향상 단계를 거쳐 인코딩된 후 ERNIE-Image로 샘플링되어 라텐트가 되고, 마지막으로 Flux2 VAE에 의해 디코딩되어 저장됩니다. 아래 그룹은 그래프에 직접 매핑되어 입력을 조정할 위치를 항상 알 수 있습니다.
프롬프트
ERNIE-Image ComfyUI 서브그래프의 최상위 prompt 필드에 보고 싶은 내용을 작성하세요. 명확하고 지시적인 문구가 명령 따르기와 텍스트 렌더링에 가장 적합합니다. 이미지에 그려질 텍스트를 인용하여 포함할 수 있습니다. 긍정적 조건은 이 프롬프트에서 구축되며, 부정적 경로는 빈 상태로 시작하므로 나중에 부정적 요소를 추가하지 않는 한 결과는 충실합니다.
프롬프트 향상
Enable prompt enhancement? (#76)을 사용하여 향상 경로를 켜거나 끌 수 있습니다. 켜져 있을 때, 짧은 브리프는 TextGenerate (#74)로 확장되어 ERNIE-Image 프롬프트 향상기를 통해 로드됩니다. 향상기는 귀하의 프롬프트를 풍부하게 하도록 구조화된 명령을 사용하며, 일관된 구성을 장려하기 위해 목표 너비 및 높이도 전달합니다. ComfySwitchNode (#75)는 원본 또는 향상된 텍스트를 다운스트림으로 라우팅하여 A/B 테스트를 쉽게 할 수 있도록 합니다. 광범위한 호환성을 위해 기본적으로 토글은 꺼져 있으며, 향상 모델이 존재하면 활성화하십시오.
모델
워크플로우는 세 가지 자산을 로드합니다: UNETLoader (#66)는 ERNIE-Image 확산 모델을 선택하고, CLIPLoader (#62)는 Ministral-3-3B 텍스트 인코더를 가져오고, VAELoader (#63)는 Flux2 VAE를 제공합니다. 이 조합이 ERNIE-Image ComfyUI의 강력한 명령 준수 및 깔끔한 타이포그래피를 제공합니다. 모델을 교체할 경우, 불일치를 피하기 위해 삼중 조합을 조정하십시오.
이미지 크기
EmptyFlux2LatentImage (#71)는 캔버스를 정의합니다. 너비와 높이를 원하는 종횡비로 설정하십시오; 풍경, 인물 사진, 정사각형 그래픽 모두 작동합니다. 이러한 치수는 토글이 켜져 있을 때 향상 프롬프트에도 주입되어 모델이 레이아웃 및 텍스트 배치를 계획하는 데 도움이 됩니다. 더 큰 크기는 더 많은 계산 비용이 들며, 빠른 미리보기를 위해 작은 치수를 사용한 후 필요에 따라 나중에 업스케일하십시오.
텍스트에서 이미지로
CLIPTextEncode (#67)는 라우팅된 프롬프트를 긍정적 조건으로 변환하고, CLIPTextEncode (#72)는 부정적 경로를 제공합니다 (기본적으로 빈 상태). KSampler (#70)는 ERNIE-Image 모델과 귀하의 조건을 사용하여 라텐트를 생성합니다. 샘플링 후, VAEDecode (#65)는 라텐트를 RGB 픽셀로 변환합니다. 모든 것이 원클릭 생성에 연결되어 있어, 입력이 설정되면 작업을 큐에 넣고 미리보기를 지켜보십시오.
출력
이미지는 SaveImage (#73)에 의해 저장됩니다. UI 미리보기와 출력 디렉토리에서 확인할 수 있습니다. 텍스트 브랜치의 효과를 분리하려면 향상 켜기와 끄기 비교 시 일관된 시드를 사용하십시오.
Comfyui ERNIE-Image ComfyUI 워크플로우의 주요 노드
KSampler (#70) 확산 경로를 제어하는 주요 생성기입니다. 품질 대 속도에 대한 steps를 조정하고, 프롬프트 준수를 강화하거나 완화하기 위해 cfg를 사용하며, 프롬프트 변형 간 일관성을 위해 고정된 seed를 설정하십시오. 높은 지침은 준수를 강화할 수 있지만, 창의성을 감소시킬 수 있습니다; 취향에 맞게 균형 잡으십시오. ComfyUI의 샘플러 참조를 통해 일반적인 동작을 확인하십시오. ComfyUI
UNETLoader (#66) 실제로 라텐트를 이미지로 디노이즈하는 ERNIE-Image 확산 모델을 로드합니다. 명령 준수 및 텍스트 렌더링의 이점을 누리려면 ERNIE-Image 체크포인트로 설정하십시오. 모델을 교체하면 스타일 및 타이포그래피 기능의 변화가 예상됩니다. ERNIE-Image
CLIPLoader (#62) 주요 조건 경로에 사용되는 Ministral-3-3B 텍스트 인코더를 제공합니다. 인코더를 교체하면 언어가 비주얼로 매핑되는 방식이 변경됩니다; 명령 준수를 위해 ERNIE-Image 스택과 정렬된 상태로 유지하십시오. 이 노드는 하류의 긍정적 및 부정적 인코더에 영향을 미칩니다. Ministral-3-3B file
VAELoader (#63) 디코딩 중에 사용되는 Flux2 VAE를 제공합니다. 일치하는 VAE는 색상과 가장자리 충실도를 보존하고 렌더링된 텍스트를 선명하게 유지하는 데 도움이 됩니다. ERNIE-Image로 생성할 때 이 기능을 사용하십시오. Flux2 VAE file
EmptyFlux2LatentImage (#71) 선택한 해상도로 빈 라텐트 캔버스를 초기화합니다. 이는 최종 이미지 크기를 설정하고 레이아웃을 미세하게 안내합니다. 치수를 변경하면 해당 경로가 활성화되어 있을 때 향상기의 내부 명령도 업데이트됩니다.
CLIPTextEncode (#67) 최종 라우팅된 프롬프트를 긍정적 조건으로 인코딩합니다. 텍스트 렌더링을 개선하기 위해, 인용 부호 안에 나타나길 원하는 정확한 단어를 포함하고, 중요하다면 케이싱을 지정하십시오. 최상의 준수를 위해 지시를 간결하고 구체적으로 유지하십시오.
CLIPTextEncode (#72) 부정적 프롬프트를 인코딩합니다. 기본적으로 비어 있어 귀하의 의도에 가깝게 출력을 유지합니다. 원치 않는 아티팩트를 발견하면 여기에 몇 가지 간결한 부정적 용어를 추가하십시오.
TextGenerate (#74) Load CLIP (PE) (#91)에 의해 로드된 ERNIE-Image 프롬프트 향상기를 사용하여 확장된 설명을 생성합니다. 짧은 브리프를 풍부하고 시각적인 방향으로 전환하여 구성과 세부 사항을 개선하는 데 유용합니다. 문자 그대로의 제어를 위해 향상 토글을 끄고, 설명적 다양성을 위해 켜십시오. Prompt Enhancer file
ComfySwitchNode (#75) Enable prompt enhancement? (#76)에 따라 원본 또는 향상된 프롬프트를 전달합니다. 연결을 변경하지 않고 A/B 테스트를 간단하게 할 수 있습니다. 프롬프트 전용 차이를 격리하려면 비교 시 고정된 seed를 사용하십시오.
VAEDecode (#65) Flux2 VAE를 사용하여 최종 라텐트를 이미지로 디코딩합니다. 이 단계는 색상, 선명도 및 작은 텍스트의 판독성을 크게 좌우합니다. ERNIE-Image 스택의 Flux2 VAE와 함께 사용하십시오.
SaveImage (#73) 생성된 이미지를 디스크에 저장하고 UI에 노출합니다. 여러 ERNIE-Image ComfyUI 실행을 벤치마크할 계획이라면 일관된 명명 규칙을 사용하십시오.
선택적 추가 기능
- 선명한 레터링을 위해, 정확한 단어를 인용 부호에 넣고 "굵은 세리프 레이블" 또는 "손글씨 태그"와 같은 스타일 큐를 지정하십시오; ERNIE-Image ComfyUI는 텍스트 렌더링에 최적화되어 있습니다.
- "중앙에 배치된 제품 사진", "흰색 배경", "2:3 포스터 레이아웃"과 같은 명확한 지시를 사용하여 ERNIE-Image ComfyUI가 명령을 정확하게 따를 수 있도록 하십시오.
- 향상 경로를 비교할 때,
seed를 고정하고 향상 토글만 전환하여 진정한 A/B 차이를 확인하십시오. - 장면과 일치하는 종횡비를 선택하십시오; ERNIE-Image ComfyUI는 크기 힌트를 존중하고 레이아웃을 계획합니다.
감사의 말
이 워크플로우는 다음 작업 및 리소스를 구현하고 기반으로 합니다. 우리는 ERNIE-Image (재포장된 모델 파일 및 자산)를 위해 Comfy-Org, 원본 ERNIE-Image 모델을 위해 Baidu, ERNIE-Image ComfyUI 워크플로우 예제를 위한 ComfyUI 팀에 감사를 표합니다. 권위 있는 세부 사항은 아래 링크된 원본 문서 및 저장소를 참조하십시오.
리소스
- ComfyUI/ERNIE-Image ComfyUI 워크플로우 소스
- GitHub: comfy-org/docs
- Docs / Release Notes: ERNIE-Image ComfyUI workflow example
- Comfy-Org/ERNIE-Image
- GitHub: baidu/ERNIE-Image
- Hugging Face: Comfy-Org/ERNIE-Image
- Comfy-Org/ernie-image.safetensors
- GitHub: baidu/ERNIE-Image
- Hugging Face: ernie-image.safetensors
- Comfy-Org/ministral-3-3b.safetensors
- GitHub: baidu/ERNIE-Image
- Hugging Face: ministral-3-3b.safetensors
- Comfy-Org/ernie-image-prompt-enhancer.safetensors
- GitHub: baidu/ERNIE-Image
- Hugging Face: ernie-image-prompt-enhancer.safetensors
- Comfy-Org/flux2-vae.safetensors
- GitHub: baidu/ERNIE-Image
- Hugging Face: flux2-vae.safetensors
참고: 언급된 모델, 데이터세트 및 코드는 저자와 유지 관리자가 제공한 해당 라이선스 및 약관에 따릅니다.




