logo
RunComfy
  • ComfyUI
  • 트레이너신규
  • 모델
  • API
  • 가격
discord logo
ComfyUI>워크플로우>ERNIE-Image ComfyUI | 스마트 텍스트에서 이미지로 생성기

ERNIE-Image ComfyUI | 스마트 텍스트에서 이미지로 생성기

Workflow Name: RunComfy/ERNIE-Image-ComfyUI
Workflow ID: 0000...1399
이 워크플로우는 텍스트 지시를 몇 초 만에 명확하고 세부적인 이미지로 변환하는 데 도움을 줍니다. 공식 ERNIE 모델 스택으로 구축되어 프롬프트를 정확하게 캡처하고 시각적 출력에서 정밀한 텍스트 렌더링을 지원합니다. 디자이너는 프롬프트와 구성을 쉽게 맞춤화하여 원하는 미적 감각을 달성할 수 있습니다. Ministral과 Flux2 VAE의 통합은 세부 사항과 부드러운 확산 품질을 보장합니다. 개념 비주얼, 브랜드 자산 및 지시를 따르는 디자인을 손쉽게 생성하는 데 적합합니다.

ERNIE-Image ComfyUI: 명령을 따르는 텍스트에서 이미지로, 선명한 텍스트 렌더링

이 ERNIE-Image ComfyUI 워크플로우는 짧은 프롬프트를 고품질 이미지로 변환하여 명령을 따르고 텍스트를 신뢰성 있게 렌더링합니다. Comfy-Org의 ERNIE-Image 확산 모델과 강력한 텍스트 인코더, 선택적 프롬프트 향상기 및 현대적 Flux2 VAE를 결합하여 세부 사항과 타이포그래피를 보존합니다.

빠른 반복을 위해 설계된 ERNIE-Image ComfyUI는 프롬프트를 수용하고, 선택적으로 더 풍부한 지침을 위해 확장하며, 인코딩하고, ERNIE-Image로 샘플링하고, 최종 이미지로 디코딩합니다. 프롬프트 향상 경로는 포함되어 있으며, 그래프를 변경하지 않고 원본과 향상된 프롬프트를 비교할 수 있도록 토글 가능합니다.

Comfyui ERNIE-Image ComfyUI 워크플로우의 주요 모델

  • ERNIE-Image 확산 모델. 명령을 따르고 텍스트를 렌더링하도록 조정된 이미지로 라텐트를 디노이즈하는 핵심 생성기입니다. Model card
  • Ministral-3-3B 텍스트 인코더. 프롬프트를 ERNIE-Image의 조건으로 변환하는 주요 텍스트 인코더입니다. File
  • ERNIE-Image 프롬프트 향상기. 간결한 프롬프트를 설명적인 지침으로 확장하기 위해 향상 브랜치에서 사용하는 보조 인코더입니다. File
  • Flux2 VAE. 샘플러에서 라텐트를 픽셀로 변환하면서 세부 사항과 판독 가능한 텍스트를 보존하는 디코더입니다. File

Comfyui ERNIE-Image ComfyUI 워크플로우 사용 방법

높은 수준에서, 프롬프트는 선택적 향상 단계를 거쳐 인코딩된 후 ERNIE-Image로 샘플링되어 라텐트가 되고, 마지막으로 Flux2 VAE에 의해 디코딩되어 저장됩니다. 아래 그룹은 그래프에 직접 매핑되어 입력을 조정할 위치를 항상 알 수 있습니다.

프롬프트

ERNIE-Image ComfyUI 서브그래프의 최상위 prompt 필드에 보고 싶은 내용을 작성하세요. 명확하고 지시적인 문구가 명령 따르기와 텍스트 렌더링에 가장 적합합니다. 이미지에 그려질 텍스트를 인용하여 포함할 수 있습니다. 긍정적 조건은 이 프롬프트에서 구축되며, 부정적 경로는 빈 상태로 시작하므로 나중에 부정적 요소를 추가하지 않는 한 결과는 충실합니다.

프롬프트 향상

Enable prompt enhancement? (#76)을 사용하여 향상 경로를 켜거나 끌 수 있습니다. 켜져 있을 때, 짧은 브리프는 TextGenerate (#74)로 확장되어 ERNIE-Image 프롬프트 향상기를 통해 로드됩니다. 향상기는 귀하의 프롬프트를 풍부하게 하도록 구조화된 명령을 사용하며, 일관된 구성을 장려하기 위해 목표 너비 및 높이도 전달합니다. ComfySwitchNode (#75)는 원본 또는 향상된 텍스트를 다운스트림으로 라우팅하여 A/B 테스트를 쉽게 할 수 있도록 합니다. 광범위한 호환성을 위해 기본적으로 토글은 꺼져 있으며, 향상 모델이 존재하면 활성화하십시오.

모델

워크플로우는 세 가지 자산을 로드합니다: UNETLoader (#66)는 ERNIE-Image 확산 모델을 선택하고, CLIPLoader (#62)는 Ministral-3-3B 텍스트 인코더를 가져오고, VAELoader (#63)는 Flux2 VAE를 제공합니다. 이 조합이 ERNIE-Image ComfyUI의 강력한 명령 준수 및 깔끔한 타이포그래피를 제공합니다. 모델을 교체할 경우, 불일치를 피하기 위해 삼중 조합을 조정하십시오.

이미지 크기

EmptyFlux2LatentImage (#71)는 캔버스를 정의합니다. 너비와 높이를 원하는 종횡비로 설정하십시오; 풍경, 인물 사진, 정사각형 그래픽 모두 작동합니다. 이러한 치수는 토글이 켜져 있을 때 향상 프롬프트에도 주입되어 모델이 레이아웃 및 텍스트 배치를 계획하는 데 도움이 됩니다. 더 큰 크기는 더 많은 계산 비용이 들며, 빠른 미리보기를 위해 작은 치수를 사용한 후 필요에 따라 나중에 업스케일하십시오.

텍스트에서 이미지로

CLIPTextEncode (#67)는 라우팅된 프롬프트를 긍정적 조건으로 변환하고, CLIPTextEncode (#72)는 부정적 경로를 제공합니다 (기본적으로 빈 상태). KSampler (#70)는 ERNIE-Image 모델과 귀하의 조건을 사용하여 라텐트를 생성합니다. 샘플링 후, VAEDecode (#65)는 라텐트를 RGB 픽셀로 변환합니다. 모든 것이 원클릭 생성에 연결되어 있어, 입력이 설정되면 작업을 큐에 넣고 미리보기를 지켜보십시오.

출력

이미지는 SaveImage (#73)에 의해 저장됩니다. UI 미리보기와 출력 디렉토리에서 확인할 수 있습니다. 텍스트 브랜치의 효과를 분리하려면 향상 켜기와 끄기 비교 시 일관된 시드를 사용하십시오.

Comfyui ERNIE-Image ComfyUI 워크플로우의 주요 노드

KSampler (#70) 확산 경로를 제어하는 주요 생성기입니다. 품질 대 속도에 대한 steps를 조정하고, 프롬프트 준수를 강화하거나 완화하기 위해 cfg를 사용하며, 프롬프트 변형 간 일관성을 위해 고정된 seed를 설정하십시오. 높은 지침은 준수를 강화할 수 있지만, 창의성을 감소시킬 수 있습니다; 취향에 맞게 균형 잡으십시오. ComfyUI의 샘플러 참조를 통해 일반적인 동작을 확인하십시오. ComfyUI

UNETLoader (#66) 실제로 라텐트를 이미지로 디노이즈하는 ERNIE-Image 확산 모델을 로드합니다. 명령 준수 및 텍스트 렌더링의 이점을 누리려면 ERNIE-Image 체크포인트로 설정하십시오. 모델을 교체하면 스타일 및 타이포그래피 기능의 변화가 예상됩니다. ERNIE-Image

CLIPLoader (#62) 주요 조건 경로에 사용되는 Ministral-3-3B 텍스트 인코더를 제공합니다. 인코더를 교체하면 언어가 비주얼로 매핑되는 방식이 변경됩니다; 명령 준수를 위해 ERNIE-Image 스택과 정렬된 상태로 유지하십시오. 이 노드는 하류의 긍정적 및 부정적 인코더에 영향을 미칩니다. Ministral-3-3B file

VAELoader (#63) 디코딩 중에 사용되는 Flux2 VAE를 제공합니다. 일치하는 VAE는 색상과 가장자리 충실도를 보존하고 렌더링된 텍스트를 선명하게 유지하는 데 도움이 됩니다. ERNIE-Image로 생성할 때 이 기능을 사용하십시오. Flux2 VAE file

EmptyFlux2LatentImage (#71) 선택한 해상도로 빈 라텐트 캔버스를 초기화합니다. 이는 최종 이미지 크기를 설정하고 레이아웃을 미세하게 안내합니다. 치수를 변경하면 해당 경로가 활성화되어 있을 때 향상기의 내부 명령도 업데이트됩니다.

CLIPTextEncode (#67) 최종 라우팅된 프롬프트를 긍정적 조건으로 인코딩합니다. 텍스트 렌더링을 개선하기 위해, 인용 부호 안에 나타나길 원하는 정확한 단어를 포함하고, 중요하다면 케이싱을 지정하십시오. 최상의 준수를 위해 지시를 간결하고 구체적으로 유지하십시오.

CLIPTextEncode (#72) 부정적 프롬프트를 인코딩합니다. 기본적으로 비어 있어 귀하의 의도에 가깝게 출력을 유지합니다. 원치 않는 아티팩트를 발견하면 여기에 몇 가지 간결한 부정적 용어를 추가하십시오.

TextGenerate (#74) Load CLIP (PE) (#91)에 의해 로드된 ERNIE-Image 프롬프트 향상기를 사용하여 확장된 설명을 생성합니다. 짧은 브리프를 풍부하고 시각적인 방향으로 전환하여 구성과 세부 사항을 개선하는 데 유용합니다. 문자 그대로의 제어를 위해 향상 토글을 끄고, 설명적 다양성을 위해 켜십시오. Prompt Enhancer file

ComfySwitchNode (#75) Enable prompt enhancement? (#76)에 따라 원본 또는 향상된 프롬프트를 전달합니다. 연결을 변경하지 않고 A/B 테스트를 간단하게 할 수 있습니다. 프롬프트 전용 차이를 격리하려면 비교 시 고정된 seed를 사용하십시오.

VAEDecode (#65) Flux2 VAE를 사용하여 최종 라텐트를 이미지로 디코딩합니다. 이 단계는 색상, 선명도 및 작은 텍스트의 판독성을 크게 좌우합니다. ERNIE-Image 스택의 Flux2 VAE와 함께 사용하십시오.

SaveImage (#73) 생성된 이미지를 디스크에 저장하고 UI에 노출합니다. 여러 ERNIE-Image ComfyUI 실행을 벤치마크할 계획이라면 일관된 명명 규칙을 사용하십시오.

선택적 추가 기능

  • 선명한 레터링을 위해, 정확한 단어를 인용 부호에 넣고 "굵은 세리프 레이블" 또는 "손글씨 태그"와 같은 스타일 큐를 지정하십시오; ERNIE-Image ComfyUI는 텍스트 렌더링에 최적화되어 있습니다.
  • "중앙에 배치된 제품 사진", "흰색 배경", "2:3 포스터 레이아웃"과 같은 명확한 지시를 사용하여 ERNIE-Image ComfyUI가 명령을 정확하게 따를 수 있도록 하십시오.
  • 향상 경로를 비교할 때, seed를 고정하고 향상 토글만 전환하여 진정한 A/B 차이를 확인하십시오.
  • 장면과 일치하는 종횡비를 선택하십시오; ERNIE-Image ComfyUI는 크기 힌트를 존중하고 레이아웃을 계획합니다.

감사의 말

이 워크플로우는 다음 작업 및 리소스를 구현하고 기반으로 합니다. 우리는 ERNIE-Image (재포장된 모델 파일 및 자산)를 위해 Comfy-Org, 원본 ERNIE-Image 모델을 위해 Baidu, ERNIE-Image ComfyUI 워크플로우 예제를 위한 ComfyUI 팀에 감사를 표합니다. 권위 있는 세부 사항은 아래 링크된 원본 문서 및 저장소를 참조하십시오.

리소스

  • ComfyUI/ERNIE-Image ComfyUI 워크플로우 소스
    • GitHub: comfy-org/docs
    • Docs / Release Notes: ERNIE-Image ComfyUI workflow example
  • Comfy-Org/ERNIE-Image
    • GitHub: baidu/ERNIE-Image
    • Hugging Face: Comfy-Org/ERNIE-Image
  • Comfy-Org/ernie-image.safetensors
    • GitHub: baidu/ERNIE-Image
    • Hugging Face: ernie-image.safetensors
  • Comfy-Org/ministral-3-3b.safetensors
    • GitHub: baidu/ERNIE-Image
    • Hugging Face: ministral-3-3b.safetensors
  • Comfy-Org/ernie-image-prompt-enhancer.safetensors
    • GitHub: baidu/ERNIE-Image
    • Hugging Face: ernie-image-prompt-enhancer.safetensors
  • Comfy-Org/flux2-vae.safetensors
    • GitHub: baidu/ERNIE-Image
    • Hugging Face: flux2-vae.safetensors

참고: 언급된 모델, 데이터세트 및 코드는 저자와 유지 관리자가 제공한 해당 라이선스 및 약관에 따릅니다.

Want More ComfyUI Workflows?

Qwen-Image | HD 다중 텍스트 포스터 생성기

Qwen-Image | HD 다중 텍스트 포스터 생성기

이미지에서 텍스트 생성의 새로운 시대!

ComfyUI FLUX | 새로운 예술 이미지 생성

ComfyUI FLUX | 새로운 예술 이미지 생성

Black Forest Labs에서 개발한 새로운 이미지 생성 모델

ComfyUI Trellis2 | 이미지-3D 메쉬 생성 작업 흐름

이미지를 구조화되고 편집 가능한 3D 메쉬로 변환하여 정밀한 기하학 및 토폴로지 제어를 제공합니다.

AP Workflow 12.0 | 즉시 사용 가능한 완전한 AI 미디어 스위트

이미지 및 비디오 생성, 향상, 조작을 위한 사전 설정된 올인원 시스템. 설정이 필요 없습니다.

Z-Image LoRA Inference | AI Toolkit ComfyUI

AI Toolkit에서 훈련한 Z-Image LoRA를 단일 RCZimage 파이프라인 노드를 통해 ComfyUI에서 적용하여 훈련과 일치하는 출력을 얻으세요.

FLUX Inpainting | 원활한 이미지 편집

FLUX Inpainting | 원활한 이미지 편집

이미지를 손쉽게 채우고, 제거하고, 정제하여 새로운 콘텐츠를 원활하게 통합합니다.

Era3D | ComfyUI 3D Pack

Era3D | ComfyUI 3D Pack

멀티뷰 이미지부터 상세한 메쉬까지 3D 콘텐츠 생성.

Wan 2.1 Fun | ControlNet 비디오 생성

Depth, Canny, OpenPose와 같은 ControlNet 스타일의 시각적 패스로 비디오를 생성합니다.

팔로우하기
  • 링크드인
  • 페이스북
  • Instagram
  • 트위터
지원
  • 디스코드
  • 이메일
  • 시스템 상태
  • 제휴사
리소스
  • 무료 ComfyUI 온라인
  • ComfyUI 가이드
  • RunComfy API
  • RunComfy MCP
  • ComfyUI 튜토리얼
  • ComfyUI 노드
  • 더 알아보기
법적 고지
  • 서비스 약관
  • 개인정보 보호정책
  • 쿠키 정책
RunComfy
저작권 2026 RunComfy. All Rights Reserved.

RunComfy는 최고의 ComfyUI 플랫폼으로서 ComfyUI 온라인 환경과 서비스를 제공하며 ComfyUI 워크플로우 멋진 비주얼을 제공합니다. RunComfy는 또한 제공합니다 AI Models, 예술가들이 최신 AI 도구를 활용하여 놀라운 예술을 창조할 수 있도록 지원합니다.