ERNIE-Image ComfyUI 워크플로우 | 텍스트에서 이미지로 AI 생성기

ERNIE-Image ComfyUI Workflow

Want to run this workflow?

Fully operational workflows
No missing nodes or models
No manual setups required
Features stunning visuals

ERNIE-Image ComfyUI Examples

ernie-image-comfyui-workflow-text-to-image-ai-generator-1399-example_01.webp

ernie-image-comfyui-workflow-text-to-image-ai-generator-1399-example_02.webp

ernie-image-comfyui-workflow-text-to-image-ai-generator-1399-example_03.webp

ernie-image-comfyui-workflow-text-to-image-ai-generator-1399-example_04.webp

ernie-image-comfyui-workflow-text-to-image-ai-generator-1399-example_05.webp

ernie-image-comfyui-workflow-text-to-image-ai-generator-1399-example_06.webp

ERNIE-Image ComfyUI: 명령을 따르는 텍스트에서 이미지로, 선명한 텍스트 렌더링#

이 ERNIE-Image ComfyUI 워크플로우는 짧은 프롬프트를 고품질 이미지로 변환하여 명령을 따르고 텍스트를 신뢰성 있게 렌더링합니다. Comfy-Org의 ERNIE-Image 확산 모델과 강력한 텍스트 인코더, 선택적 프롬프트 향상기 및 현대적 Flux2 VAE를 결합하여 세부 사항과 타이포그래피를 보존합니다.

빠른 반복을 위해 설계된 ERNIE-Image ComfyUI는 프롬프트를 수용하고, 선택적으로 더 풍부한 지침을 위해 확장하며, 인코딩하고, ERNIE-Image로 샘플링하고, 최종 이미지로 디코딩합니다. 프롬프트 향상 경로는 포함되어 있으며, 그래프를 변경하지 않고 원본과 향상된 프롬프트를 비교할 수 있도록 토글 가능합니다.

Comfyui ERNIE-Image ComfyUI 워크플로우의 주요 모델#

ERNIE-Image 확산 모델. 명령을 따르고 텍스트를 렌더링하도록 조정된 이미지로 라텐트를 디노이즈하는 핵심 생성기입니다. Model card
Ministral-3-3B 텍스트 인코더. 프롬프트를 ERNIE-Image의 조건으로 변환하는 주요 텍스트 인코더입니다. File
ERNIE-Image 프롬프트 향상기. 간결한 프롬프트를 설명적인 지침으로 확장하기 위해 향상 브랜치에서 사용하는 보조 인코더입니다. File
Flux2 VAE. 샘플러에서 라텐트를 픽셀로 변환하면서 세부 사항과 판독 가능한 텍스트를 보존하는 디코더입니다. File

Comfyui ERNIE-Image ComfyUI 워크플로우 사용 방법#

높은 수준에서, 프롬프트는 선택적 향상 단계를 거쳐 인코딩된 후 ERNIE-Image로 샘플링되어 라텐트가 되고, 마지막으로 Flux2 VAE에 의해 디코딩되어 저장됩니다. 아래 그룹은 그래프에 직접 매핑되어 입력을 조정할 위치를 항상 알 수 있습니다.

프롬프트#

ERNIE-Image ComfyUI 서브그래프의 최상위 prompt 필드에 보고 싶은 내용을 작성하세요. 명확하고 지시적인 문구가 명령 따르기와 텍스트 렌더링에 가장 적합합니다. 이미지에 그려질 텍스트를 인용하여 포함할 수 있습니다. 긍정적 조건은 이 프롬프트에서 구축되며, 부정적 경로는 빈 상태로 시작하므로 나중에 부정적 요소를 추가하지 않는 한 결과는 충실합니다.

프롬프트 향상#

Enable prompt enhancement? (#76)을 사용하여 향상 경로를 켜거나 끌 수 있습니다. 켜져 있을 때, 짧은 브리프는 TextGenerate (#74)로 확장되어 ERNIE-Image 프롬프트 향상기를 통해 로드됩니다. 향상기는 귀하의 프롬프트를 풍부하게 하도록 구조화된 명령을 사용하며, 일관된 구성을 장려하기 위해 목표 너비 및 높이도 전달합니다. ComfySwitchNode (#75)는 원본 또는 향상된 텍스트를 다운스트림으로 라우팅하여 A/B 테스트를 쉽게 할 수 있도록 합니다. 광범위한 호환성을 위해 기본적으로 토글은 꺼져 있으며, 향상 모델이 존재하면 활성화하십시오.

모델#

워크플로우는 세 가지 자산을 로드합니다: UNETLoader (#66)는 ERNIE-Image 확산 모델을 선택하고, CLIPLoader (#62)는 Ministral-3-3B 텍스트 인코더를 가져오고, VAELoader (#63)는 Flux2 VAE를 제공합니다. 이 조합이 ERNIE-Image ComfyUI의 강력한 명령 준수 및 깔끔한 타이포그래피를 제공합니다. 모델을 교체할 경우, 불일치를 피하기 위해 삼중 조합을 조정하십시오.

이미지 크기#

EmptyFlux2LatentImage (#71)는 캔버스를 정의합니다. 너비와 높이를 원하는 종횡비로 설정하십시오; 풍경, 인물 사진, 정사각형 그래픽 모두 작동합니다. 이러한 치수는 토글이 켜져 있을 때 향상 프롬프트에도 주입되어 모델이 레이아웃 및 텍스트 배치를 계획하는 데 도움이 됩니다. 더 큰 크기는 더 많은 계산 비용이 들며, 빠른 미리보기를 위해 작은 치수를 사용한 후 필요에 따라 나중에 업스케일하십시오.

텍스트에서 이미지로#

CLIPTextEncode (#67)는 라우팅된 프롬프트를 긍정적 조건으로 변환하고, CLIPTextEncode (#72)는 부정적 경로를 제공합니다 (기본적으로 빈 상태). KSampler (#70)는 ERNIE-Image 모델과 귀하의 조건을 사용하여 라텐트를 생성합니다. 샘플링 후, VAEDecode (#65)는 라텐트를 RGB 픽셀로 변환합니다. 모든 것이 원클릭 생성에 연결되어 있어, 입력이 설정되면 작업을 큐에 넣고 미리보기를 지켜보십시오.

출력#

이미지는 SaveImage (#73)에 의해 저장됩니다. UI 미리보기와 출력 디렉토리에서 확인할 수 있습니다. 텍스트 브랜치의 효과를 분리하려면 향상 켜기와 끄기 비교 시 일관된 시드를 사용하십시오.

Comfyui ERNIE-Image ComfyUI 워크플로우의 주요 노드#

KSampler (#70) 확산 경로를 제어하는 주요 생성기입니다. 품질 대 속도에 대한 steps를 조정하고, 프롬프트 준수를 강화하거나 완화하기 위해 cfg를 사용하며, 프롬프트 변형 간 일관성을 위해 고정된 seed를 설정하십시오. 높은 지침은 준수를 강화할 수 있지만, 창의성을 감소시킬 수 있습니다; 취향에 맞게 균형 잡으십시오. ComfyUI의 샘플러 참조를 통해 일반적인 동작을 확인하십시오. ComfyUI

UNETLoader (#66) 실제로 라텐트를 이미지로 디노이즈하는 ERNIE-Image 확산 모델을 로드합니다. 명령 준수 및 텍스트 렌더링의 이점을 누리려면 ERNIE-Image 체크포인트로 설정하십시오. 모델을 교체하면 스타일 및 타이포그래피 기능의 변화가 예상됩니다. ERNIE-Image

CLIPLoader (#62) 주요 조건 경로에 사용되는 Ministral-3-3B 텍스트 인코더를 제공합니다. 인코더를 교체하면 언어가 비주얼로 매핑되는 방식이 변경됩니다; 명령 준수를 위해 ERNIE-Image 스택과 정렬된 상태로 유지하십시오. 이 노드는 하류의 긍정적 및 부정적 인코더에 영향을 미칩니다. Ministral-3-3B file

VAELoader (#63) 디코딩 중에 사용되는 Flux2 VAE를 제공합니다. 일치하는 VAE는 색상과 가장자리 충실도를 보존하고 렌더링된 텍스트를 선명하게 유지하는 데 도움이 됩니다. ERNIE-Image로 생성할 때 이 기능을 사용하십시오. Flux2 VAE file

EmptyFlux2LatentImage (#71) 선택한 해상도로 빈 라텐트 캔버스를 초기화합니다. 이는 최종 이미지 크기를 설정하고 레이아웃을 미세하게 안내합니다. 치수를 변경하면 해당 경로가 활성화되어 있을 때 향상기의 내부 명령도 업데이트됩니다.

CLIPTextEncode (#67) 최종 라우팅된 프롬프트를 긍정적 조건으로 인코딩합니다. 텍스트 렌더링을 개선하기 위해, 인용 부호 안에 나타나길 원하는 정확한 단어를 포함하고, 중요하다면 케이싱을 지정하십시오. 최상의 준수를 위해 지시를 간결하고 구체적으로 유지하십시오.

CLIPTextEncode (#72) 부정적 프롬프트를 인코딩합니다. 기본적으로 비어 있어 귀하의 의도에 가깝게 출력을 유지합니다. 원치 않는 아티팩트를 발견하면 여기에 몇 가지 간결한 부정적 용어를 추가하십시오.

TextGenerate (#74) Load CLIP (PE) (#91)에 의해 로드된 ERNIE-Image 프롬프트 향상기를 사용하여 확장된 설명을 생성합니다. 짧은 브리프를 풍부하고 시각적인 방향으로 전환하여 구성과 세부 사항을 개선하는 데 유용합니다. 문자 그대로의 제어를 위해 향상 토글을 끄고, 설명적 다양성을 위해 켜십시오. Prompt Enhancer file

ComfySwitchNode (#75) Enable prompt enhancement? (#76)에 따라 원본 또는 향상된 프롬프트를 전달합니다. 연결을 변경하지 않고 A/B 테스트를 간단하게 할 수 있습니다. 프롬프트 전용 차이를 격리하려면 비교 시 고정된 seed를 사용하십시오.

VAEDecode (#65) Flux2 VAE를 사용하여 최종 라텐트를 이미지로 디코딩합니다. 이 단계는 색상, 선명도 및 작은 텍스트의 판독성을 크게 좌우합니다. ERNIE-Image 스택의 Flux2 VAE와 함께 사용하십시오.

SaveImage (#73) 생성된 이미지를 디스크에 저장하고 UI에 노출합니다. 여러 ERNIE-Image ComfyUI 실행을 벤치마크할 계획이라면 일관된 명명 규칙을 사용하십시오.

선택적 추가 기능#

선명한 레터링을 위해, 정확한 단어를 인용 부호에 넣고 "굵은 세리프 레이블" 또는 "손글씨 태그"와 같은 스타일 큐를 지정하십시오; ERNIE-Image ComfyUI는 텍스트 렌더링에 최적화되어 있습니다.
"중앙에 배치된 제품 사진", "흰색 배경", "2:3 포스터 레이아웃"과 같은 명확한 지시를 사용하여 ERNIE-Image ComfyUI가 명령을 정확하게 따를 수 있도록 하십시오.
향상 경로를 비교할 때, seed를 고정하고 향상 토글만 전환하여 진정한 A/B 차이를 확인하십시오.
장면과 일치하는 종횡비를 선택하십시오; ERNIE-Image ComfyUI는 크기 힌트를 존중하고 레이아웃을 계획합니다.

감사의 말#

이 워크플로우는 다음 작업 및 리소스를 구현하고 기반으로 합니다. 우리는 ERNIE-Image (재포장된 모델 파일 및 자산)를 위해 Comfy-Org, 원본 ERNIE-Image 모델을 위해 Baidu, ERNIE-Image ComfyUI 워크플로우 예제를 위한 ComfyUI 팀에 감사를 표합니다. 권위 있는 세부 사항은 아래 링크된 원본 문서 및 저장소를 참조하십시오.

리소스#

ComfyUI/ERNIE-Image ComfyUI 워크플로우 소스
- GitHub: comfy-org/docs
- Docs / Release Notes: ERNIE-Image ComfyUI workflow example
Comfy-Org/ERNIE-Image
- GitHub: baidu/ERNIE-Image
- Hugging Face: Comfy-Org/ERNIE-Image
Comfy-Org/ernie-image.safetensors
- GitHub: baidu/ERNIE-Image
- Hugging Face: ernie-image.safetensors
Comfy-Org/ministral-3-3b.safetensors
- GitHub: baidu/ERNIE-Image
- Hugging Face: ministral-3-3b.safetensors
Comfy-Org/ernie-image-prompt-enhancer.safetensors
- GitHub: baidu/ERNIE-Image
- Hugging Face: ernie-image-prompt-enhancer.safetensors
Comfy-Org/flux2-vae.safetensors
- GitHub: baidu/ERNIE-Image
- Hugging Face: flux2-vae.safetensors

참고: 언급된 모델, 데이터세트 및 코드는 저자와 유지 관리자가 제공한 해당 라이선스 및 약관에 따릅니다.

Want More ComfyUI Workflows?

Qwen-Image | HD 다중 텍스트 포스터 생성기

이미지에서 텍스트 생성의 새로운 시대!

ComfyUI FLUX | 새로운 예술 이미지 생성

Black Forest Labs에서 개발한 새로운 이미지 생성 모델

ComfyUI VNCCS 클론 | 일관된 캐릭터 생성기

안정적이고 고품질의 스프라이트 준비된 결과로 캐릭터를 빠르게 복제하세요.

ReActor | 빠른 얼굴 교체

ComfyUI ReActor를 사용하면 이미지나 비디오에서 한 명 이상의 캐릭터 얼굴을 쉽게 교체할 수 있습니다.

SCAIL 모델 | 포즈 안내 애니메이션 제작기

정체성 안정성과 움직임 정확성을 갖춘 포즈 기반 애니메이션.

VOID Video Inpainting ComfyUI | 스마트 객체 제거

비디오에서 객체를 지우고 매끄럽고 일관된 장면 복원을 수행하세요.

CogVideoX Tora | 이미지-비디오 모델

CogVideoX의 주제 경로 비디오 데모

Face Detailer | 얼굴 수정

얼굴 복원을 위해 먼저 Face Detailer를 사용한 다음, 탁월한 고화질 upscaling을 위해 4x UltraSharp Model을 사용하세요.

팔로우하기

지원

리소스

법적 고지

RunComfy

RunComfy는 최고의 ComfyUI 플랫폼으로서 ComfyUI 온라인 환경과 서비스를 제공하며 ComfyUI 워크플로우 멋진 비주얼을 제공합니다. RunComfy는 또한 제공합니다 AI Models, 예술가들이 최신 AI 도구를 활용하여 놀라운 예술을 창조할 수 있도록 지원합니다.

ERNIE-Image ComfyUI | 스마트 텍스트에서 이미지로 생성기