Ideogram 4 ComfyUI 워크플로우: 정밀한 레이아웃과 타이포그래피를 갖춘 구조화된 텍스트-이미지#
이 Ideogram 4 ComfyUI 워크플로우는 디자인, 레이아웃 제어 및 이미지 내 텍스트에 신뢰성을 갖춘 비상업 라이선스의 open-weight 텍스트-이미지 모델인 Ideogram 4.0을 위한 컴팩트하고 RunComfy-ready한 템플릿입니다. 구조화된 JSON 캡션을 장면 요약, 스타일 블록, 정규화된 경계 상자 및 16진수 색상 팔레트와 함께 이미지로 변환하여 포스터, 브랜드 컴프, 타이포그래피가 많은 그래픽 및 레이아웃 인식 일러스트레이션에 이상적입니다.
그래프는 깨끗한 단일 경로 텍스트-이미지 파이프라인과 선택적 그래프 내 JSON 프롬프트 빌더를 제공합니다. 이미 JSON 프롬프트를 작성하는 경우, 이를 붙여넣고 즉시 렌더링할 수 있으며, 짧은 아이디어에서 시작하고 싶다면 LLM 도우미가 스키마에 맞는 캡션을 초안으로 작성해주어 미리보기 후 생성기에 붙여넣을 수 있습니다. 내부적으로 이 워크플로우는 Ideogram 4의 흐름 일치 DiT 샘플링과 비대칭 분류기 자유 가이드를 따릅니다.
Comfyui Ideogram 4 ComfyUI 워크플로우의 주요 모델#
- Ideogram 4 (FP8). JSON 기반 생성, 강력한 텍스트 렌더링 및 명시적 레이아웃 제어를 위해 흐름 일치로 훈련된 9.3B-매개변수 Diffusion Transformer. 공식 모델 카드: ideogram-ai/ideogram-4-fp8. 추론 코드: ideogram-oss/ideogram4.
- Ideogram 4 비조건 분기. 샘플링 중 비대칭 분류기 자유 가이드를 위해 사용되는 쌍의 비조건 체크포인트; ComfyUI와 함께 포장된 메인 모델: Comfy-Org/Ideogram-4.
- Qwen3-VL-8B-Instruct (FP8). 프롬프트로부터 다중 스케일 의미론적 기능을 제공하는 텍스트 인코더로 사용되는 비전-언어 인코더: Qwen/Qwen3-VL-8B-Instruct-FP8 (ComfyUI 재패키지: Comfy-Org/Qwen3-VL).
- FLUX.2 VAE. 샘플된 잠재 변수를 최종 이미지로 변환하는 데 사용되는 디코더, ComfyUI를 위해 패키지됨: Comfy-Org/flux2-dev.
Comfyui Ideogram 4 ComfyUI 워크플로우 사용 방법#
전체 논리: 캔버스를 선택하고, 프롬프트(이상적으로는 구조화된 JSON)를 제공하고, 샘플러 프리셋(Default, Quality, Turbo)을 선택한 다음 렌더링합니다. 메인 "텍스트-이미지(Ideogram v4)" 서브그래프는 인코딩, 가이던스, 샘플링 및 디코딩을 한 번에 수행합니다; 선택적 "LLM 프롬프트 빌더" 그룹은 JSON을 초안으로 작성할 수 있습니다.
- 캔버스 및 가로 세로 비율:
ResolutionSelector(#37)- 1:1, 16:9, 9:16과 같은 프리셋을 선택하세요. 워크플로우는 Ideogram 4에 적합한 유효한 크기(16의 배수 및 적절한 최소값)를 계산하고 이를 샘플러 및 VAE에 전파합니다. 이를 통해 정사각형 썸네일부터 높은 포스터까지 수동 계산 없이 대상화할 수 있습니다. 언제든지 변경 가능하며, 스케줄러는 선택한 해상도에 맞게 조정됩니다.
- 프롬프트 및 JSON 캡션:
CLIP Text Encode (Positive Prompt)(#24)- 자연어를 붙여넣거나, 최상의 결과를 위해 Ideogram 4의 스키마를 따르는 구조화된 JSON 캡션을 사용하세요.
high_level_description,style_description블록(대문자 16진수 코드로 된color_palette포함),compositional_deconstruction섹션을 사용하세요. 경계 상자는[y_min, x_min, y_max, x_max]순서로 0-1000 그리드에서 정규화되며, 좌상단에서 시작합니다; 이미지에 문자 그대로 텍스트를 렌더링하려면type: "text"항목을 포함하세요. 모델은 키 순서에 민감합니다; 공식 가이드는 docs/prompting.md를 참조하세요.
- 자연어를 붙여넣거나, 최상의 결과를 위해 Ideogram 4의 스키마를 따르는 구조화된 JSON 캡션을 사용하세요.
- 프리셋 모드(속도 대 품질): 서브그래프 내부의 "Preset" 그룹
- 서브그래프의
mode입력에서 모드를 선택하세요: Default(균형), Quality(더 많은 단계 및 충실도), Turbo(더 적은 단계 및 가장 빠른 피드백). 워크플로우는 작은 내부 프리셋 테이블을 구문 분석하여 일치하는 단계 수 및 일정 매개변수를 스케줄러에 라우팅합니다. 프리셋을 전환하여 빠르게 반복한 다음 더 높은 품질로 마무리하세요.
- 서브그래프의
- 샘플링 및 가이던스: 서브그래프 내부의 "Sampling" 그룹
- 파이프라인은 비대칭 분류기 자유 가이던스를 위한 쌍의 비조건 분기와 함께 흐름 일치 샘플링을 사용합니다.
DualModelGuider는 조건부 및 비조건부 예측을 혼합하여,Ideogram4Scheduler는 선택한 크기와 프리셋에 맞는 노이즈 스케줄을 형성합니다.KSamplerSelect는 알고리즘을 선택하고SamplerCustomAdvanced는 디코딩 전에 디노이징 패스를 실행합니다.
- 파이프라인은 비대칭 분류기 자유 가이던스를 위한 쌍의 비조건 분기와 함께 흐름 일치 샘플링을 사용합니다.
- 모델(사전 연결됨): 서브그래프 내부의 "Models" 그룹
- 그래프는 메인 Ideogram 4 모델, 비조건 파트너, Qwen3-VL 텍스트 인코더 및 FLUX.2 VAE를 로드합니다. 이들은 가이더, 샘플러 및 디코더에 연결됩니다. 보통 변경할 필요가 없지만, ComfyUI를 위해 패키지된 변형을 실험하는 경우 모델을 교체할 수 있습니다.
- 선택 사항: 그래프 내 JSON 초안 작성:
JSON Prompt Builder (Gemma4)(#134)- "LLM Prompt Builder (Select and Ctrl+B to enable)" 그룹을 선택하여 켜세요.
user_prompt필드에 짧은 아이디어를 입력하세요; 노드는 스키마에 맞는 JSON 캡션을 초안으로 작성하여PreviewAny(#111)로 미리볼 수 있습니다. 생성된 JSON을 이미지 서브그래프의 메인prompt입력에 복사하세요.
- "LLM Prompt Builder (Select and Ctrl+B to enable)" 그룹을 선택하여 켜세요.
- 출력:
SaveImage(#158)- 이미지는 모델 버전 이름의 폴더에 저장됩니다. 다른 프리셋이나 가로 세로 비율에서의 출력을 따로 보관하고 싶다면 접두사를 변경하세요.
Comfyui Ideogram 4 ComfyUI 워크플로우의 주요 노드#
CLIP Text Encode (Positive Prompt)(#24)- Qwen3-VL로 프롬프트를 인코딩하여 Ideogram 4를 위해 사용합니다. 레이아웃 제어, 이미지 내 명확한 텍스트, 팔레트 스티어링을 위해 구조화된 JSON을 사용하세요. 키 순서를 안정적으로 유지하고 값이 0-1000 그리드에 있는
[y_min, x_min, y_max, x_max]로bbox항목을 사용하세요; 이는 모델의 문서화된 스키마와 일치합니다 docs/prompting.md.
- Qwen3-VL로 프롬프트를 인코딩하여 Ideogram 4를 위해 사용합니다. 레이아웃 제어, 이미지 내 명확한 텍스트, 팔레트 스티어링을 위해 구조화된 JSON을 사용하세요. 키 순서를 안정적으로 유지하고 값이 0-1000 그리드에 있는
UNETLoader(#23)- 조건부 디노이징을 수행하는 메인 Ideogram 4 체크포인트를 로드합니다. 이는 인코딩된 캡션을 이미지로 변환하는 백본입니다; 가장 일관된 결과를 위해 공식 릴리스를 그대로 유지하세요: ideogram-ai/ideogram-4-fp8.
UNETLoader(#154)- 비대칭 분류기 자유 가이던스를 위해 사용되는 비조건 Ideogram 4 체크포인트를 로드합니다. 메인 모델과 쌍을 이루어 가이더가 프롬프트 준수 및 전체 이미지 품질을 별도로 제어할 수 있게 합니다: Comfy-Org/Ideogram-4.
DualModelGuider(#155)- 비대칭 분류기 자유 가이던스를 구현하기 위해 조건부 및 비조건부 예측을 결합합니다. 가이던스 강도를 조정하려면 트레이드오프를 이해해야 합니다: 너무 약하면 프롬프트 충실도가 약해지고, 너무 강하면 과도하게 날카로워지거나 왜곡될 수 있습니다. 프리셋을 변경할 때, 유사한 "느낌"을 유지하기 위해 가이던스를 재검토하세요.
Ideogram4Scheduler(#17)- 선택한 너비와 높이에 맞게 Ideogram 4에 특화된 노이즈 스케줄 및 단계 수를 생성합니다. "Preset" 그룹이 일치하는 단계 및 스케줄 매개변수를 제공합니다; 최종 렌더링에는 Quality, 초안에는 Turbo, 일상 작업에는 Default를 사용하세요.
SamplerCustomAdvanced(#12)- 선택한 샘플러와 스케줄러의
sigmas를 사용하여 디노이징 패스를 실행합니다. 샘플러 패밀리를 비교하려는 경우가 아니라면 변경하지 마세요; 샘플러를 교체할 경우, 해상도와 프리셋을 고정하여 A/B 테스트를 의미 있게 만드세요.
- 선택한 샘플러와 스케줄러의
CFGOverride(#157)- 샘플링 중 조건부가 적용되는 방식을 세밀하게 조정하는 노브를 제공합니다. 대부분의 사용자는 프리셋에 의존하고 이 부분을 무시할 수 있습니다; 조정할 경우, 작은 변화를 주고 여러 프롬프트에서 재평가하여 단일 장면에 샘플러 동작을 과적합하지 않도록 하세요.
VAELoader(#9) 및VAEDecode(#13)- 샘플된 잠재 변수를 최종 이미지로 디코딩하기 위해 FLUX.2 VAE를 로드하고 적용합니다. 색채와 디테일 균형을 유지하기 위해 공식 VAE를 유지하세요; 대안을 테스트하는 경우가 아니라면: Comfy-Org/flux2-dev.
선택적 추가 항목#
- JSON에
type: "text"요소를 사용하여 이미지에 정확한 문구를 렌더링하세요; 문자열을 간결하게 유지하고 전용bbox로 배치하세요. style_description.color_palette에 3~6가지 색상을 대문자 16진수로 시작하고, 지역 재정의가 필요할 때만 개별 요소 팔레트를 추가하세요.- 레이아웃을 세 부분으로 생각하세요: 깊이를 창출하기 위해
bbox크기와 위치를 다양화하세요; 겹치지 않는 상자는 충돌을 줄입니다. - 구성을 재현하려면 노이즈 시드를 고정하세요; JSON을 변경하지 않고 변형을 탐색하려면 변경하세요.
- "Image blocked by safety filter" 메시지가 표시되면, 이는 모델 자체에서 오는 응답입니다; 안전하고 스키마에 일관된 프롬프트로 내용을 조정하세요. 전체 세부 사항은 모델 카드에서 확인하세요: ideogram-ai/ideogram-4-fp8.
감사의 글#
이 워크플로우는 다음 작업 및 리소스를 구현하고 기반으로 합니다. Comfy-Org의 ComfyUI Day 0 지원 발표 및 Ideogram 4에 대한 워크플로우 템플릿, Comfy-Org의 Ideogram-4 모델 카드, 그리고 ideogram-oss의 오픈 소스 Ideogram 4 저장소에 대한 기여 및 유지 관리에 대해 감사드립니다. 권위 있는 세부 사항은 아래에 링크된 원본 문서 및 저장소를 참조하십시오.
리소스#
- Comfy-Org/Comfy 블로그 발표
- 문서 / 릴리스 노트: Ideogram 4 Day 0 support in ComfyUI
- Comfy-Org/Comfy 워크플로우 템플릿
- Comfy-Org/Ideogram 4 ComfyUI 모델 카드
- Hugging Face: Comfy-Org/Ideogram-4
- ideogram-oss/Ideogram 4 오픈 소스 저장소
- GitHub: ideogram-oss/ideogram4
참고: 참조된 모델, 데이터셋 및 코드의 사용은 해당 저자 및 유지 관리자가 제공한 라이선스 및 약관의 적용을 받습니다.










