Cosmos-Predict2 | Text2Image & Video2World
이 포괄적인 ComfyUI 워크플로우는 고품질 시각적 생성을 위해 설계된 최첨단 물리 세계 기반 모델인 NVIDIA의 Cosmos-Predict2를 활용합니다. 텍스트 설명에서 놀라운 이미지를 생성하거나 뛰어난 물리적 정확성과 환경 상호작용으로 비디오를 변환하세요. 이 모델은 복잡한 물리 현상과 동적 장면을 시뮬레이션하는 데 뛰어나며 산업 시뮬레이션, 자율 주행 시각화, 도시 계획 및 과학 연구 응용에 적합합니다.ComfyUI Cosmos-Predict2 워크플로우
ComfyUI Cosmos-Predict2 예제

ComfyUI Cosmos-Predict2 설명
Cosmos-Predict2 ComfyUI 워크플로우란 무엇입니까?
Cosmos-Predict2 ComfyUI 워크플로우는 NVIDIA의 차세대 물리 세계 기반 모델을 손쉽게 사용할 수 있도록 하여 고품질 텍스트-이미지 생성과 혁신적인 비디오-세계 변환을 가능하게 합니다. 이는 디지털 수정구와 같아서 텍스트 설명에서 멋진 이미지를 생성할 뿐만 아니라 물리 법칙을 따르는 현실적인 비디오 시퀀스를 예측하고 생성할 수 있습니다.
이 Cosmos-Predict2 워크플로우는 물리 AI 시나리오에 특화된 정교한 2B-파라미터 기반 모델을 활용합니다. Cosmos-Predict2의 특별한 점은 무엇일까요? 단순히 예쁜 그림을 생성하는 것이 아니라 물리학, 환경 상호작용, 현실적인 동작을 이해하여 산업 시뮬레이션, 자율 주행 시나리오, 도시 계획 및 과학 연구 응용에 적합합니다.
Cosmos-Predict2의 주요 기능 및 장점
이중 생성 모드: Cosmos-Predict2는 정적 비주얼 생성을 위한 텍스트-이미지 생성과 동적 장면 예측을 위한 비디오-세계 변환을 지원하며, 모든 것이 단일 Cosmos-Predict2 ComfyUI 워크플로우 내에서 이루어집니다.
물리적 정확성: 표준 이미지 생성기와 달리, Cosmos-Predict2는 뛰어난 물리적 정확성과 환경 상호작용을 유지하여 Cosmos-Predict2가 생성한 콘텐츠가 현실 세계의 물리학과 동작을 따르도록 합니다.
전문적 응용: Cosmos-Predict2는 산업 시뮬레이션, 자율 주행 개발, 도시 계획 시각화 및 정확성이 가장 중요한 과학 연구와 같은 진지한 용도를 위해 설계되었습니다.
유연한 비디오 제어: Cosmos-Predict2 비디오 생성 구성 요소는 첫 번째 및 마지막 프레임 제어를 위한 선택적 기능을 포함하여, 시간 시퀀스 및 장면 전환에 대한 정밀한 방향을 제공합니다.
ComfyUI에서 Cosmos-Predict2를 사용하는 방법
Cosmos-Predict2 텍스트-이미지 워크플로우
이미지 크기 설정
- EmptySD3LatentImage 노드를 사용하여 Cosmos-Predict2 생성을 위한 출력 크기를 정의합니다:
- 기본값: 1024x1024 픽셀
- Cosmos-Predict2 요구 사항에 따라 폭과 높이를 조정합니다
- 단일 이미지 생성을 위해 batch_size를 1로 유지합니다 텍스트 프롬프트 작성
- Cosmos-Predict2의 CLIP Text Encode (Prompt) 노드에서:
- 최고의 Cosmos-Predict2 결과를 위한 상세하고 설명적인 프롬프트를 작성하세요
- Cosmos-Predict2는 물리 세계 설명에 뛰어납니다
- Cosmos-Predict2 프롬프트에 환경 세부사항과 공간적 관계를 포함하세요
- 생성 및 저장
Run
을 눌러 Cosmos-Predict2 이미지를 생성하고, 이는 자동으로 출력 디렉토리에 저장됩니다.
Cosmos-Predict2 비디오-세계 워크플로우
- 입력 이미지 업로드
- Cosmos-Predict2 비디오 생성을 위한 시작 프레임을 가져오려면 Load Image 노드를 사용하세요.
- 비디오 매개변수 구성
- CosmosPredict2ImageToVideoLatent 노드에서:
- Width/Height: Cosmos-Predict2 성능을 최적화하기 위해 848x480으로 설정합니다
- Length: 16fps에서 약 2초의 Cosmos-Predict2 비디오를 위해 33프레임으로 설정합니다
- Batch_size: Cosmos-Predict2 처리를 위해 1로 유지합니다
- CosmosPredict2ImageToVideoLatent 노드에서:
- 선택적 프레임 제어
- Cosmos-Predict2에서 첫 번째 및 마지막 프레임 제어를 위해 우회 노드를 활성화합니다 (Ctrl+B):
- Cosmos-Predict2 비디오 시작 및 종료 지점을 안내하기 위해 추가 이미지를 업로드하세요
- Cosmos-Predict2로 특정 내러티브 시퀀스를 만들기에 완벽합니다
- Cosmos-Predict2에서 첫 번째 및 마지막 프레임 제어를 위해 우회 노드를 활성화합니다 (Ctrl+B):
- 비디오 생성 실행
- 물리 인식 비디오 시퀀스를 생성하기 위해 Cosmos-Predict2 워크플로우를 실행하여 시간적 일관성을 유지합니다.
Cosmos-Predict2 필수 설정
- Cosmos-Predict2를 위한 KSampler 구성:
- Steps: Cosmos-Predict2 품질 균형을 위한 기본값 35
- CFG: 적절한 Cosmos-Predict2 안내 강도를 위한 4.0
- Sampler: Cosmos-Predict2에 권장되는 euler
- Scheduler: 매끄러운 Cosmos-Predict2 생성을 위한 karras
- Cosmos-Predict2 비디오 생성 설정:
- FPS: Cosmos-Predict2에 최적화된 초당 16프레임
- Format: 귀하의 Cosmos-Predict2 시스템에 가장 적합한 코덱을 자동 감지
- 프레임 수가 적을수록 Cosmos-Predict2 생성이 더 빠르고, 많을수록 모션이 더 부드럽습니다
감사의 말
이 Cosmos-Predict2 ComfyUI 워크플로우는 물리 세계 AI 생성의 돌파구인 NVIDIA의 Cosmos-Predict2 기반 모델을 통합합니다. 이 첨단 Cosmos-Predict2 물리 시뮬레이션 모델을 개발한 NVIDIA 연구팀과 매끄러운 Cosmos-Predict2 통합을 가능하게 한 ComfyUI 커뮤니티에 특별히 감사드립니다. Cosmos-Predict2 모델 가중치와 기술 구현은 NVIDIA의 공식 Cosmos-Predict2 사양을 따르며, 전문 응용을 위한 진정한 성능을 보장합니다.
Cosmos-Predict2에 대한 추가 자료
Cosmos-Predict2와 관련된 기술 자료 및 문서를 탐색하세요:
- GitHub Repository – 공식 Cosmos-Predict2 구현 및 모델 파일.
- HuggingFace Hub – ComfyUI 통합을 위한 사전 훈련된 Cosmos-Predict2 모델 가중치 및 문서.
더 많은 ComfyUI 워크플로우를 원하시나요?
RunComfy는 최고의 ComfyUI 플랫폼으로서 ComfyUI 온라인 환경과 서비스를 제공하며 ComfyUI 워크플로우 멋진 비주얼을 제공합니다. RunComfy는 또한 제공합니다 AI Playground, 예술가들이 최신 AI 도구를 활용하여 놀라운 예술을 창조할 수 있도록 지원합니다.