特别感谢 Nvidia 发布 Cosmos 模型系列，以及 ComfyUI 团队卓越的本地实现，使这一工作流成为可能。

ComfyUI Nvidia Cosmos Workflow

Nvidia Cosmos Text or Image-to-Video Workflow in ComfyUI | Video Generation

Want to run this workflow?

Fully operational workflows
No missing nodes or models
No manual setups required
Features stunning visuals

ComfyUI Nvidia Cosmos Examples

nvidia-cosmos-text-or-image-to-video-workflow-in-comfyUI-video-generation-1184-example_1.webp

nvidia-cosmos-text-or-image-to-video-workflow-in-comfyUI-video-generation-1184-example_2.webp

nvidia-cosmos-text-or-image-to-video-workflow-in-comfyUI-video-generation-1184-example_3.webp

nvidia-cosmos-text-or-image-to-video-workflow-in-comfyUI-video-generation-1184-example_4.webp

ComfyUI Nvidia Cosmos 文本和图像到视频工作流#

什么是 Nvidia Cosmos 工作流#

通过在 ComfyUI 中新发布的 Nvidia Cosmos 模型将您的想象力转化为流畅的视频。此工作流展示了 Nvidia Cosmos 强大的 AI 能力，其文本到视频和图像到视频的生成功能。凭借 Nvidia Cosmos 的尖端 7B 和 14B 模型，您可以从文本描述或静态图像中创建高质量的视频。Nvidia Cosmos 引擎通过其超高效的视频处理能力提供出色的结果。

Nvidia Cosmos 的关键特性#

双重生成模式：Nvidia Cosmos 提供文本到视频和图像到视频生成
保证运动：使用 121 帧时始终生成带有运动的视频
有效的负面提示：非蒸馏模型通过负面提示确保更好的控制
灵活的图像控制：从最后一帧生成或在图像之间创建过渡
超高效 VAE：Nvidia Cosmos 使用精炼的 VAE 系统进行流畅、高质量的视频生成
高分辨率支持：在 704x704 及以上的分辨率下创建视频
精确的帧控制：优化为 121 帧序列
智能图像插值：在参考图像之间生成平滑过渡

如何使用 Nvidia Cosmos 工作流#

Nvidia Cosmos 工作流包含两个主要部分：_文本到视频_ 和 _图像到视频_ 生成。默认情况下，_图像到视频_ 组被绕过。要在两种模式之间切换：

对于 _文本到视频_：保持 _图像到视频_ 组被绕过（默认设置）
对于 _图像到视频_：右键单击 _图像到视频_ 组并选择 Set Group Nodes to Always

1. 使用 Nvidia Cosmos 进行文本到视频生成#

设置和要求#

选择您喜欢的 Nvidia Cosmos 模型大小（建议从 7B 开始）
设置分辨率（默认 1280x704；最低 704x704）
帧设置：
- 长度：121 帧（模型在 121 的长度下性能最佳；偏离太多可能导致视频质量下降。）
- 帧率：24.00（最佳质量的默认速率） <img src="https://cdn.runcomfy.net/workflow_assets/1184/readme02.webp" alt="Nvidia Cosmos" width="350"/> <img src="https://cdn.runcomfy.net/workflow_assets/1184/readme03.webp" alt="Nvidia Cosmos" width="350"/>

Nvidia Cosmos 的采样参数#

采样器：res_multistep (Nvidia 推荐的 Cosmos 采样器)
调度器：karras (默认的稳定性)
步骤：20 (更高 = 更好质量但更慢；更低 = 更快但细节较少)
CFG：6.5 (提示引导强度)
降噪：1.00 (1.00 = 完全转换；更低的值保留更多原始内容)

Nvidia Cosmos 的提示建议#

使用详细的多句提示以获得更好的结果
包括全面的负面提示
简短的提示可能生成连贯的视频，但可能不严格遵循指令

2. 使用 Nvidia Cosmos 进行图像到视频生成#

设置和要求#

与 Nvidia Cosmos 文本到视频相同的基本要求
支持 start_image 和 end_image 输入

参考图像选项#

设置 start_image 或 end_image，或同时设置两者
图像在风格和内容上相似时效果最佳（以获得平滑过渡）

关键参数#

与文本到视频模式相同的采样设置
保持相同的视频质量标准

Nvidia Cosmos 的高级提示#

使用更多 VRAM 获得更高质量的结果，尝试 Nvidia Cosmos 14B 模型
确保提示描述性和详细性以获得最佳结果
尝试不同的图像对以获得独特的过渡

关于 Nvidia Cosmos 的更多信息#

有关 Nvidia Cosmos 的更多详细信息和更新，请访问 Nvidia Cosmos Official Page。

Want More ComfyUI Workflows?

CogvideoX Fun | 视频到视频模型

CogVideoX Fun: 高级视频到视频模型，用于高质量视频生成。

Hunyuan Video | 从文本到视频

从文本提示生成视频。

ComfyUI Grounding | 对象跟踪工作流

以像素级精度跟踪任何主体，获得令人惊叹的 VFX 效果。

Qwen Image 2512 | 精确的 AI 图像生成器

超详细的艺术创作，具有下一代视觉精度和控制。

ChatterBox TTS ComfyUI | AI 语音生成器

快速轻松地构建逼真的语音，适用于任何语言或风格。

Stable Diffusion 3 (SD3) | 文本到图像

将 Stable Diffusion 3 媒介集成到您的工作流程中，生成卓越的 AI 艺术作品。

LayerDiffuse + TripoSR | 图像到3D

使用 LayerDiffuse 创建透明图像,并使用 TripoSR 快速创建3D对象

Z-Depth Maps | Houdini 式动画

仅使用 2D 图像，通过 Z-Depth Maps 创建令人惊叹的 Houdini 式动画。

关注我们

支持

资源

法律

RunComfy

RunComfy 是首选的 ComfyUI 平台，提供 ComfyUI 在线环境和服务，以及 ComfyUI 工作流具有惊艳的视觉效果。 RunComfy还提供 AI Models, 帮助艺术家利用最新的AI工具创作出令人惊叹的艺术作品。

Nvidia Cosmos | 文本和图像到视频创建

ComfyUI Nvidia Cosmos Workflow

ComfyUI Nvidia Cosmos Examples

ComfyUI Nvidia Cosmos 文本和图像到视频工作流#

什么是 Nvidia Cosmos 工作流#

Nvidia Cosmos 的关键特性#

如何使用 Nvidia Cosmos 工作流#

1. 使用 Nvidia Cosmos 进行文本到视频生成#

设置和要求#

Nvidia Cosmos 的采样参数#

Nvidia Cosmos 的提示建议#

2. 使用 Nvidia Cosmos 进行图像到视频生成#

设置和要求#

参考图像选项#

关键参数#

Nvidia Cosmos 的高级提示#

关于 Nvidia Cosmos 的更多信息#

Want More ComfyUI Workflows?

CogvideoX Fun | 视频到视频模型

Hunyuan Video | 从文本到视频

ComfyUI Grounding | 对象跟踪工作流

Qwen Image 2512 | 精确的 AI 图像生成器

ChatterBox TTS ComfyUI | AI 语音生成器

Stable Diffusion 3 (SD3) | 文本到图像

LayerDiffuse + TripoSR | 图像到3D

Z-Depth Maps | Houdini 式动画