ComfyUI Nvidia Cosmos 文本和图像到视频工作流
什么是 Nvidia Cosmos 工作流
通过在 ComfyUI 中新发布的 Nvidia Cosmos 模型将您的想象力转化为流畅的视频。此工作流展示了 Nvidia Cosmos 强大的 AI 能力,其文本到视频和图像到视频的生成功能。凭借 Nvidia Cosmos 的尖端 7B 和 14B 模型,您可以从文本描述或静态图像中创建高质量的视频。Nvidia Cosmos 引擎通过其超高效的视频处理能力提供出色的结果。
Nvidia Cosmos 的关键特性
- 双重生成模式:Nvidia Cosmos 提供文本到视频和图像到视频生成
- 保证运动:使用 121 帧时始终生成带有运动的视频
- 有效的负面提示:非蒸馏模型通过负面提示确保更好的控制
- 灵活的图像控制:从最后一帧生成或在图像之间创建过渡
- 超高效 VAE:Nvidia Cosmos 使用精炼的 VAE 系统进行流畅、高质量的视频生成
- 高分辨率支持:在 704x704 及以上的分辨率下创建视频
- 精确的帧控制:优化为 121 帧序列
- 智能图像插值:在参考图像之间生成平滑过渡
如何使用 Nvidia Cosmos 工作流
Nvidia Cosmos 工作流包含两个主要部分:_文本到视频_ 和 _图像到视频_ 生成。默认情况下,_图像到视频_ 组被绕过。要在两种模式之间切换:
- 对于 _文本到视频_:保持 _图像到视频_ 组被绕过(默认设置)
- 对于 _图像到视频_:右键单击 _图像到视频_ 组并选择
Set Group Nodes to Always
1. 使用 Nvidia Cosmos 进行文本到视频生成
设置和要求
- 选择您喜欢的 Nvidia Cosmos 模型大小(建议从 7B 开始)

- 设置分辨率(默认 1280x704;最低 704x704)
- 帧设置:
- 长度:121 帧(模型在 121 的长度下性能最佳;偏离太多可能导致视频质量下降。)
- 帧率:24.00(最佳质量的默认速率) <img src="https://cdn.runcomfy.net/workflow_assets/1184/readme02.webp" alt="Nvidia Cosmos" width="350"/> <img src="https://cdn.runcomfy.net/workflow_assets/1184/readme03.webp" alt="Nvidia Cosmos" width="350"/>
Nvidia Cosmos 的采样参数
- 采样器:
res_multistep(Nvidia 推荐的 Cosmos 采样器) - 调度器:
karras(默认的稳定性) - 步骤:
20(更高 = 更好质量但更慢;更低 = 更快但细节较少) - CFG:
6.5(提示引导强度) - 降噪:
1.00(1.00 = 完全转换;更低的值保留更多原始内容)
Nvidia Cosmos 的提示建议
- 使用详细的多句提示以获得更好的结果
- 包括全面的负面提示
- 简短的提示可能生成连贯的视频,但可能不严格遵循指令
2. 使用 Nvidia Cosmos 进行图像到视频生成
设置和要求
- 与 Nvidia Cosmos 文本到视频相同的基本要求
- 支持
start_image和end_image输入
参考图像选项
- 设置
start_image或end_image,或同时设置两者 - 图像在风格和内容上相似时效果最佳(以获得平滑过渡)

关键参数
- 与文本到视频模式相同的采样设置
- 保持相同的视频质量标准
Nvidia Cosmos 的高级提示
- 使用更多 VRAM 获得更高质量的结果,尝试 Nvidia Cosmos 14B 模型
- 确保提示描述性和详细性以获得最佳结果
- 尝试不同的图像对以获得独特的过渡
关于 Nvidia Cosmos 的更多信息
有关 Nvidia Cosmos 的更多详细信息和更新,请访问 Nvidia Cosmos Official Page。

