Nvidia Cosmos | 文本和图像到视频创建
体验 Nvidia 新发布的 Cosmos 模型(7B 和 14B)在 ComfyUI 中的尖端视频生成。这一全面的工作流提供了文本到视频生成和图像插值功能。对于文本到视频,使用详细的文本描述创建流畅的 121 帧视频。对于图像到视频,您可以设置 start_image 和 end_image 以生成它们之间的平滑过渡。由于其超高效的 VAE,它可以在 12GB GPU 上处理 1280x704 视频,使其比其他选择节省 50 倍的内存。非常适合创建既真实又风格化的动画,并确保每个序列都有运动。ComfyUI Nvidia Cosmos 工作流程
ComfyUI Nvidia Cosmos 示例




ComfyUI Nvidia Cosmos 描述
ComfyUI Nvidia Cosmos 文本和图像到视频工作流
什么是 Nvidia Cosmos 工作流
通过在 ComfyUI 中新发布的 Nvidia Cosmos 模型将您的想象力转化为流畅的视频。此工作流展示了 Nvidia Cosmos 强大的 AI 能力,其文本到视频和图像到视频的生成功能。凭借 Nvidia Cosmos 的尖端 7B 和 14B 模型,您可以从文本描述或静态图像中创建高质量的视频。Nvidia Cosmos 引擎通过其超高效的视频处理能力提供出色的结果。
Nvidia Cosmos 的关键特性
- 双重生成模式:Nvidia Cosmos 提供文本到视频和图像到视频生成
- 保证运动:使用 121 帧时始终生成带有运动的视频
- 有效的负面提示:非蒸馏模型通过负面提示确保更好的控制
- 灵活的图像控制:从最后一帧生成或在图像之间创建过渡
- 超高效 VAE:Nvidia Cosmos 使用精炼的 VAE 系统进行流畅、高质量的视频生成
- 高分辨率支持:在 704x704 及以上的分辨率下创建视频
- 精确的帧控制:优化为 121 帧序列
- 智能图像插值:在参考图像之间生成平滑过渡
如何使用 Nvidia Cosmos 工作流
Nvidia Cosmos 工作流包含两个主要部分:文本到视频 和 图像到视频 生成。默认情况下,图像到视频 组被绕过。要在两种模式之间切换:
- 对于 文本到视频:保持 图像到视频 组被绕过(默认设置)
- 对于 图像到视频:右键单击 图像到视频 组并选择
Set Group Nodes to Always
1. 使用 Nvidia Cosmos 进行文本到视频生成
设置和要求
- 选择您喜欢的 Nvidia Cosmos 模型大小(建议从 7B 开始)

- 设置分辨率(默认 1280x704;最低 704x704)
- 帧设置:
- 长度:121 帧(模型在 121 的长度下性能最佳;偏离太多可能导致视频质量下降。)
- 帧率:24.00(最佳质量的默认速率)
Nvidia Cosmos 的采样参数
- 采样器:
res_multistep
(Nvidia 推荐的 Cosmos 采样器) - 调度器:
karras
(默认的稳定性) - 步骤:
20
(更高 = 更好质量但更慢;更低 = 更快但细节较少) - CFG:
6.5
(提示引导强度) - 降噪:
1.00
(1.00 = 完全转换;更低的值保留更多原始内容)

Nvidia Cosmos 的提示建议
- 使用详细的多句提示以获得更好的结果
- 包括全面的负面提示
- 简短的提示可能生成连贯的视频,但可能不严格遵循指令
2. 使用 Nvidia Cosmos 进行图像到视频生成
设置和要求
- 与 Nvidia Cosmos 文本到视频相同的基本要求
- 支持
start_image
和end_image
输入
参考图像选项
- 设置
start_image
或end_image
,或同时设置两者 - 图像在风格和内容上相似时效果最佳(以获得平滑过渡)

关键参数
- 与文本到视频模式相同的采样设置
- 保持相同的视频质量标准
Nvidia Cosmos 的高级提示
- 使用更多 VRAM 获得更高质量的结果,尝试 Nvidia Cosmos 14B 模型
- 确保提示描述性和详细性以获得最佳结果
- 尝试不同的图像对以获得独特的过渡
关于 Nvidia Cosmos 的更多信息
有关 Nvidia Cosmos 的更多详细信息和更新,请访问 。