ComfyUI  >  工作流  >  Nvidia Cosmos | 文本和图像到视频创建

Nvidia Cosmos | 文本和图像到视频创建

体验 Nvidia 新发布的 Cosmos 模型(7B 和 14B)在 ComfyUI 中的尖端视频生成。这一全面的工作流提供了文本到视频生成和图像插值功能。对于文本到视频,使用详细的文本描述创建流畅的 121 帧视频。对于图像到视频,您可以设置 start_image 和 end_image 以生成它们之间的平滑过渡。由于其超高效的 VAE,它可以在 12GB GPU 上处理 1280x704 视频,使其比其他选择节省 50 倍的内存。非常适合创建既真实又风格化的动画,并确保每个序列都有运动。

ComfyUI Nvidia Cosmos 工作流程

Nvidia Cosmos Text or Image-to-Video Workflow in ComfyUI | Video Generation
想要运行这个工作流吗?
  • 完全可操作的工作流
  • 没有缺失的节点或模型
  • 无需手动设置
  • 具有惊艳的视觉效果

ComfyUI Nvidia Cosmos 示例

nvidia-cosmos-text-or-image-to-video-workflow-in-comfyUI-video-generation-1184-example_1.webp
nvidia-cosmos-text-or-image-to-video-workflow-in-comfyUI-video-generation-1184-example_2.webp
nvidia-cosmos-text-or-image-to-video-workflow-in-comfyUI-video-generation-1184-example_3.webp
nvidia-cosmos-text-or-image-to-video-workflow-in-comfyUI-video-generation-1184-example_4.webp

ComfyUI Nvidia Cosmos 描述

ComfyUI Nvidia Cosmos 文本和图像到视频工作流

什么是 Nvidia Cosmos 工作流

通过在 ComfyUI 中新发布的 Nvidia Cosmos 模型将您的想象力转化为流畅的视频。此工作流展示了 Nvidia Cosmos 强大的 AI 能力,其文本到视频和图像到视频的生成功能。凭借 Nvidia Cosmos 的尖端 7B 和 14B 模型,您可以从文本描述或静态图像中创建高质量的视频。Nvidia Cosmos 引擎通过其超高效的视频处理能力提供出色的结果。


Nvidia Cosmos 的关键特性

  • 双重生成模式:Nvidia Cosmos 提供文本到视频和图像到视频生成
  • 保证运动:使用 121 帧时始终生成带有运动的视频
  • 有效的负面提示:非蒸馏模型通过负面提示确保更好的控制
  • 灵活的图像控制:从最后一帧生成或在图像之间创建过渡
  • 超高效 VAE:Nvidia Cosmos 使用精炼的 VAE 系统进行流畅、高质量的视频生成
  • 高分辨率支持:在 704x704 及以上的分辨率下创建视频
  • 精确的帧控制:优化为 121 帧序列
  • 智能图像插值:在参考图像之间生成平滑过渡

如何使用 Nvidia Cosmos 工作流

Nvidia Cosmos 工作流包含两个主要部分:文本到视频图像到视频 生成。默认情况下,图像到视频 组被绕过。要在两种模式之间切换:

  • 对于 文本到视频:保持 图像到视频 组被绕过(默认设置)
  • 对于 图像到视频:右键单击 图像到视频 组并选择 Set Group Nodes to Always

1. 使用 Nvidia Cosmos 进行文本到视频生成

设置和要求

  • 选择您喜欢的 Nvidia Cosmos 模型大小(建议从 7B 开始)
Nvidia Cosmos
  • 设置分辨率(默认 1280x704;最低 704x704)
  • 帧设置:
    • 长度:121 帧(模型在 121 的长度下性能最佳;偏离太多可能导致视频质量下降。)
    • 帧率:24.00(最佳质量的默认速率)
    Nvidia Cosmos Nvidia Cosmos

Nvidia Cosmos 的采样参数

  • 采样器:res_multistep (Nvidia 推荐的 Cosmos 采样器)
  • 调度器:karras (默认的稳定性)
  • 步骤:20 (更高 = 更好质量但更慢;更低 = 更快但细节较少)
  • CFG:6.5 (提示引导强度)
  • 降噪:1.00 (1.00 = 完全转换;更低的值保留更多原始内容)
Nvidia Cosmos

Nvidia Cosmos 的提示建议

  • 使用详细的多句提示以获得更好的结果
  • 包括全面的负面提示
  • 简短的提示可能生成连贯的视频,但可能不严格遵循指令

2. 使用 Nvidia Cosmos 进行图像到视频生成

设置和要求

  • 与 Nvidia Cosmos 文本到视频相同的基本要求
  • 支持 start_imageend_image 输入

参考图像选项

  • 设置 start_imageend_image,或同时设置两者
  • 图像在风格和内容上相似时效果最佳(以获得平滑过渡)
Nvidia Cosmos

关键参数

  • 与文本到视频模式相同的采样设置
  • 保持相同的视频质量标准

Nvidia Cosmos 的高级提示

  • 使用更多 VRAM 获得更高质量的结果,尝试 Nvidia Cosmos 14B 模型
  • 确保提示描述性和详细性以获得最佳结果
  • 尝试不同的图像对以获得独特的过渡

关于 Nvidia Cosmos 的更多信息

有关 Nvidia Cosmos 的更多详细信息和更新,请访问

想要更多 ComfyUI 工作流吗?