ComfyUI  >  工作流  >  混元图像到视频 | 令人惊叹的运动创造者

混元图像到视频 | 令人惊叹的运动创造者

混元图像到视频是腾讯最新的图像到视频模型,基于混元视频基础构建。它将静态图像转变为具有平滑运动的高质量视频。通过使用图像潜在连接和预训练的多模态大语言模型,它将图像与文本提示平滑合并。混元视频I2V支持高达720p分辨率的24fps视频,最长5秒。它还通过LoRA训练支持可自定义的效果,允许独特的转变,如头发增长或情感拥抱。混元图像到视频工作流包括包装节点和原生兼容性,通过FP8权重进行内存优化以提高效率。

ComfyUI Hunyuan image-to-video 工作流程

HunyuanVideo-I2V Workflow in ComfyUI | Premium Image-to-Video Generation
想要运行这个工作流吗?
  • 完全可操作的工作流
  • 没有缺失的节点或模型
  • 无需手动设置
  • 具有惊艳的视觉效果

ComfyUI Hunyuan image-to-video 示例

ComfyUI Hunyuan image-to-video 描述

ComfyUI混元图像到视频工作流描述

1. 什么是混元图像到视频工作流?

混元图像到视频工作流是一个强大的管道,旨在将静态图像转化为具有自然运动的高质量视频。由腾讯开发,这项尖端技术使用户能够以高达720p的分辨率创建具有平滑24fps播放的电影级动画。通过利用潜在图像连接和多模态大语言模型,混元图像到视频解释图像内容,并根据文本提示应用一致的运动模式。

2. 混元图像到视频的优势:

  • 高分辨率输出 - 生成高达720p、24fps的视频
  • 自然运动生成 - 从静态图像创建流畅、逼真的动画
  • 文本引导动画 - 使用文本提示引导运动和视觉效果
  • 电影级质量 - 产生具有高保真度的专业级视频
  • 可定制效果 - 支持LoRA训练的效果,如头发增长、面部表情和风格调整
  • 优化内存使用 - 利用FP8权重以更好地管理资源

3. 如何使用混元图像到视频工作流

3.1 混元图像到视频生成方法

示例工作流:

Hunyuan Image-to-Video

  1. 准备输入
    • 在加载图像中:上传您的源图像
  2. 输入运动描述
    • 在HyVideo I2V编码中:输入描述性文本提示以获得所需的运动
  3. 精炼(可选)
    • 在混元视频采样器中:调整frames以控制视频长度(默认:129帧≈5秒)
    • 在混元视频茶缓存中:修改cache_factor以优化内存使用
    • 在混元视频增强视频中:启用以确保时间一致性和减少闪烁
  4. 输出
    • 在视频组合中:检查预览并在ComfyUI > Output文件夹中找到保存的结果

3.2 混元图像到视频参数参考

Hunyuan Image-to-Video

  • 混元视频模型加载器
    • model_name: hunyuan_video_I2V_fp8_e4m3fn.safetensors - 图像到视频转换的核心模型
    • weight_precision: bf16 - 定义模型权重的精度水平
    • scale_weights: fp8_e4m3fn - 优化内存使用
    • attention_implementation: flash_attn_varlen - 控制注意力处理效率
  • 混元视频采样器
    • frames: 129 - 帧数(24fps下为5.4秒)
    • steps: 20 - 采样步数(更高的值提高质量)
    • cfg: 6 - 控制提示依从性强度
    • seed: varies - 确保生成一致性
  • HyVideo I2V编码
    • prompt: [text field] - 用于运动和风格的描述性提示
    • add_prepend: true - 启用自动文本格式化

3.3 使用混元图像到视频进行高级优化

  • 内存优化
    • 混元视频BlockSwap: CPU卸载以提高VRAM效率
    • 混元视频茶缓存: 控制缓存行为以平衡内存与速度
    • scale_weights: FP8权重(e4m3fn格式)以减少内存
  • 速度优化
    • 混元视频Torch编译设置: 启用Torch编译以加快处理速度
    • attention_implementation: 选择高效的注意力机制以提升性能
    • offload_device: 配置GPU/CPU内存管理

更多信息

有关混元图像到视频工作流的更多详情,请访问

致谢

此工作流由混元图像到视频提供动力,由腾讯开发。ComfyUI集成包括Kijai创建的包装节点,启用上下文窗口和直接图像嵌入支持等高级功能。感谢原始创造者对混元图像到视频工作流的贡献!

想要更多 ComfyUI 工作流吗?

RunComfy
版权 2025 RunComfy. 保留所有权利。

RunComfy 是首选的 ComfyUI 平台,提供 ComfyUI 在线 环境和服务,以及 ComfyUI 工作流 具有惊艳的视觉效果。 RunComfy还提供 AI Playground, 帮助艺术家利用最新的AI工具创作出令人惊叹的艺术作品。