logo
RunComfy
  • ComfyUI
  • TrainerNew
  • Models
  • API
  • Pricing
discord logo
ComfyUI>工作流>混元视频 | 视频到视频

混元视频 | 视频到视频

Workflow Name: RunComfy/Hunyuan-Vid2Vid
Workflow ID: 0000...1178
在ComfyUI中的混元工作流程允许您将现有视觉效果转化为令人惊叹的新视觉效果。通过输入文本提示和源视频,混元模型生成的翻译作品将源视频中的运动和关键元素融入其中。凭借先进的架构和训练技术,混元生产出高质量、多样化且稳定的内容。

混元视频是由腾讯开发的开源AI模型,让您可以轻松生成令人惊叹的动态视觉效果。混元模型利用先进的架构和训练技术来理解和生成高质量、运动多样性和稳定性的内容。

关于混元视频到视频工作流程

在ComfyUI中的混元工作流程利用混元模型,通过将输入文本提示与现有驱动视频结合来创建新的视觉内容。利用混元模型的能力,您可以生成令人印象深刻的视频翻译,这些翻译作品无缝地将驱动视频中的运动和关键元素融入其中,同时使输出与您期望的文本提示对齐。

如何使用混元视频到视频工作流程

🟥 步骤1:加载混元模型

  • 在HyVideoModelLoader节点中选择"hunyuan_video_720_cfgdistill_fp8_e4m3fn.safetensors"文件来加载混元模型。这是主要的转换器模型。
  • 混元视频VAE模型将在HunyuanVideoVAELoader节点中自动下载。它用于编码/解码视频帧。
  • 在DownloadAndLoadHyVideoTextEncoder节点中加载一个文本编码器。工作流程默认使用"Kijai/llava-llama-3-8b-text-encoder-tokenizer" LLM编码器和"openai/clip-vit-large-patch14" CLIP编码器,它们将被自动下载。您也可以使用其他与先前模型一起工作的CLIP或T5编码器。
    Hunyuan Video to Video Workflow

🟨 步骤2:输入提示并加载驱动视频

  • 在HyVideoTextEncode节点中输入您想生成的视觉效果的文本提示。
  • 在VHS_LoadVideo节点中加载您想用作运动参考的驱动视频。
    • frame_load_cap:要生成的帧数。在设置数量时,您需要确保数量减一可以被4整除;否则,会触发ValueError,指示视频长度无效。
    • skip_first_frames:调整此参数以控制视频的哪个部分被使用。
      Hunyuan Video to Video Workflow

🟦 步骤3:混元生成设置

  • 在HyVideoSampler节点中配置视频生成的超参数:
    • Steps:每帧的扩散步骤数,越高质量越好但生成速度越慢。默认30。
    • Embedded_guidance_scale:遵循提示的程度,值越高越接近提示。
    • Denoise_strength:控制使用初始驱动视频的强度。较低的值(例如0.6)使输出更像初始视频。
  • 在"Fast Groups Bypasser"节点中选择附加组件和切换功能,以启用/禁用额外功能,如对比视频。
    Hunyuan Video to Video Workflow

🟩 步骤4:生成混元视频

  • VideoCombine节点将默认生成并保存两个输出:
    • 翻译视频结果
    • 显示驱动视频和生成结果的对比视频
      Hunyuan Video to Video Workflow

调整提示和生成设置可以灵活地创建由现有视频运动驱动的新视频,使用混元模型。尽情探索此混元工作流程的创造性可能性吧!


此混元工作流程由Black Mixture设计。请访问Black Mixture的YouTube频道以获取更多信息。特别感谢Kijai提供的混元包装器节点和工作流程示例。

Want More ComfyUI Workflows?

Hunyuan Video | 从文本到视频

从文本提示生成视频。

ControlNet Tile + 4x UltraSharp | 图像/视频升频器

使用ControlNet Tile、4xUltraSharp和帧插值来获得高分辨率结果。

FLUX.2 [klein] 4B & 9B | 超快速 Flux 图像生成器

通过统一的编辑控制实现超快速的视觉创作。

Qwen Image Edit Plus 2509 LoRA 推理 | AI Toolkit ComfyUI

在 ComfyUI 中应用 AI Toolkit 训练的 Qwen Image Edit Plus 2509 LoRA,通过单个 RCQwenImageEditPlus 自定义节点进行预览对齐编辑。

Multitalk | 逼真的对话视频制作工具

一键从肖像和声音创建多说话者同步对口型视频!

Push-In Camera - A Motion LoRA for Wan 2.1

一张图像输入,大片推入镜头输出。零复杂性。

AnimateDiff + ControlNet | 卡通风格

通过将视频转换为生动的卡通,为您的视频增添趣味。

Flux Depth 和 Canny

官方 Flux 工具 - Flux Depth 和 Canny 控制网络模型

关注我们
  • 领英
  • Facebook
  • Instagram
  • Twitter
支持
  • Discord
  • 电子邮件
  • 系统状态
  • 附属
资源
  • 免费 ComfyUI 在线版
  • ComfyUI 指南
  • RunComfy API
  • ComfyUI 教程
  • ComfyUI 节点
  • 了解更多
法律
  • 服务条款
  • 隐私政策
  • Cookie 政策
RunComfy
版权 2026 RunComfy. 保留所有权利。

RunComfy 是首选的 ComfyUI 平台,提供 ComfyUI 在线 环境和服务,以及 ComfyUI 工作流 具有惊艳的视觉效果。 RunComfy还提供 AI Models, 帮助艺术家利用最新的AI工具创作出令人惊叹的艺术作品。