ComfyUI>工作流>LTX 2.3 Sulphur 2 文本转视频工作流 | 电影生成器

LTX 2.3 Sulphur 2 文本转视频工作流 | 电影生成器

Workflow Name: RunComfy/LTX-2.3-Sulphur-2
Workflow ID: 0000...1430
通过 LTX 2.3 Sulphur 2 设置,您可以将文本提示转换为电影角色动画,并具有同步的音频和动作。它集成了LTXV条件和Sulphur 2建模,以实现更流畅的人体运动和详细的视觉渲染。用户可以为短片概念、动画测试或故事原型实现高质量的结果。此工作流结合了文本、音频和潜在视频解码,实现无缝的端到端创作。适合需要快速、可控和富有表现力的视频生成的创作者。

ComfyUI LTX 2.3 Sulphur 2 text to video workflow 工作流程

LTX 2.3 Sulphur 2 text to video workflow in ComfyUI | Cinematic Animation
想要运行这个工作流吗?
  • 完全可操作的工作流
  • 没有缺失的节点或模型
  • 无需手动设置
  • 具有惊艳的视觉效果

ComfyUI LTX 2.3 Sulphur 2 text to video workflow 示例

LTX 2.3 Sulphur 2 文本转视频工作流用于电影角色动画#

此 ComfyUI 管道将自然语言提示转换为短片、电影化、以角色为中心的视频,带有可选音频,围绕 Lightricks LTX‑2.3 和 Sulphur 2 组件构建。它在低分辨率下进行生成以进行运动规划,放大潜在序列,然后在高分辨率下进行精细化处理,然后解码为帧并混合同步的音轨。

LTX 2.3 Sulphur 2 文本转视频工作流非常适合快速角色动画测试、D‑Human 风格运动概念和精致的文本转视频实验。它不依赖于图像到视频输入或提示中继;一切都从文本开始,LTXV 条件引导视频和音频潜在的端到端。

Comfyui LTX 2.3 Sulphur 2 文本转视频工作流中的关键模型#

如何使用 Comfyui LTX 2.3 Sulphur 2 文本转视频工作流#

总体逻辑 管道分三幕运行:低分辨率生成以建立运动和构图,潜在放大以增加空间细节,以及高分辨率精化通过,也产生最终音频。潜在解码为帧和波形,然后混合到一个准备交付的 MP4 容器中。

视频设置 使用“视频设置”组定义宽度、高度、帧率和持续时间。帧数根据您的持续时间和 fps 自动计算,以保持时间和节奏一致。这些值驱动潜在分配和解码,因此首先设置它们以匹配您的目标纵横比和运行时间。在此处调整 fps 也会通知条件,因此运动平滑度和音频对齐使用相同的时钟。

提示 在“提示”中,使用 LTXAVTextEncoderLoader (#316) 加载 LTX 文本编码器,然后在 CLIPTextEncode (#303) 中编写您的正面描述,并在 CLIPTextEncode (#312) 中编写任何不需要的特征。节点 LTXVConditioning (#304) 合并正面和负面条件并添加所选择的帧率,以便时间指导与您的 fps 匹配。将正面提示视为镜头简报:主体、相机、照明、情绪和风格线索。保持负面列表集中在您经常看到并希望消除的伪影上。

模型 “模型”组通过 CheckpointLoaderSimple (#315) 加载主检查点,并使用 LoraLoaderModelOnly (#285) 应用 Sulphur 2 LoRA,以注入电影质感和角色保真度。在这里您可以更换检查点或 LoRA,以改变整体外观和运动先验。模型输出被路由到初始和精化引导器,以便风格和身份在各次传递中一致。将 LTX‑2.3 与 Sulphur 2 配对,产生鲜明的对比度和详细的面孔,在运动中表现良好。

数字转换 实用表达式将您的 fps 和秒数转换为下游使用的整数帧数。这使音频和视频时间轴保持一致,而无需手动计算。如果稍后您修改 fps 或持续时间,图形会自动更新依赖节点。

空潜在 “空潜在”创建对齐的生成容器:EmptyLTXVLatentVideo (#295) 定义视频潜在的空间大小和长度,LTXVEmptyLatentAudio (#305) 以相同的帧率分配音频潜在,然后 LTXVConcatAVLatent (#321) 将它们合并为单个 AV 潜在。从空潜在开始,确保扩散通过完全反映您的提示和条件,而不是任何现有内容。

生成低分辨率 第一个采样阶段以较低的成本建立运动和构图。CFGGuider (#313)、KSamplerSelect (#291) 和 ManualSigmas (#306) 管理提示如何强烈地引导生成和整体噪声计划。然后 SamplerCustomAdvanced (#283) 对 AV 潜在去噪至连贯的剪辑。结果由 LTXVSeparateAVLatent (#307) 分离,并由 LTXVCropGuides (#284) 精细化空间注意力,以便您想要的主体构图在后续放大中得以保留。

潜在放大 LTXVLatentUpsampler (#287) 使用 LTX‑2.3 x2 放大器提升空间细节,同时保持在潜在空间中以提高速度和稳定性。将放大的视频潜在向前馈送,以在高分辨率精化之前改善纹理和可读性。这保留了您在第一次通过中喜欢的运动,同时为更清晰的边缘和更丰富的材质打开了空间。

生成高分辨率 放大的视频潜在在 LTXVConcatAVLatent (#278) 中与音频潜在重新结合,并再次引导以实现最终质量。CFGGuider (#282)、KSamplerSelect (#280) 和 ManualSigmas (#281) 对提示强度、细节和时间一致性做出最终决定,SamplerCustomAdvanced (#308) 产生精细的 AV 潜在。LTXVSeparateAVLatent (#309) 将视频交给 VAEDecodeTiled (#314) 进行内存友好的帧解码,将音频交给 LTXVAudioVAEDecode (#297) 进行波形重建。CreateVideo (#310) 在您的目标 fps 下混合帧和音频,SaveVideo (#75) 写入 MP4/H.264 文件。

图像预处理 此区域路由基本 VAE 和放大器模型,以便平铺和潜在放大在您的 VRAM 预算内工作。如果您遇到内存压力,优先选择 FP8 LTX‑2.3 权重并保持启用平铺解码以维持吞吐量和质量。

Comfyui LTX 2.3 Sulphur 2 文本转视频工作流中的关键节点#

LTXVConditioning (#304) 合并正面和负面文本条件并附加工作帧率,以便时间指导与您的渲染匹配。强大、具体的场景语言改善镜头结构;简洁的负面减少伪影。有关条件说明,请参阅 LTX‑2.3 模型卡。 Hugging Face: Lightricks/LTX-2.3

LTXVCropGuides (#284) 柔和地引导构图,以保持主要主体按预期构图。在放大和精化之前使用它来保护面部大小、地平线位置或居中主体。对于对话风格的镜头和中景特写尤其有帮助。

CFGGuider (#313, #282) 控制提示在两个通过中对扩散轨迹的影响力度。使用第一个引导器锁定运动和场景布置,然后使用第二个增加清晰度,而不偏离已建立的镜头。

ManualSigmas (#306, #281) 定义噪声计划。前置更多噪声鼓励更大的运动探索;较温和的计划强调时间一致性。保持低分辨率和高分辨率计划互补而不是相同。

LTXVLatentUpsampler (#287) 使用官方 LTX 放大器执行 x2 潜在放大,以便在精化采样器之前获得详细信息。切换到另一个 LTX‑2.3 放大器变体可以稍微改变清晰度和颗粒感。 Hugging Face: Lightricks/LTX-2.3

VAEDecodeTiled (#314) 以可管理的平铺方式解码长或大剪辑,以避免 VRAM 峰值。如果您更改空间大小或剪辑长度,调整平铺以平衡内存余量和解码速度。

LoraLoaderModelOnly (#285) 将 Sulphur 2 LoRA 应用于基础模型路径,以便角色保真度和风格线索传递到两个采样阶段。使用此功能快速更换外观,同时保留相同的 LTX‑2.3 主干。 Hugging Face: SulphurAI/Sulphur-2-base

可选额外功能#

  • 种子控制:在两个 RandomNoise 节点中设置固定值,以便拍摄可重复;更改一个种子以探索替代方案。
  • 提示:将提示写为镜头指令(主体、相机、照明、情绪)。保持负面列表集中且简短。
  • 性能:如果 VRAM 有限,优先选择 FP8 LTX‑2.3 权重并保持启用平铺解码。
  • 输出:图形写入 MP4/H.264;如果您需要 ProRes 代理工作流,请在 SaveVideo 中更改容器或编解码器。

此 LTX 2.3 Sulphur 2 文本转视频工作流提供了从提示到抛光视频的干净、端到端的路径,带有同步音频,专为快速迭代电影角色动画而构建。

致谢#

此工作流实现并构建在以下作品和资源之上。我们感谢 RunningHub 提供的 Sulphur2 基础工作流用于视频制作,SulphurAI 提供的 Sulphur-2-base 模型,Lightricks 提供的 LTX-2.3 和 LTX-2.3-fp8 模型,以及 Comfy-Org 提供的 LTX-2 文本编码器的贡献和维护。有关权威详情,请参考下列链接的原始文档和存储库。

资源#

注意:引用的模型、数据集和代码的使用受其作者和维护者提供的各自许可和条款的约束。

RunComfy
版权 2026 RunComfy. 保留所有权利。

RunComfy 是首选的 ComfyUI 平台,提供 ComfyUI 在线 环境和服务,以及 ComfyUI 工作流 具有惊艳的视觉效果。 RunComfy还提供 AI Models, 帮助艺术家利用最新的AI工具创作出令人惊叹的艺术作品。