LTX 2.3 Sulphur 2 文本转视频工作流在 ComfyUI 中

ComfyUI LTX 2.3 Sulphur 2 text to video workflow 工作流程

LTX 2.3 Sulphur 2 text to video workflow in ComfyUI | Cinematic Animation

想要运行这个工作流吗？

完全可操作的工作流
没有缺失的节点或模型
无需手动设置
具有惊艳的视觉效果

ComfyUI LTX 2.3 Sulphur 2 text to video workflow 示例

LTX 2.3 Sulphur 2 文本转视频工作流用于电影角色动画#

此 ComfyUI 管道将自然语言提示转换为短片、电影化、以角色为中心的视频，带有可选音频，围绕 Lightricks LTX‑2.3 和 Sulphur 2 组件构建。它在低分辨率下进行生成以进行运动规划，放大潜在序列，然后在高分辨率下进行精细化处理，然后解码为帧并混合同步的音轨。

LTX 2.3 Sulphur 2 文本转视频工作流非常适合快速角色动画测试、D‑Human 风格运动概念和精致的文本转视频实验。它不依赖于图像到视频输入或提示中继；一切都从文本开始，LTXV 条件引导视频和音频潜在的端到端。

Comfyui LTX 2.3 Sulphur 2 文本转视频工作流中的关键模型#

Lightricks LTX‑2.3。用于时空合成和多模态 AV 潜在的核心文本转视频生成器。有关权重和能力及限制的说明，请参阅官方模型存储库。 Hugging Face: Lightricks/LTX-2.3
Lightricks LTX‑2.3 FP8 检查点。LTX‑2.3 的内存高效变体，加速推理并在受限 GPU 上实现更长的剪辑或更高的分辨率。 Hugging Face: Lightricks/LTX-2.3-fp8
Sulphur 2 基础模型。通过 LoRA 在此工作流中提供风格先验和角色细节，帮助实现清晰的面孔和电影色调。 Hugging Face: SulphurAI/Sulphur-2-base
LTX‑2.3 空间放大器 x2 1.1。在高分辨率精化通过之前增加空间细节的潜在空间放大器。 Hugging Face: Lightricks/LTX-2.3 file ltx-2.3-spatial-upscaler-x2-1.1.safetensors
LTX 文本编码器 (Gemma 3 12B IT 打包用于 LTX)。提供与 LTX‑2.3 条件匹配的文本嵌入空间，以忠实地遵循提示。 Hugging Face: Comfy-Org/ltx-2
LTX 音频 VAE。解码与视频同时生成的音频潜在，因此最终渲染可以包括同步的音轨。 Hugging Face: Lightricks/LTX-2.3

如何使用 Comfyui LTX 2.3 Sulphur 2 文本转视频工作流#

总体逻辑管道分三幕运行：低分辨率生成以建立运动和构图，潜在放大以增加空间细节，以及高分辨率精化通过，也产生最终音频。潜在解码为帧和波形，然后混合到一个准备交付的 MP4 容器中。

视频设置使用“视频设置”组定义宽度、高度、帧率和持续时间。帧数根据您的持续时间和 fps 自动计算，以保持时间和节奏一致。这些值驱动潜在分配和解码，因此首先设置它们以匹配您的目标纵横比和运行时间。在此处调整 fps 也会通知条件，因此运动平滑度和音频对齐使用相同的时钟。

提示在“提示”中，使用 LTXAVTextEncoderLoader (#316) 加载 LTX 文本编码器，然后在 CLIPTextEncode (#303) 中编写您的正面描述，并在 CLIPTextEncode (#312) 中编写任何不需要的特征。节点 LTXVConditioning (#304) 合并正面和负面条件并添加所选择的帧率，以便时间指导与您的 fps 匹配。将正面提示视为镜头简报：主体、相机、照明、情绪和风格线索。保持负面列表集中在您经常看到并希望消除的伪影上。

模型 “模型”组通过 CheckpointLoaderSimple (#315) 加载主检查点，并使用 LoraLoaderModelOnly (#285) 应用 Sulphur 2 LoRA，以注入电影质感和角色保真度。在这里您可以更换检查点或 LoRA，以改变整体外观和运动先验。模型输出被路由到初始和精化引导器，以便风格和身份在各次传递中一致。将 LTX‑2.3 与 Sulphur 2 配对，产生鲜明的对比度和详细的面孔，在运动中表现良好。

数字转换实用表达式将您的 fps 和秒数转换为下游使用的整数帧数。这使音频和视频时间轴保持一致，而无需手动计算。如果稍后您修改 fps 或持续时间，图形会自动更新依赖节点。

空潜在 “空潜在”创建对齐的生成容器：EmptyLTXVLatentVideo (#295) 定义视频潜在的空间大小和长度，LTXVEmptyLatentAudio (#305) 以相同的帧率分配音频潜在，然后 LTXVConcatAVLatent (#321) 将它们合并为单个 AV 潜在。从空潜在开始，确保扩散通过完全反映您的提示和条件，而不是任何现有内容。

生成低分辨率第一个采样阶段以较低的成本建立运动和构图。CFGGuider (#313)、KSamplerSelect (#291) 和 ManualSigmas (#306) 管理提示如何强烈地引导生成和整体噪声计划。然后 SamplerCustomAdvanced (#283) 对 AV 潜在去噪至连贯的剪辑。结果由 LTXVSeparateAVLatent (#307) 分离，并由 LTXVCropGuides (#284) 精细化空间注意力，以便您想要的主体构图在后续放大中得以保留。

潜在放大 LTXVLatentUpsampler (#287) 使用 LTX‑2.3 x2 放大器提升空间细节，同时保持在潜在空间中以提高速度和稳定性。将放大的视频潜在向前馈送，以在高分辨率精化之前改善纹理和可读性。这保留了您在第一次通过中喜欢的运动，同时为更清晰的边缘和更丰富的材质打开了空间。

生成高分辨率放大的视频潜在在 LTXVConcatAVLatent (#278) 中与音频潜在重新结合，并再次引导以实现最终质量。CFGGuider (#282)、KSamplerSelect (#280) 和 ManualSigmas (#281) 对提示强度、细节和时间一致性做出最终决定，SamplerCustomAdvanced (#308) 产生精细的 AV 潜在。LTXVSeparateAVLatent (#309) 将视频交给 VAEDecodeTiled (#314) 进行内存友好的帧解码，将音频交给 LTXVAudioVAEDecode (#297) 进行波形重建。CreateVideo (#310) 在您的目标 fps 下混合帧和音频，SaveVideo (#75) 写入 MP4/H.264 文件。

图像预处理此区域路由基本 VAE 和放大器模型，以便平铺和潜在放大在您的 VRAM 预算内工作。如果您遇到内存压力，优先选择 FP8 LTX‑2.3 权重并保持启用平铺解码以维持吞吐量和质量。

Comfyui LTX 2.3 Sulphur 2 文本转视频工作流中的关键节点#

LTXVConditioning (#304) 合并正面和负面文本条件并附加工作帧率，以便时间指导与您的渲染匹配。强大、具体的场景语言改善镜头结构；简洁的负面减少伪影。有关条件说明，请参阅 LTX‑2.3 模型卡。 Hugging Face: Lightricks/LTX-2.3

LTXVCropGuides (#284) 柔和地引导构图，以保持主要主体按预期构图。在放大和精化之前使用它来保护面部大小、地平线位置或居中主体。对于对话风格的镜头和中景特写尤其有帮助。

CFGGuider (#313, #282) 控制提示在两个通过中对扩散轨迹的影响力度。使用第一个引导器锁定运动和场景布置，然后使用第二个增加清晰度，而不偏离已建立的镜头。

ManualSigmas (#306, #281) 定义噪声计划。前置更多噪声鼓励更大的运动探索；较温和的计划强调时间一致性。保持低分辨率和高分辨率计划互补而不是相同。

LTXVLatentUpsampler (#287) 使用官方 LTX 放大器执行 x2 潜在放大，以便在精化采样器之前获得详细信息。切换到另一个 LTX‑2.3 放大器变体可以稍微改变清晰度和颗粒感。 Hugging Face: Lightricks/LTX-2.3

VAEDecodeTiled (#314) 以可管理的平铺方式解码长或大剪辑，以避免 VRAM 峰值。如果您更改空间大小或剪辑长度，调整平铺以平衡内存余量和解码速度。

LoraLoaderModelOnly (#285) 将 Sulphur 2 LoRA 应用于基础模型路径，以便角色保真度和风格线索传递到两个采样阶段。使用此功能快速更换外观，同时保留相同的 LTX‑2.3 主干。 Hugging Face: SulphurAI/Sulphur-2-base

可选额外功能#

种子控制：在两个 RandomNoise 节点中设置固定值，以便拍摄可重复；更改一个种子以探索替代方案。
提示：将提示写为镜头指令（主体、相机、照明、情绪）。保持负面列表集中且简短。
性能：如果 VRAM 有限，优先选择 FP8 LTX‑2.3 权重并保持启用平铺解码。
输出：图形写入 MP4/H.264；如果您需要 ProRes 代理工作流，请在 SaveVideo 中更改容器或编解码器。

此 LTX 2.3 Sulphur 2 文本转视频工作流提供了从提示到抛光视频的干净、端到端的路径，带有同步音频，专为快速迭代电影角色动画而构建。

致谢#

此工作流实现并构建在以下作品和资源之上。我们感谢 RunningHub 提供的 Sulphur2 基础工作流用于视频制作，SulphurAI 提供的 Sulphur-2-base 模型，Lightricks 提供的 LTX-2.3 和 LTX-2.3-fp8 模型，以及 Comfy-Org 提供的 LTX-2 文本编码器的贡献和维护。有关权威详情，请参考下列链接的原始文档和存储库。