LTX 2.3 Outpainting for ComfyUI: 具有时间一致性的无缝视频帧扩展#
此工作流实现了 LTX 2.3 Outpainting,在保持运动、光照和视角的情况下扩展视频帧超出其原始边界。它专为需要更改宽高比、侧面或垂直扩展以及电影重构而不破坏连续性的编辑者和创作者设计。使用 IC‑LoRA 指导,LTX 2.3 Outpainting 在时间上始终如一地填充蒙版画布区域,还可以生成同步音频。
基于 Lightricks 的 LTX‑2.3 模型及其 ComfyUI 集成,图形结合了智能 outpaint 预处理器与 IC‑LoRA 条件以引导生成到新添加的区域。您可以运行纯文本到视频或图像到视频的变体,预览控制帧,并导出带音频的最终 MP4。
Comfyui LTX 2.3 Outpainting 工作流中的关键模型#
- LTX‑2.3 22B 检查点。核心音视频扩散模型,驱动生成质量和时间稳定性。使用官方 LTX‑2.3 权重,如 ltx‑2.3‑22b‑dev 或 ltx‑2.3‑22b‑distilled‑1.1 以加快运行速度 Hugging Face page 和 LTX‑Video 仓库中的上游模型详细信息 GitHub 和论文 arXiv。
- Gemma 3 12B 指令文本编码器与 LTX 2.3 文本投影。编码具有强大附着力的提示,通过 ComfyUI 的双编码器设置馈送 LTX‑2.3。请参阅编码器卡 Hugging Face 和 ComfyUI 支持 GitHub。
- LTX‑2.3 视频 VAE 和音频 VAE。在像素或波形空间与模型的潜在空间之间映射,以解码最终帧和音频。分发在 ComfyUI‑LTXVideo 包中 GitHub。
- LTX 2.3 Outpainting IC‑LoRA。一种空间扩展 LoRA,使 LTX‑2.3 处理蒙版或黑色区域作为生成区域,保持时间上的场景连续性。它利用 LTXVideo 节点提供的 IC‑LoRA 条件 GitHub。
- 视频 Outpaint 预处理器。VACE 风格的 outpaint 节点计算新的画布、蒙版和由 LTX 2.3 Outpainting 使用的控制帧,以指导扩展区域的合成 GitHub。
如何使用 Comfyui LTX 2.3 Outpainting 工作流#
工作流有五个协调的组。VACE OUTPAINT 提出新的画布和蒙版,LTX 2.3 Preprocess 准备输入,SAMPLING 合成视频和音频,输出阶段编码最终 MP4。PROMPTING 和 MODELS 并行运行以提供文本条件和权重。
MODELS#
此组加载 LTX‑2.3 基础检查点并应用 LTX 2.3 Outpainting IC‑LoRA,使模型学习添加新内容的位置。视频和音频 VAE 初始化以解码帧和波形。模型状态传递到指导器和采样器,以便相同的权重驱动条件和去噪。除非您想交换基础检查点或不同的 IC‑LoRA,否则无需更改此处的任何内容。
PROMPTING#
正面和负面提示由双编码器设置编码,Gemma 3 12B 与 LTX 2.3 文本投影配对。写下您想在添加的边距中看到的内容,以及运动提示和光照方向以对齐 outpainted 内容。您不想要的样式或内容放入负面提示中。编码器生成的条件流稍后会与 LTX 2.3 Outpainting 指导合并。
VACE OUTPAINT#
将源视频拖入加载器以生成逐帧图像。VACEOutpaint (#5109) 节点计算扩展的画布和标记新生成区域的精确蒙版。图形将原始帧合成到这个更大的画布中,使用 ImageCompositeMasked (#5110),结果是控制帧清楚地显示“保留”与“合成”区域。预览分支将这些控制帧组装成轻量级 MP4,以便您在生成之前确认 outpaint 几何。此阶段的宽度、高度和序列长度驱动下游潜在设置,因此模型在确切扩展的尺寸下工作。
LTX 2.3 Preprocess#
合成帧通过 LTXVPreprocess (#3336) 为 LTX‑2.3 进行标准化。如果您想要图像到视频的锚定,请将 bypass_i2v 设置为 false,以便 LTXVImgToVideoConditionOnly (#3159) 将运动条件在控制帧上;对于纯文本到视频的 outpainting,将其设置为 true。LTXVConditioning (#1241) 附加提示条件并从视频加载器继承帧速率,保持音频和视频同步。这些信号流入 LTXAddVideoICLoRAGuide,以告知 LTX 2.3 Outpainting 应如何填充蒙版区域。
SAMPLING#
LTXAddVideoICLoRAGuide (#5012) 将提示、可选的图像条件、outpainted 控制图像和 IC‑LoRA 融合成一个指导包。一个具有正确帧数的空音频潜在被连接,因此音频与视频同步生成。采样器使用 CFGGuider (#4828) 选择的去噪器和短 ManualSigmas 调度来平衡提示依从性和时间平滑性。SamplerCustomAdvanced (#4829) 生成一个联合的音频视频潜在,然后分割进行解码。
解码和导出#
VAEDecodeTiled (#4851) 在扩展分辨率下高效解码视频帧,LTXVAudioVAEDecode (#4848) 重建波形。VHS_VideoCombine (#5137) 将帧和音频合并成一个 MP4,并以继承的帧速率写入输出文件夹。一个单独的预览分支组装 VACE 控制视频以便在最终运行前快速迭代。
Comfyui LTX 2.3 Outpainting 工作流中的关键节点#
VACEOutpaint (#5109)#
计算目标画布和标记 outpaint 区域的二进制或羽化蒙版。向左或向右扩展以进行宽屏重构,或向上和向下扩展以进行垂直转换,然后在预览视频中确认。首次通过时保持增长适中,如果需要更多空间,请迭代。黑色或明确蒙版的区域效果最佳,因为 LTX 2.3 Outpainting 被训练为将它们视为生成区域。
LTXAddVideoICLoRAGuide (#5012)#
LTX 2.3 Outpainting 的核心,此节点注入 IC‑LoRA 并使用合成控制帧将生成偏向于仅蒙版区域。增加 LoRA 强度以加强空间扩展行为,如果模型开始覆盖原始内容则减少它。潜在下采样因子来自加载器,应保持原样配置,除非您在速度与细节之间进行平衡。
CFGGuider (#4828)#
控制模型遵循您的提示与输入条件的紧密程度。提高指导以增强新添加边距的依从性,如果运动变得不稳定则降低它。考虑与 sigma 调度一起进行小幅度更改,而不是大幅跳跃。
SamplerCustomAdvanced (#4829) with KSamplerSelect 和 ManualSigmas (#5025)#
定义去噪路径。选择的 Euler Ancestral CFG++ 变体提供清晰的细节和流畅的运动以适应 LTX‑2.3。短的手动 sigma 梯子有助于保持原始帧的结构,同时让 outpainted 区域连贯地演变。
VAEDecodeTiled (#4851)#
以瓷砖形式解码高分辨率帧以管理 VRAM。如果看到接缝伪影,请稍微调整瓷砖大小或重叠并重新运行。此节点纯粹是为了提高效率,不会改变创意结果。
VHS_VideoCombine (#5137)#
将视频帧和生成的音轨以继承的帧速率合并。如果您更喜欢源音频,请将该音频路由到合并器,并禁用生成的音轨。
可选附加项#
- LTX 2.3 Outpainting 的提示技巧:描述应特定出现在新边距中的内容,添加运动动词、相机方向和光照提示。将负面提示保持简短,并专注于您想要压制的视觉伪影。
- Outpaint 几何:从小侧垫开始获得自然外观,然后迭代到最终宽高比。羽化的蒙版比硬边缘在扩展天空、水或植被时更好地融合。
- 文本到视频与图像到视频:将
bypass_i2v设置为true以进行文本驱动的 LTX 2.3 Outpainting,当您希望原始帧锚定样式和布局时,设置为false。 - 参考和来源:LTX‑2.3 权重和 ComfyUI 集成 GitHub 和 Hugging Face; VACE 风格的 outpaint 预处理器 GitHub。
致谢#
该工作流实现并构建在以下作品和资源之上。我们感谢 LTX 2.3 Outpainting Workflow 的创建者 @CG Pixel 的贡献和维护。有关权威详细信息,请参阅下面链接的原始文档和存储库。
资源#
- LTX 2.3/Outpainting 工作流来源
- 文档 / 发布说明: YouTube @CG Pixel
注意:所引用的模型、数据集和代码的使用受其作者和维护者提供的相应许可证和条款的约束。


