LTX 2.3 Outpainting for ComfyUI: 時間的一貫性を持つシームレスなビデオフレーム拡張#
このワークフローは、LTX 2.3 Outpaintingを実装して、動き、照明、視点を維持しながらビデオフレームを元の境界を超えて拡張します。アスペクト比の変更、側面または垂直の拡張、連続性を損なわない映画的リフレーミングを必要とするエディターやクリエイター向けに設計されています。IC‑LoRAガイダンスを使用して、LTX 2.3 Outpaintingは時間を通じて一貫してマスクされたキャンバス領域を埋めることができ、同期されたオーディオを生成することもできます。
LightricksのLTX‑2.3モデルとそのComfyUI統合を中心に構築されたグラフは、スマートアウトペイントプリプロセッサをIC‑LoRAコンディショニングと結合して、新たに追加された領域への生成を誘導します。純粋なテキストからビデオ、または画像からビデオへのバリアントを実行し、制御フレームをプレビューし、オーディオ付きの最終MP4をエクスポートできます。
Comfyui LTX 2.3 Outpaintingワークフローの主要モデル#
- LTX‑2.3 22Bチェックポイント。生成品質と時間的安定性を駆動するコア音声ビデオ拡散モデル。公式のLTX‑2.3ウェイトを使用して、より高速な実行のためにltx‑2.3‑22b‑devまたはltx‑2.3‑22b‑distilled‑1.1を使用します Hugging Face page およびLTX‑Videoリポジトリのアップストリームモデルの詳細 GitHub および論文 arXiv。
- Gemma 3 12B InstructテキストエンコーダとLTX 2.3テキストプロジェクション。強力な順守でプロンプトをエンコードし、ComfyUIのデュアルエンコーダ設定を介してLTX‑2.3に供給します。エンコーダカードをご覧ください Hugging Face とComfyUIサポート GitHub。
- LTX‑2.3ビデオVAEとオーディオVAE。ピクセルまたは波形空間とモデルの潜在空間の間をマップして、最終フレームとオーディオをデコードします。ComfyUI‑LTXVideoパッケージで配布されています GitHub。
- LTX 2.3 Outpainting IC‑LoRA。LTX‑2.3を条件付けてマスクまたは黒い領域を生成領域として扱い、時間を通じてシーンの連続性を保持する空間拡張LoRA。LTXVideoノードによって提供されるIC‑LoRA条件付けを利用します GitHub。
- Video Outpaintプリプロセッサ。VACEスタイルのアウトペイントノードは、LTX 2.3 Outpaintingが拡張された領域での合成を導くために使用する新しいキャンバス、マスク、および制御フレームを計算します GitHub。
Comfyui LTX 2.3 Outpaintingワークフローの使用方法#
ワークフローは5つの調整されたグループで構成されています。VACE OUTPAINTは新しいキャンバスとマスクを提案し、LTX 2.3 Preprocessは入力を準備し、SAMPLINGはビデオとオーディオを合成し、出力段階で最終MP4をエンコードします。PROMPTINGとMODELSは並行してテキスト条件付けとウェイトを提供します。
MODELS#
このグループは、LTX‑2.3ベースのチェックポイントをロードし、LTX 2.3 Outpainting IC‑LoRAを適用してモデルが新しいコンテンツを追加する場所を学習します。ビデオとオーディオのVAEが初期化され、フレームと波形をデコードします。モデルの状態は、ガイダーとサンプラーに下流に渡され、同じウェイトが条件付けとノイズ除去の両方を駆動します。ベースのチェックポイントや別のIC‑LoRAに変更したい場合を除いて、ここで変更する必要はありません。
PROMPTING#
正と負のプロンプトはデュアルエンコーダ設定によってエンコードされ、Gemma 3 12BとLTX 2.3テキストプロジェクションをペアリングします。追加の余白に表示したい内容、動きの手がかり、照明の方向を記述して、アウトペイントされたコンテンツを整列させます。必要ないスタイルやコンテンツは負のプロンプトに入れます。エンコーダは条件付けストリームを生成し、後でLTX 2.3 Outpaintingガイドとマージされます。
VACE OUTPAINT#
ソースビデオをローダにドロップして、フレームごとの画像を生成します。VACEOutpaint (#5109) ノードは、拡張されたキャンバスと新しい生成領域をマークする正確なマスクを計算します。グラフは、ImageCompositeMasked (#5110) を使用して元のフレームをこの大きなキャンバスに合成し、「保持」と「合成」領域を明確に示す制御フレームを作成します。プレビューブランチは、これらの制御フレームを軽量のMP4に組み立てて、生成前にアウトペイントのジオメトリを確認できます。この段階からの幅、高さ、およびシーケンス長が下流の潜在セットアップを駆動し、モデルが正確な拡張サイズで動作するようにします。
LTX 2.3 Preprocess#
合成されたフレームは、LTXVPreprocess (#3336) でLTX‑2.3用に正規化されます。画像からビデオへのアンカリングを希望する場合、bypass_i2vをfalseに設定してLTXVImgToVideoConditionOnly (#3159) が制御フレームに動きを条件付けるようにします。純粋なテキストからビデオへのアウトペイントの場合はtrueに設定します。LTXVConditioning (#1241) はプロンプト条件付けを添付し、ビデオローダからのフレームレートを継承してオーディオとビデオを同期させます。これらの信号はLTXAddVideoICLoRAGuideに流れ込み、LTX 2.3 Outpaintingがマスクされた領域をどのように埋めるべきかを示します。
SAMPLING#
LTXAddVideoICLoRAGuide (#5012) は、プロンプト、オプションの画像条件付け、アウトペイントされた制御画像、およびIC‑LoRAを単一のガイダンスパッケージに融合します。正しいフレーム数を持つ空のオーディオ潜在が連結され、オーディオがビデオとロックステップで生成されます。サンプラーはCFGGuider (#4828) を使用し、KSamplerSelectによって選択されたデノイザーと短いManualSigmasスケジュールを使用して、プロンプトの順守と時間的なスムーズさをバランスさせます。SamplerCustomAdvanced (#4829) は、ジョイントオーディオビデオ潜在を生成し、その後デコードのために分割されます。
デコードとエクスポート#
VAEDecodeTiled (#4851) は、拡張された解像度で効率的にビデオフレームをデコードし、LTXVAudioVAEDecode (#4848) は波形を再構築します。VHS_VideoCombine (#5137) は、フレームとオーディオをMP4に多重化し、継承されたフレームレートで出力フォルダに書き込みます。別のプレビューブランチは、最終実行前に迅速な反復のためにVACE制御ビデオを組み立てます。
Comfyui LTX 2.3 Outpaintingワークフローの主要ノード#
VACEOutpaint (#5109)#
ターゲットキャンバスとアウトペイント領域をマークするバイナリまたはフェザーマスクを計算します。横に広がるために左または右に、縦に変換するために上または下に拡張し、プレビュービデオで確認します。最初のパスでは成長を控えめに保ち、必要に応じてヘッドルームを増やして反復します。黒または明確にマスクされた領域が最適で、LTX 2.3 Outpaintingはそれらを生成ゾーンとして扱うように訓練されています。
LTXAddVideoICLoRAGuide (#5012)#
LTX 2.3 Outpaintingの中心で、このノードはIC‑LoRAを注入し、合成制御フレームを使用して生成をマスクされた領域にだけバイアスします。LoRAの強度を増加させて、より強い空間拡張動作を強制し、モデルが元のコンテンツを上書きし始めた場合はそれを減少させます。潜在ダウンスケールファクターはローダから取得され、速度と詳細のバランスを取らない限りそのままにしておいてください。
CFGGuider (#4828)#
モデルがプロンプトと入力条件付けにどれだけ厳密に従うかを制御します。新たに追加された余白での順守を強化するためにガイダンスを上げ、動きが不安定になった場合はそれを下げます。大きなジャンプではなく、シグマスケジュールと一緒に小さな変更を検討します。
SamplerCustomAdvanced (#4829) with KSamplerSelect and ManualSigmas (#5025)#
デノイジングパスを定義します。選択されたEuler Ancestral CFG++バリアントは、LTX‑2.3のためにクリスプなディテールとスムーズな動きを提供します。短い手動シグマラダーは、元のフレームからの構造を保持しながら、アウトペイントされたゾーンが首尾一貫して進化するのを助けます。
VAEDecodeTiled (#4851)#
VRAMを管理するためにタイルで高解像度フレームをデコードします。シームアーティファクトが見られる場合は、タイルサイズまたはオーバーラップを少し調整して再実行します。このノードは純粋に効率のためのものであり、創造的な結果を変更することはありません。
VHS_VideoCombine (#5137)#
フレームと生成されたオーディオトラックを継承されたフレームレートで多重化します。ソースオーディオを優先する場合は、そのオーディオをコンバイナーにルートし、生成されたトラックを無効にします。
オプションの追加機能#
- LTX 2.3 Outpaintingのプロンプトのヒント: 新しい余白に具体的に表示されるべきコンテンツを記述し、動詞、カメラの方向、照明の手がかりを追加します。負のプロンプトは、抑制したい視覚的なアーティファクトに焦点を当てて短く保ちます。
- アウトペイントジオメトリ: 自然な外観のために小さなサイドパッドから始め、最終的なアスペクト比に向けて反復します。フェザーマスクは、空、海、または葉を拡張する際にハードエッジよりもブレンドが良いです。
- テキストからビデオ対画像からビデオ: テキスト駆動のLTX 2.3 Outpaintingの場合は
bypass_i2vをtrueに設定し、元のフレームがスタイルとレイアウトをアンカーする場合はfalseに設定します。 - 参照とソース: LTX‑2.3ウェイトとComfyUI統合 GitHub および Hugging Face; VACEスタイルのアウトペイントプリプロセッサ GitHub。
謝辞#
このワークフローは、以下の作品とリソースを実装および構築しています。私たちは、LTX 2.3のOutpainting Workflowの作成者である@CG Pixelにその貢献とメンテナンスに感謝します。権威ある詳細については、以下にリンクされたオリジナルのドキュメントとリポジトリを参照してください。
リソース#
- LTX 2.3/Outpainting Workflow Source
- Docs / Release Notes: YouTube @CG Pixel
注: 参照されたモデル、データセット、およびコードの使用は、それらの著者およびメンテナによって提供されるそれぞれのライセンスおよび条件に従います。



