The nodes and its associated workflow are fully developed by Kijai. 我們給予 Kijai 所有應有的讚譽,因為這項創新的工作。在 RunComfy 平台上,我們只是向社群展示 Kijai 的貢獻。請注意,目前 RunComfy 與 Kijai 之間沒有正式的聯繫或合作。我們非常感謝 Kijai 的工作!
Tora 引入了一種新穎的框架,通過在擴散變壓器模型中利用基於軌跡的指導來生成高品質影片。通過專注於運動軌跡,Tora 實現了更真實和時間一致的影片合成。這種方法彌合了空間-時間建模與生成擴散框架之間的鴻溝。
請注意,這個版本的 Tora 基於 CogVideoX-5B 模型,僅供學術研究用途。欲了解授權詳情,請參考。
這是 CogVideoX Tora 工作流程,左側節點是輸入,中間是處理 tora 節點,右側是輸出節點。
[!CAUTION] 只有 720*480 的橫向格式影像可以使用。其他尺寸會產生錯誤。
Positive
: 輸入根據軌跡節點中定義的軌跡主題發生的動作(移動、流動...等)。Negative
: 輸入您不希望發生的事情(扭曲的手、模糊...等)在此您設置上傳照片中主題運動的軌跡路徑。
points_to_sample
: 設置渲染的幀數,或影片的幀數。mask_width
: 預設為 720。請勿更改!mask_height
: 預設為 480。請勿更改!節點指南:
切換控制柄可見性
Sampling_method:
這些是模型下載節點,它會自動在您的 comfyui 中下載模型,需時 2-3 分鐘。
Steps
: 此值決定您的渲染品質。保持在 25 - 35 之間以獲得最佳和高效值。cfg
: CogVideo 取樣的預設值是 6.0。denoising strength
和 Scheduler
: 請勿更改此項。此節點將設置您的運動軌跡的強度。
strength
: 高值將產生扭曲的圖形或飛行點。使用 0.5 - 0.9 之間。start_percent
: 使用此值來緩和強度運動的效果。end_percent
: 高值將產生扭曲的圖形或飛行點。使用 0.3 - 0.7 之間這些節點將提供您 3 個輸出。
"CogVideoX Tora: Trajectory-oriented Diffusion Transformer for Video Generation" 透過在擴散變壓器框架中引入基於軌跡的指導,提出了一種創新的影片生成方法。不同於傳統影片合成模型難以維持時間一致性和真實運動,CogVideoX Tora 明確專注於建模運動軌跡。這使得系統能夠生成一致且視覺上令人信服的影片,通過理解物體和元素隨時間的演變。結合以高品質影像生成而聞名的擴散模型與變壓器的時間推理能力,CogVideoX Tora 彌合了空間和時間建模之間的鴻溝。
CogVideoX Tora 的軌跡導向機制提供了對物體移動和動態互動的細緻控制,特別適合需要精確運動指導的應用,如影片編輯、動畫和特效生成。模型維持時間一致性和真實過渡的能力增強了其在創建流暢且一致的影片內容中的應用性。通過整合軌跡先驗,CogVideoX Tora 不僅改善了運動動態,還減少了框架生成中常見的瑕疵。這一突破為影片合成設定了新的基準,為電影製作、虛擬現實和基於影片的 AI 等領域的創作者和開發者提供了一個強大的工具。
RunComfy 是首選的 ComfyUI 平台,提供 ComfyUI 在線 環境和服務,以及 ComfyUI 工作流程 具有驚豔的視覺效果。 RunComfy還提供 AI Playground, 幫助藝術家利用最新的AI工具創作出令人驚艷的藝術作品。