Hallo2技術由來自復旦大學和百度公司的Jiahao Cui、Hui Li、Yao Yao、Hao Zhu、Hanlin Shang、Kaihui Cheng、Hang Zhou、Siyu Zhu和Jingdong Wang開發。欲了解更多信息,請訪問。ComfyUI_Hallo2節點和工作流程由smthemex開發。欲了解更多詳情,請訪問。所有貢獻均歸功於他們。
Hallo2是一個前沿模型,用於生成高品質、長時間、4K解析度的音頻驅動肖像動畫視頻。它基於原始Hallo模型進行了多項重要改進:
Hallo2通過使用先進技術,如數據增強來保持長時間的一致性,對4K解析度的潛在編碼進行矢量量化,並改進了由音頻和文本指導的去噪過程來實現這些目標。
Hallo2結合了多個先進的AI模型和技術來創建其高品質的肖像視頻:
總之,Hallo2接收音頻和肖像圖像,通過AI "代理" 雕刻視頻幀,使其與它們匹配,同時保持原始肖像的真實性,並採用一些額外的技巧來保持一切同步和一致,即使在長視頻中。所有這些部分在多步驟管道中共同工作以產生令人印象深刻的結果。
Hallo2已通過自定義工作流程和多個專用節點集成到ComfyUI中。以下是使用方法:
LoadImage
節點加載您的參考肖像圖像。這應該是一個清晰的正面肖像。(提示:參考肖像框架和光線越好,效果越好。避免側面輪廓、遮擋、繁忙的背景等。)LoadAudio
節點加載您的驅動音頻。它應匹配您希望肖像表達的情緒。HalloPreImgAndAudio
節點。這會將圖像和音頻預處理為嵌入。關鍵參數:
audio_separator
:用於將語音與背景噪聲分離的模型。通常保持默認。face_expand_ratio
:面部檢測區域的擴展比例。較高的值包括更多的頭髮/背景。width
/height
:生成解析度。較高的值較慢但更詳細。512-1024平方是個不錯的平衡。fps
:目標視頻FPS。25是一個不錯的默認值。HalloLoader
節點加載核心Hallo2模型。指向您的Hallo2檢查點、VAE和運動模塊文件。HalloSampler
節點。這執行實際的視頻生成。關鍵參數:
seed
:隨機種子,決定細節。若不喜歡第一個結果,請更改。pose_scale
/face_scale
/lip_scale
:控制姿勢、面部表情和唇部運動的強度。1.0 = 完全強度,0.0 = 靜止。cfg
:無分類指導比例。較高 = 更緊密地遵循條件,但多樣性較低。steps
:去噪步驟數。步驟越多,質量越好,但速度較慢。HallosUpscaleloader
和HallosVideoUpscale
節點。縮放加載程序讀取預訓練的升級模型,而升級節點實際執行升級到4K。RunComfy 是首選的 ComfyUI 平台,提供 ComfyUI 在線 環境和服務,以及 ComfyUI 工作流程 具有驚豔的視覺效果。 RunComfy還提供 AI Playground, 幫助藝術家利用最新的AI工具創作出令人驚艷的藝術作品。