MMAudio | Video-to-Audio Model

The ComfyUI-MMAudioノードとその関連ワークフローはすべてKijaiによって開発されました。この革新的な作品に対して、Kijaiにすべての功績を帰します。RunComfyプラットフォームでは、単にKijaiの貢献をコミュニティに紹介しています。現在、RunComfyとKijaiの間に正式な関係やパートナーシップはありません。Kijaiの作品に深く感謝しています。

ComfyUI MMAudio Workflow

Want to run this workflow?

Fully operational workflows
No missing nodes or models
No manual setups required
Features stunning visuals

ComfyUI MMAudio Examples

The ComfyUI-MMAudio ノードとその関連ワークフローはすべてKijaiによって開発されました。この革新的な作品に対して、Kijaiにすべての功績を帰します。RunComfyプラットフォームでは、単にKijaiの貢献をコミュニティに紹介しています。現在、RunComfyとKijaiの間に正式な関係やパートナーシップはありません。Kijaiの作品に深く感謝しています。

MMAudio#

MMAudioは、ビデオおよびテキスト入力から同期された音声を作成するための強力なツールです。多様な音声-視覚および音声-テキストデータセットから学習するためにマルチモーダル共同トレーニングを利用し、卓越した適応性を確保します。その高度な同期モジュールにより、音声をビデオフレームに完璧に整合させます。MMAudioは音声生成を革命化し、クリエイターやイノベーターのためにプロセスを簡素化します。

1.1 MMAudioワークフローの使い方#

これはMMAudioワークフローです。左側のノードはビデオのアップロード用入力、中央はMMAudioノードの処理、右側は出力ノードです。

入力ノードにビデオをアップロードしてください。
音声生成のプロンプトを書いてください。
レンダーをクリック!!!

1.2 ビデオ入力#

参照ビデオをクリックしてアップロードしてください。

ビデオはHDビデオや長いビデオの処理でメモリ不足になる可能性があるため、?*512の解像度にダウンスケールされます。

1.3 MMAudio処理#

Positive: 音声のためのビデオ生成プロンプトを入力します。
Negative: 聞きたくないものを入力します。
Steps : ステップが多いほど、音質が向上する可能性があります。

1.4 MMAudioモデル#

これらはモデルダウンローダーノードで、2-3分でcomfyuiにモデルを自動的にダウンロードします。

MMAudio Models : https://github.com/hkchengrex/MMAudio

革新的なマルチモーダルトレーニングと正確な同期を備えたMMAudioは、音声生成の新しい基準を設定します。ビデオ、アニメーション、または没入型体験を作成する場合でも、MMAudioはシームレスで高品質な音声でクリエイターを支援します。プロジェクトを向上させ、アイデアをMMAudioで具現化してください。

Want More ComfyUI Workflows?

一貫性のあるリアルなキャラクター

顔の特徴、ポーズ、および構図を正確に制御して、一貫性のあるリアルなキャラクターを作成します。

FLUX IP-Adapter | スタイル適応による画像生成

事前訓練されたモデルを特定の画像スタイルに適応させ、512x512および1024x1024の見事なビジュアルを作成します。

Wan2.2 Fun Camera | 画像からのシネマティックモーション

静止画を滑らかなカメラ動作で生き生きとしたシネマティックショットに変えます。

Stable Audio Open 1.0 | テキストから音楽へのツール

テキストプロンプトをシームレスかつ高速にシネマティック音楽に変換します。

ファンタジーポートレート | 表現豊かな写真アニメーション

写真 → 表現豊かな映画的顔アニメーション、迅速かつアイデンティティに正確。

AnimateDiff + Batch Prompt Schedule | テキストからビデオへ

AnimateDiffを使用したBatch Prompt Scheduleは、アニメーション作成における物語と視覚要素を正確に制御できます。

アンサンプリングを用いた一貫したスタイル転送

アンサンプリングによる潜在ノイズの制御は、ビデオスタイル転送の一貫性を劇的に向上させます。

LivePortrait | ポートレートをアニメーション化 | Vid2Vid

2025年6月16日更新: ComfyUI バージョンが v0.3.39 に更新され、安定性と互換性が向上しました。ドライビングビデオから表情や動きをソースビデオに転送します。

フォローする

サポート

リソース

法的情報

RunComfy

RunComfyは最高の ComfyUI プラットフォームです。次のものを提供しています: ComfyUIオンライン環境とサービス、および ComfyUIワークフロー魅力的なビジュアルが特徴です。 RunComfyはまた提供します AI Models, アーティストが最新のAIツールを活用して素晴らしいアートを作成できるようにする。