logo
RunComfy
ComfyUIPlaygroundPricing
discord logo
ComfyUI>ワークフロー>MMAudio | Video-to-Audio

MMAudio | Video-to-Audio

Workflow Name: RunComfy/MMAudio
Workflow ID: 0000...1180
MMAudioは、ビデオおよびテキスト入力から同期された音声を比類なき精度で生成します。マルチモーダル共同トレーニングを使用して、多様な音声-視覚および音声-テキストデータセットにシームレスに適応します。その高度な同期モジュールは完璧な整合を保証し、現代のコンテンツニーズに合わせて音声生成を変革します。

The ComfyUI-MMAudio ノードとその関連ワークフローはすべてKijaiによって開発されました。この革新的な作品に対して、Kijaiにすべての功績を帰します。RunComfyプラットフォームでは、単にKijaiの貢献をコミュニティに紹介しています。現在、RunComfyとKijaiの間に正式な関係やパートナーシップはありません。Kijaiの作品に深く感謝しています。

MMAudio

MMAudioは、ビデオおよびテキスト入力から同期された音声を作成するための強力なツールです。多様な音声-視覚および音声-テキストデータセットから学習するためにマルチモーダル共同トレーニングを利用し、卓越した適応性を確保します。その高度な同期モジュールにより、音声をビデオフレームに完璧に整合させます。MMAudioは音声生成を革命化し、クリエイターやイノベーターのためにプロセスを簡素化します。

1.1 MMAudioワークフローの使い方

MMAudio

これはMMAudioワークフローです。左側のノードはビデオのアップロード用入力、中央はMMAudioノードの処理、右側は出力ノードです。

  • 入力ノードにビデオをアップロードしてください。
  • 音声生成のプロンプトを書いてください。
  • レンダーをクリック!!!

1.2 ビデオ入力

MMAudio

  • 参照ビデオをクリックしてアップロードしてください。

ビデオはHDビデオや長いビデオの処理でメモリ不足になる可能性があるため、?*512の解像度にダウンスケールされます。

1.3 MMAudio処理

MMAudio

  • Positive: 音声のためのビデオ生成プロンプトを入力します。
  • Negative: 聞きたくないものを入力します。
  • Steps : ステップが多いほど、音質が向上する可能性があります。

1.4 MMAudioモデル

MMAudio

これらはモデルダウンローダーノードで、2-3分でcomfyuiにモデルを自動的にダウンロードします。

  • MMAudio Models : https://github.com/hkchengrex/MMAudio

革新的なマルチモーダルトレーニングと正確な同期を備えたMMAudioは、音声生成の新しい基準を設定します。ビデオ、アニメーション、または没入型体験を作成する場合でも、MMAudioはシームレスで高品質な音声でクリエイターを支援します。プロジェクトを向上させ、アイデアをMMAudioで具現化してください。

Want More ComfyUI Workflows?

FLUX インペインティング | シームレスな画像編集

FLUX インペインティング | シームレスな画像編集

画像を手軽に埋め、削除し、洗練させ、新しいコンテンツをシームレスに統合します。

Anyline + MistoLine | 高品質のスケッチから画像生成

Anyline + MistoLine | 高品質のスケッチから画像生成

MistoLineは様々なラインアート入力に適応し、スケッチから高品質の画像を簡単に生成します。

IPAdapter V1 FaceID Plus | 一貫したキャラクター

IPAdapter V1 FaceID Plus | 一貫したキャラクター

IPAdapter FaceID Plus V2モデルを活用して、一貫性のあるキャラクターを作成します。

Fluxtapoz | RF Inversionとスタイライズ

FluxtapozノードによるRF Inversionとスタイライズ - アンサンプリングとサンプリング

Unsamplingによるクレイスタイル

Unsamplingメソッドを使用してビデオをクレイスタイルに変換します。

Vid2Vid パート1 | 構成とマスキング

ComfyUI Vid2Vidは、高品質でプロフェッショナルなアニメーションを作成するための2つの異なるワークフローを提供します: Vid2Vid パート1では、元のビデオの構成とマスキングに焦点を当てることで創造性を高め、Vid2Vid パート2では、SDXL Style Transferを利用してビデオのスタイルを希望する美的感覚に一致させます。このページでは特にVid2Vid パート1を取り上げます。

LivePortrait | ポートレートのアニメーション | Img2Vid

1枚の画像と参照動画を使用して、表情と動きのあるポートレートをアニメーション化します。

LivePortrait | ポートレートをアニメーション化 | Vid2Vid

2025年6月16日更新: ComfyUI バージョンが v0.3.39 に更新され、安定性と互換性が向上しました。ドライビングビデオから表情や動きをソースビデオに転送します。

フォローする
  • LinkedIn
  • Facebook
  • Instagram
  • Twitter
サポート
  • Discord
  • メール
  • システムステータス
  • アフィリエイト
リソース
  • 無料のComfyUIオンライン
  • ComfyUIガイド
  • RunComfy API
  • ComfyUIチュートリアル
  • ComfyUIノード
  • 詳細を見る
法的情報
  • 利用規約
  • プライバシーポリシー
  • Cookieポリシー
RunComfy
著作権 2025 RunComfy. All Rights Reserved.

RunComfyは最高の ComfyUI プラットフォームです。次のものを提供しています: ComfyUIオンライン 環境とサービス、および ComfyUIワークフロー 魅力的なビジュアルが特徴です。 RunComfyはまた提供します AI Playground, アーティストが最新のAIツールを活用して素晴らしいアートを作成できるようにする。