logo
RunComfy
  • ComfyUI
  • トレーナー新着
  • モデル
  • API
  • 価格
discord logo
ComfyUI>ワークフロー>Ace Step 1.5 | 商用グレードのAI音楽ジェネレーター

Ace Step 1.5 | 商用グレードのAI音楽ジェネレーター

Workflow Name: RunComfy/Ace-Step-1.5
Workflow ID: 0000...1358
このワークフローは、Ace Step 1.5を使用して、テキストプロンプトや短い入力を迅速に完全な音楽作品に変えるのに役立ちます。言語プランナーとディフュージョントランスフォーマーを統合したハイブリッドアーキテクチャを使用して、強力な構造、メロディの明瞭さ、リズムの精度を提供します。最小限の設定でシームレスなマルチインストゥルメンタルトラックやボーカルレイヤーを制作できます。LoRAファインチューニングをサポートしており、個性的なトーンやパフォーマンススタイルの作成が可能です。クリエイティブな制御と迅速な結果を求めるプロデューサーやAIミュージシャンに最適です。

Ace Step 1.5 テキストから音楽へのワークフロー for ComfyUI

このテンプレートは、短いクリエイティブブリーフとオプションの歌詞を使用して、Ace Step 1.5を用いて完成したMP3に変換します。ミュージシャン、プロデューサー、クリエイターを対象としており、テキストから一貫した構造、ボーカル、スタイリスティックな制御を持つ高速で高品質な曲の生成を希望する人々に設計されています。ワークフローは直接的なテキストから音楽へのパスに焦点を当てているため、アイデアからオーディオまで一度に進めることができます。

Ace Step 1.5は、計画モジュールとディフュージョントランスフォーマーを組み合わせて商用グレードの音楽的連続性を提供しながら、日常的なハードウェアでも軽量です。このComfyUIグラフでは、Ace Step 1.5はスタイルプロンプトと歌詞を受け取り、アレンジメントを計画し、潜在的なオーディオ表現を合成し、デコードして共有可能なファイルを保存します。

Comfyui Ace Step 1.5 ワークフローの主要モデル

  • Ace Step 1.5 Turbo AIOチェックポイント。テキストと歌詞を音楽にマッピングし、オーディオ領域でのディフュージョンベースの合成を処理する基盤モデル。Comfy-OrgのHugging FaceからComfyUIファイルセットの一部として入手可能:Comfy-Org/ace_step_1.5_ComfyUI_files。
  • Ace Step 1.5 テキストエンコーダー。チェックポイントと共にパッケージ化されており、プロンプトとオプションの歌詞をジェネレーターのコンディショニングに変換します。TextEncodeAceStepAudio1.5ノードでグラフに表示されます。
  • Ace Step 1.5 オーディオVAE。チェックポイントに含まれており、合成された潜在を時間領域の波形にデコードしてエクスポートします。

Comfyui Ace Step 1.5 ワークフローの使い方

大まかに言うと、Ace Step 1.5モデルをロードし、曲の長さを選び、音楽を説明し、歌詞を貼り付け、サンプリングを実行してMP3に合成およびデコードします。

ステップ 1 - モデルをロード

このグループはCheckpointLoaderSimple (#97)を通じてコアアセットを初期化します。Ace Step 1.5 Turbo AIOファイルを選択すると、モデル、そのテキストエンコーダー、およびオーディオVAEが一度にロードされます。ModelSamplingAuraFlow (#78)ノードは、Ace Step 1.5互換のサンプラー設定を添付し、下流のKSamplerが意図したアルゴリズムで動作できるようにします。これが設定されると、残りのワークフローはプロンプトと持続時間だけで動かすことができます。

ステップ 2 - 持続時間

ここでSong Duration (#99)コントロールはEmptyAceStep1.5LatentAudio (#98)に秒数を供給し、トラックのターゲット潜在長を事前に割り当てます。短い長さに設定すると迅速なアイデア出しやスタイルチェックに最適で、長い値はAce Step 1.5が完全なセクションを計画できるようにします。持続時間は前方に流れ、エンコーダーとサンプラーが生成する構造量に一致します。後で曲を延長する場合、雰囲気とモチーフを保持するために同じシードを使用してください。

ステップ 3 - プロンプト

TextEncodeAceStepAudio1.5 (#94)を使用して、スタイル、ムード、楽器編成、および制作メモを記述し、歌詞をオプションで貼り付けます。Ace Step 1.5はこれを読み取り、メロディ、ハーモニー、リズム、およびボーカルのフレージングを一貫したセクションで計画します。seed (#102)ラインは結果を再現可能またはランダム化するために使用します。ConditioningZeroOut (#47)は、中立的なネガティブコンディショニングを送信し、音楽出力には通常良いデフォルトです。厳格なネガティブプロンプトが必要な場合は、そのノードを独自のネガティブテキストパスで置き換えてください。

KSampler (#3)

このノードは、ModelSamplingAuraFlow (#78)からのAce Step 1.5モデル接続、プロンプトからのポジティブコンディショニング、中立的なネガティブコンディショニング、および事前に割り当てられた潜在長を使用して、実際のディフュージョンプロセスを実行します。ノイズをテキストの指示と歌詞を反映する構造化された潜在に変換します。迅速なアイデア出しのために実行時間を保守的に保ち、コンセプトを確定したときに品質を向上させることができます。同じシードはテイク全体で一貫した構造を提供するため、サンプラーチョイスをA/B比較できます。

VAEDecodeAudio (#18)

サンプリングの後、このノードは潜在オーディオ表現をAce Step 1.5 VAEを使用して時間領域の波形に戻します。エンコーディング中に計画された音楽形式を維持しながら、ディフュージョン中に導入された細部を滑らかにします。出力はエクスポートの準備が整ったフルバンドオーディオ信号です。

SaveAudioMP3 (#104)

最後に、波形が標準のComfyUI出力にMP3ファイルとして書き込まれます。ターゲットに適したビットレートを選択してレンダリングします。プロンプトやシードを調整する場合、元の潜在を再実行用に残しておくことで、コンパクトで共有可能なファイルを得ることができます。

Comfyui Ace Step 1.5 ワークフローの主要ノード

TextEncodeAceStepAudio1.5 (#94)

クリエイティブブリーフと歌詞をAce Step 1.5が理解できるコンディショニングに変換します。制御のために、言語、音楽キー、テンポを調整し、フレージングとハーモニーを誘導し、セクション構造を設定して、フォームの変化を増減させます。ジャンル、ムード、ミックスキューのような記述的な制作メモを使用してスタイルを固定します。歌詞はクリーンなボーカルフレージングのために簡潔で韻律的に保ちます。

KSampler (#3)

計画をオーディオ潜在に変換するディフュージョンプロセスを駆動します。詳細と安定性を向上させるためにステップを増やすか、非常に迅速なプレビューのために減らします。異なるトランジェントの振る舞いを望む場合は、別のサンプラーメソッドを試し、比較を公正にするためにシードを固定します。Ace Step 1.5プロンプトへのより厳密な適合のためにガイダンス強度を上げ、自由な即興のために下げます。

EmptyAceStep1.5LatentAudio (#98)

ターゲット曲の長さを潜在テンソルとして割り当てることで、すべての下流ステージが同じ持続時間で作業します。最終レンダリングで必要な秒数に設定します。長い潜在はより多くの計算を必要とし、サンプラーの品質設定をわずかに高くすることで恩恵を受ける可能性があります。

ModelSamplingAuraFlow (#78)

スピードと音楽的一貫性をバランスさせるAce Step 1.5互換のサンプリング戦略を添付します。グローバルな構造を維持しながら応答性のある反復を望む場合に使用します。異なるサンプラーファミリーを試す場合は、タイミングとトランジェントの変化を評価するために同じシードを使用します。

SaveAudioMP3 (#104)

デコードされた波形を圧縮ファイルにエクスポートします。リリースや共有先に応じてビットレートを選択し、サイズと忠実度をトレードオフします。アーカイブやミキシング用には、同じ位置にWAV保存ノードを交換できます。

ConditioningZeroOut (#47)

歌詞駆動の音楽生成に安全なデフォルトである中立的なネガティブコンディショニングを提供します。ボーカルなしや高周波アーティファクトを減らすなどの明示的な除外が必要な場合は、カスタムのネガティブプロンプトで置き換えてください。ポジティブとネガティブの指示を概念的に区別して、コンフリクトを避けます。

オプションのエクストラ

  • スタイルを検証するために30〜60秒から始め、シードを固定したまま曲を完成させるために持続時間を延長します。
  • Ace Step 1.5を使用したインストゥルメンタルの場合、プロンプトに明示的に記述するか、ネガティブプロンプトパスに「ボーカルなし」と記載します。
  • 歌詞を自然なフレージングと一貫した音節数で歌いやすいラインとして扱い、ボーカルの結果を改善します。
  • 有望なシードをプロンプトと共に保存し、曲のアイデンティティを失わずに後で再訪し、アップスケールします。

参考資料:ComfyUIプロジェクトのGitHubでの一般的な使用情報 ComfyUI と、Hugging FaceでのAce Step 1.5 ComfyUIファイルのチェックポイントとアセット Comfy-Org/ace_step_1.5_ComfyUI_files。

謝辞

このワークフローは、以下の作品とリソースを実装し、構築しています。Ace Step 1.5ワークフローの貢献とメンテナンスに対して、Comfy.orgに心から感謝いたします。詳細については、以下にリンクされたオリジナルのドキュメントとリポジトリを参照してください。

リソース

  • Comfy.org/Ace Step 1.5 ワークフローソース
    • ドキュメント / リリースノート: Ace Step 1.5 is now available in ComfyUI

注意: 参照されたモデル、データセット、およびコードの使用は、それぞれの著者およびメンテナーによって提供されるライセンスおよび条件に従います。

Want More ComfyUI Workflows?

ACE-Step 音楽生成 | AI オーディオ作成

画期的な拡散技術でスタジオ品質の音楽を15倍速く生成します。

MMAudio | Video-to-Audio

MMAudio: 高品質な音声生成のための高度なビデオから音声へのモデル。

Wan 2.1 | 革新的なビデオ生成

画期的なAIを使用して、日常のCPUで動作するテキストまたは画像から信じられないほどのビデオを作成します。

Wan 2.1 LoRA

LoRAモデルを使用してWan 2.1ビデオ生成を強化し、スタイルとカスタマイズを向上させます。

Wan 2.2 イメージ生成 | 2-in-1 ワークフローパック

MoE Mix + Low-Onlyとアップスケール。どちらかを選んでください。

CogVideoX-5B | 高度なテキストからビデオへのモデル

CogVideoX-5B:高品質なビデオ生成のための高度なテキストからビデオへのモデル。

Qwen Image Edit 2511 | スマートイメージ編集ワークフロー

あなたが指示した通りに画像を編集します—迅速かつ正確に。

Z Image ControlNet | 精密画像ジェネレーター

画像のポーズ、エッジ、深度レイアウトの完全な制御。

フォローする
  • LinkedIn
  • Facebook
  • Instagram
  • Twitter
サポート
  • Discord
  • メール
  • システムステータス
  • アフィリエイト
リソース
  • 無料のComfyUIオンライン
  • ComfyUIガイド
  • RunComfy API
  • ComfyUIチュートリアル
  • ComfyUIノード
  • 詳細を見る
法的情報
  • 利用規約
  • プライバシーポリシー
  • Cookieポリシー
RunComfy
著作権 2026 RunComfy. All Rights Reserved.

RunComfyは最高の ComfyUI プラットフォームです。次のものを提供しています: ComfyUIオンライン 環境とサービス、および ComfyUIワークフロー 魅力的なビジュアルが特徴です。 RunComfyはまた提供します AI Models, アーティストが最新のAIツールを活用して素晴らしいアートを作成できるようにする。