Ace Step 1.5 in ComfyUI Workflow | Text-to-Music Diffusion

Ace Step 1.5 텍스트-음악 워크플로우 for ComfyUI

이 템플릿은 짧은 창작 브리프와 선택적 가사를 사용하여 Ace Step 1.5로 완성된 MP3로 변환합니다. 이는 빠르고 높은 품질의 노래 생성과 일관된 구조, 보컬 및 스타일적 제어를 원하는 음악가, 프로듀서 및 창작자를 위해 설계되었습니다. 워크플로우는 아이디어에서 오디오로 한 번에 이동할 수 있도록 직접적인 텍스트-음악 경로에 중점을 둡니다.

Ace Step 1.5는 계획 모듈과 확산 변환기를 결합하여 상업용 수준의 음악적 연속성을 제공하면서도 일상적인 하드웨어에 충분히 가벼운 무게를 유지합니다. 이 ComfyUI 그래프에서 Ace Step 1.5는 스타일 프롬프트와 가사를 받아 배열을 계획하고, 잠재 오디오 표현을 합성한 다음, 준비된 파일을 디코딩하고 저장합니다.

Comfyui Ace Step 1.5 워크플로우의 주요 모델

Ace Step 1.5 Turbo AIO 체크포인트. 텍스트와 가사를 음악으로 매핑하고 오디오 도메인에서 확산 기반 합성을 처리하는 기본 모델입니다. Comfy-Org의 Hugging Face에서 ComfyUI 파일 세트의 일부로 제공됩니다: Comfy-Org/ace_step_1.5_ComfyUI_files.
Ace Step 1.5 텍스트 인코더. 체크포인트와 함께 패키지되어 있으며, 프롬프트와 선택적 가사를 생성기의 조건으로 변환하는 데 사용됩니다. TextEncodeAceStepAudio1.5 노드에 의해 그래프에 노출됩니다.
Ace Step 1.5 오디오 VAE. 체크포인트에 포함되어 있으며, 합성된 잠재를 시간 도메인 파형으로 디코딩하여 내보내는 데 사용됩니다.

Comfyui Ace Step 1.5 워크플로우 사용 방법

고급 수준에서 Ace Step 1.5 모델을 로드하고, 노래 지속 시간을 선택하고, 음악을 설명하고 가사를 붙여넣은 다음 샘플링을 실행하여 MP3로 합성하고 디코딩합니다.

Step 1 - 모델 로드

이 그룹은 CheckpointLoaderSimple (#97)을 통해 핵심 자산을 초기화합니다. Ace Step 1.5 Turbo AIO 파일을 선택하면 모델, 텍스트 인코더 및 오디오 VAE가 한 번에 로드됩니다. ModelSamplingAuraFlow (#78) 노드는 Ace Step 1.5 호환 샘플러 구성을 연결하여 다운스트림 KSampler가 의도한 알고리즘으로 실행될 수 있도록 합니다. 이 설정이 완료되면 워크플로우의 나머지는 프롬프트와 지속 시간에 의해 순수하게 구동될 수 있습니다.

Step 2 - 지속 시간

여기서 Song Duration (#99) 컨트롤은 트랙의 목표 잠재 길이를 사전 할당하는 EmptyAceStep1.5LatentAudio (#98)에 초 단위로 공급됩니다. 짧은 길이를 설정하면 빠른 아이디어 도출 및 스타일 체크에 좋고, 더 긴 값은 Ace Step 1.5가 더 완전한 섹션을 계획할 수 있도록 합니다. 지속 시간은 인코더와 샘플러가 생성할 구조의 양에 대해 합의하도록 앞으로 흐릅니다. 나중에 노래를 연장할 경우, 분위기와 모티프를 유지하기 위해 동일한 시드를 유지하십시오.

Step 3 - 프롬프트

TextEncodeAceStepAudio1.5 (#94)을 사용하여 스타일, 분위기, 악기 구성 및 제작 노트를 설명하고, 선택적으로 가사를 붙여넣습니다. Ace Step 1.5는 이를 읽어 멜로디, 하모니, 리듬 및 보컬 프레이징을 계획하며 일관된 섹션을 제공합니다. seed (#102) 라인은 결과를 반복 가능하게 하거나 무작위로 만듭니다. ConditioningZeroOut (#47)은 충돌을 줄이기 위한 중립적인 부정 조건을 보내며, 이는 종종 음악적 출력에 대한 좋은 기본값입니다. 더 엄격한 부정 프롬프트가 필요한 경우 해당 노드를 자신의 부정 텍스트 경로로 교체하십시오.

`KSampler` (#3)

이 노드는 ModelSamplingAuraFlow (#78)에서 Ace Step 1.5 모델 연결, 긍정적인 조건, 중립적인 부정 조건 및 사전 할당된 잠재 길이를 사용하여 실제 확산 과정을 수행합니다. 이는 노이즈를 텍스트 지침과 가사를 반영하는 구조화된 잠재로 변환합니다. 빠른 아이디어 도출을 위해 보수적인 런타임을 유지한 다음, 개념을 고정할 때 품질을 높일 수 있습니다. 동일한 시드는 테이크 간 일관된 구조를 제공하여 샘플러 선택을 A/B 비교할 수 있습니다.

`VAEDecodeAudio` (#18)

샘플링 후 이 노드는 Ace Step 1.5 VAE를 사용하여 잠재 오디오 표현을 시간 도메인 파형으로 다시 변환합니다. 인코딩 중 계획된 음악적 형태를 보존하며 확산 중 도입된 세부 사항을 부드럽게 조정합니다. 출력은 내보내기 준비가 된 풀 밴드 오디오 신호입니다.

`SaveAudioMP3` (#104)

마지막으로, 파형은 표준 ComfyUI 출력에 MP3 파일로 작성됩니다. 대상에 적합한 비트레이트를 선택하고 렌더링합니다. 이는 프롬프트나 시드를 조정할 경우 다시 실행할 수 있도록 원본 잠재를 유지하면서도 공유 가능한 압축 파일을 제공합니다.

Comfyui Ace Step 1.5 워크플로우의 주요 노드

`TextEncodeAceStepAudio1.5` (#94)

창작 브리프와 가사를 Ace Step 1.5가 이해할 수 있는 조건으로 변환합니다. 제어를 위해 언어, 음악 키 및 템포를 조정하여 프레이징과 하모니를 조정하고, 섹션 구조를 설정하여 더 많은 또는 적은 형태 변화를 원할 때 사용합니다. 스타일을 고정하기 위해 장르, 분위기 및 믹스 큐와 같은 설명적 제작 노트를 사용하십시오. 보컬 프레이징을 깔끔하게 하기 위해 가사를 간결하고 운율 있게 유지하십시오.

`KSampler` (#3)

계획을 오디오 잠재로 변환하는 확산 과정을 구동합니다. 세부 사항과 안정성을 위해 단계를 늘리거나 매우 빠른 미리보기를 위해 줄이십시오. 다른 일시적 행동을 원하는 경우 대체 샘플러 방법을 시도한 다음, 시드를 고정하여 비교를 공정하게 만드십시오. Ace Step 1.5 프롬프트에 대한 더 강한 일치를 위해 가이던스 강도를 높이거나, 더 자유로운 즉흥 연주를 위해 낮추십시오.

`EmptyAceStep1.5LatentAudio` (#98)

잠재 텐서로 목표 노래 길이를 할당하여 모든 다운스트림 단계가 동일한 지속 시간에 대해 작업하도록 합니다. 최종 렌더에 원하는 초 단위로 설정하십시오. 더 긴 잠재는 더 많은 컴퓨팅을 요구하며 샘플러에서 약간 더 높은 품질 설정의 이점을 받을 수 있습니다.

`ModelSamplingAuraFlow` (#78)

속도와 음악적 일관성을 균형 있게 유지하는 Ace Step 1.5 호환 샘플링 전략을 연결합니다. 여전히 전체 구조를 유지하면서 반응하는 반복을 원할 때 사용하십시오. 다른 샘플러 그룹을 실험할 경우, 타이밍과 일시적 변화가 어떻게 바뀌는지 평가하기 위해 동일한 시드를 사용하십시오.

`SaveAudioMP3` (#104)

디코딩된 파형을 압축 파일로 내보냅니다. 릴리스 또는 공유 대상에 적합한 비트레이트를 선택하여 크기와 충실도를 거래하십시오. 아카이브 또는 믹싱을 위해 동일한 위치의 WAV 저장 노드로 교체할 수 있습니다.

`ConditioningZeroOut` (#47)

가사 기반 음악 생성에 대한 안전한 기본값인 중립적인 부정 조건을 제공합니다. 보컬 없음이나 고주파 아티팩트 감소와 같은 명시적 제외가 필요한 경우 사용자 정의 부정 프롬프트로 교체하십시오. 긍정적 및 부정적 지침을 개념적으로 명확하게 구분하여 충돌을 피하십시오.

선택적 추가 기능

스타일을 검증하기 위해 30–60초로 시작한 다음, 시드를 고정한 상태로 지속 시간을 연장하여 트랙을 완성하십시오.
Ace Step 1.5와 함께 악기 연주를 원할 경우 프롬프트에 명시적으로 언급하거나 부정 프롬프트 경로에 "보컬 없음"을 넣으십시오.
자연스러운 프레이징과 일관된 음절 수를 가진 노래할 수 있는 선으로 가사를 대하십시오. 보컬 결과를 개선합니다.
유망한 시드를 프롬프트와 함께 저장하여 노래의 정체성을 잃지 않고 나중에 재방문하고 업스케일할 수 있습니다.

유용한 참고자료: 일반적인 사용 정보에 대한 GitHub의 ComfyUI 프로젝트 ComfyUI 및 체크포인트와 자산에 대한 Hugging Face의 Ace Step 1.5 ComfyUI 파일 Comfy-Org/ace_step_1.5_ComfyUI_files.

감사

이 워크플로우는 다음 작업 및 리소스를 구현하고 확장합니다. 우리는 그들의 기여와 유지보수에 대해 Comfy.org에 감사드립니다. 권위 있는 세부 사항은 아래 링크된 원본 문서 및 저장소를 참조하십시오.

자원

Comfy.org/Ace Step 1.5 워크플로우 소스
- 문서 / 릴리스 노트: Ace Step 1.5 is now available in ComfyUI

참고: 참조된 모델, 데이터 세트 및 코드의 사용은 해당 저자 및 유지관리자가 제공한 각각의 라이선스 및 조건에 따릅니다.

Want More ComfyUI Workflows?

ACE-Step 음악 생성 | AI 오디오 생성

획기적인 확산 기술로 스튜디오 품질의 음악을 15배 빠르게 생성합니다.

MMAudio | Video-to-Audio

MMAudio: 고품질 오디오 생성을 위한 고급 비디오-오디오 모델.

Wan 2.1 | 혁신적인 비디오 생성

혁신적인 AI를 통해 일상적인 CPU에서 텍스트 또는 이미지로부터 믿을 수 없는 비디오를 만드세요.

Wan 2.1 LoRA

LoRA 모델로 Wan 2.1 비디오 생성을 강화하여 스타일과 사용자 정의를 개선하세요.

Omost | 이미지 생성 향상

Omost는 LLM 코딩을 사용하여 정밀하고 고품질의 이미지를 생성합니다.

Stable Fast 3D | ComfyUI 3D Pack

Stable Fast 3D와 ComfyUI 3D Pack을 사용하여 멋진 3D 콘텐츠를 만드세요.

Unsampling을 통한 양피지 스타일

Unsampling 방법을 사용하여 동영상을 양피지 스타일 애니메이션으로 변환하세요.

ComfyUI Vid2Vid Dance Transfer

소스 동영상의 움직임과 스타일을 대상 이미지나 객체에 전송합니다.

팔로우하기

지원

리소스

법적 고지

RunComfy

RunComfy는 최고의 ComfyUI 플랫폼으로서 ComfyUI 온라인 환경과 서비스를 제공하며 ComfyUI 워크플로우 멋진 비주얼을 제공합니다. RunComfy는 또한 제공합니다 AI Models, 예술가들이 최신 AI 도구를 활용하여 놀라운 예술을 창조할 수 있도록 지원합니다.

Ace Step 1.5 | 상업용 AI 음악 생성기

Ace Step 1.5 텍스트-음악 워크플로우 for ComfyUI

Comfyui Ace Step 1.5 워크플로우의 주요 모델

Comfyui Ace Step 1.5 워크플로우 사용 방법

Step 1 - 모델 로드

Step 2 - 지속 시간

Step 3 - 프롬프트

KSampler (#3)

VAEDecodeAudio (#18)

SaveAudioMP3 (#104)

Comfyui Ace Step 1.5 워크플로우의 주요 노드

TextEncodeAceStepAudio1.5 (#94)

KSampler (#3)

EmptyAceStep1.5LatentAudio (#98)

ModelSamplingAuraFlow (#78)

SaveAudioMP3 (#104)

ConditioningZeroOut (#47)

선택적 추가 기능

감사

자원

Want More ComfyUI Workflows?

ACE-Step 음악 생성 | AI 오디오 생성

MMAudio | Video-to-Audio

Wan 2.1 | 혁신적인 비디오 생성

Wan 2.1 LoRA

Omost | 이미지 생성 향상

Stable Fast 3D | ComfyUI 3D Pack

Unsampling을 통한 양피지 스타일

ComfyUI Vid2Vid Dance Transfer

`KSampler` (#3)

`VAEDecodeAudio` (#18)

`SaveAudioMP3` (#104)

`TextEncodeAceStepAudio1.5` (#94)

`KSampler` (#3)

`EmptyAceStep1.5LatentAudio` (#98)

`ModelSamplingAuraFlow` (#78)

`SaveAudioMP3` (#104)

`ConditioningZeroOut` (#47)