이미지를 영상에 자연스럽게 합성해 인물이나 오브젝트를 추가할 수 있는 스마트 영상 편집 기능
Kling V3.0 Pro는 RunComfy의 Kling V3.0 다중 모드 AI 비디오 생성 모델의 프리미엄 변형입니다. V3.0 제품군에서 최고의 시각적 충실도와 모션 사실성을 갖춘 텍스트 프롬프트를 영화 같은 클립으로 변환하고, 프리미엄 단편 스토리텔링과 브랜드 콘텐츠를 위한 멀티샷 시퀀싱, 동기화된 오디오, 전문 카메라 제어를 지원합니다.
출력 형식: 3~15초 / 16:9, 9:16, 1:1 / 동기화된 오디오 옵션
| 매개변수 | 필수 | 유형 | 기본값 | 범위 / 옵션 | 설명 |
|---|---|---|---|---|---|
| 프롬프트* | 예(*) | 문자열 | — | — | 원하는 장면, 모션, 카메라 스타일, 분위기에 대한 텍스트 설명입니다. |
| 부정적인 프롬프트 | 아니요 | 문자열 | — | — | 영상에서 제외할 요소입니다. |
| 기간 | 아니요 | 숫자(초) | 5 | 3~15 | 비디오 길이(초)입니다. |
| 종횡비 | 아니요 | 열거형 | 16:9 | 16:9, 9:16, 1:1 | 비디오 종횡비. |
| cfg_scale | 아니요 | 번호 | 0.5 | — | 신속한 지도력. |
| 소리 | 아니요 | 부울 | 장애인 | 활성화/비활성화 | 비디오와 함께 동기화된 사운드를 생성합니다. |
| 다중 프롬프트 | 아니요 | 배열/문자열 | — | — | 복잡한 장면 구성에 대한 추가 프롬프트입니다. |
| 청구 단위 | 오디오 | 평가 |
|---|---|---|
| 생성된 초당 | 장애인 | 초당 $0.112 |
| 생성된 초당 | 활성화됨 | 초당 $0.168 |
이미지를 영상에 자연스럽게 합성해 인물이나 오브젝트를 추가할 수 있는 스마트 영상 편집 기능
카메라와 오디오 제어를 통해 스틸 이미지를 영화 같은 모션 클립으로 바꿔보세요.
한 장의 사진으로 생생한 대화형 인물 영상을 만드는 창의적 툴
이미지 한 장으로 역동적인 AI 영상을 만들어내는 혁신적인 도구
텍스트를 생동감 있는 10초 영상으로 바꾸는 AI 텍스트-투-비디오 생성기
1~6장의 이미지를 하나의 장면으로 구성해 자연스러운 영상으로 변환합니다.
Kling V3.0 Pro는 Kling V3.0 제품군의 프리미엄 버전입니다. 표준 변형에 비해 더 높은 시각적 충실도, 더 강력한 모션 사실성, 향상된 소음 안정성을 제공하는 동시에 동일한 멀티샷 시네마틱 시퀀싱(클립당 최대 6개 샷), 동기화된 다국어 오디오 및 일관된 문자 렌더링을 공유합니다. 통합된 다중 모드 아키텍처는 텍스트, 이미지 및 비디오 입력 처리를 하나의 모델로 병합하여 보다 부드러운 전환과 강력한 오디오-비디오 동기화를 제공합니다.
Kling V3.0 Pro는 주로 지속 시간(최대 15초), 시각적 충실도, 다중 촬영 텍스트-비디오 시퀀스 중 시간적 일관성 측면에서 Seedance 1.0 Pro 및 Wan 2.5와 같은 모델을 능가합니다. 이 모델은 사실적인 동작, 목소리에 맞는 연설, 장면 전반에 걸쳐 일관된 배우 얼굴을 우선시하는 반면, 경쟁업체는 양식화된 렌더링에서는 더 뛰어나지만 사실적인 인간 역학에는 어려움을 겪는 경우가 많습니다.
Kling V3.0 Pro의 경우 텍스트-비디오 출력은 세대당 약 15초로 제한되며 최대 6개의 연속 촬영이 가능합니다. 종횡비는 일반적으로 16:9, 9:16 및 1:1을 포함합니다. 프롬프트는 일반적으로 최대 1,200개의 토큰을 지원하며 참조 입력은 노드 구성에 따라 세대당 적은 수로 제한됩니다.
예. Kling V3.0 Pro를 사용하면 고급 멀티샷 기능을 사용하여 최대 6개의 샷을 하나의 일관된 텍스트-비디오 클립으로 연결할 수 있습니다. 개발자는 프롬프트에서 직접 또는 RunComfy Playground의 multi_prompt를 통해 샷 유형, 카메라 각도 및 전환을 정의할 수 있습니다. 이 시스템은 이전 릴리스에서는 안정적으로 달성할 수 없었던 장면 전반에 걸쳐 일관된 조명과 캐릭터 연속성을 유지합니다.
RunComfy Playground에서 Kling V3.0 Pro 텍스트-비디오 워크플로우를 검증한 후에는 RunComfy API를 통해 프로덕션으로 이동할 수 있습니다. API는 샷 정의, 다중 프롬프트 세그먼트 및 구성 옵션을 포함한 모든 플레이그라운드 설정을 미러링하지만 인증된 REST 엔드포인트를 통해 작동합니다. API 키를 생성하고, 프로덕션 USD 크레딧을 할당하고, RunComfy의 작업 대기열 구조를 통해 비동기 비디오 검색을 처리해야 합니다.
예. Kling V3.0 Pro에는 영어, 중국어, 일본어, 한국어 및 스페인어에 대한 통합 오디오 합성 및 동적 립싱크 기능이 포함되어 있습니다. 대화 설명이 포함된 텍스트-비디오 클립을 생성할 때 생성된 음성과 입 동작을 자동으로 동기화하여 동일한 생성 패스 내에서 자연스러운 캐릭터 성능을 제공합니다. 별도의 더빙 단계가 필요하지 않습니다.
Kling V3.0 Pro를 사용하면 사용자는 전문적인 카메라 의미(패닝, 돌리, 틸트, POV)와 모션 설명을 텍스트 프롬프트에서 직접 지정할 수 있습니다. 이를 통해 기술 아티스트는 이전 Kling 모델이나 유사한 텍스트-비디오 시스템보다 더 영화적인 제어 기능을 제공하여 사실적인 시차 깊이, 렌즈 효과 및 구성 균형을 생성할 수 있습니다.
Kling V3.0 Pro는 오디오 없이 초당 0.112달러, 오디오 포함하여 초당 0.168달러로 청구되는 반면, Standard 모델은 오디오 없이 초당 0.084달러, 오디오 포함하여 초당 0.126달러로 청구됩니다. Pro는 더 높은 시각적 충실도와 모션 사실성을 제공하는 반면, Standard는 초안 및 대용량 반복을 위한 더 빠르고 저렴한 옵션입니다. 둘 다 동일한 다중 모드 아키텍처와 매개변수 제어 세트를 공유합니다.
Kling V3.0 Pro 텍스트-비디오 출력의 상업적 사용은 Kuaishou Technology가 게시한 라이센스 조건과 RunComfy의 서비스 계약에 따라 다릅니다. 일반적으로 생성된 비디오는 마케팅이나 창의적인 프로젝트에 사용할 수 있지만 배포하기 전에 공식 라이센스 페이지에서 상업적 사용 조항이나 저작자 표시 요구 사항을 확인해야 합니다.
RunComfy Playground를 통한 표준 사용자의 경우 모든 렌더링이 클라우드 측에서 발생하므로 로컬 GPU가 필요하지 않습니다. 그러나 API를 통해 Kling V3.0 Pro 텍스트-비디오 생성을 통합하는 경우 추가 모델 및 오디오 동기화 처리로 인해 멀티샷 출력에 대한 대기 시간이 길어질 수 있습니다. 효율적인 프롬프트 설계와 적당한 설정으로 생성 시간과 비용을 모두 줄일 수 있습니다.
RunComfy는 최고의 ComfyUI 플랫폼으로서 ComfyUI 온라인 환경과 서비스를 제공하며 ComfyUI 워크플로우 멋진 비주얼을 제공합니다. RunComfy는 또한 제공합니다 AI Models, 예술가들이 최신 AI 도구를 활용하여 놀라운 예술을 창조할 수 있도록 지원합니다.





