写真を自然な動きと音声で再現し、魅力的なトーキング動画を簡単生成
Kling V3.0 Pro は、RunComfy の Kling V3.0 マルチモーダル AI ビデオ生成モデルのプレミアム バージョンです。テキスト プロンプトを、V3.0 ファミリで最高の視覚的忠実度およびモーション リアリズムを備えた映画のようなクリップに変換し、マルチショット シーケンス、同期オーディオ、プロ仕様のカメラ制御をサポートして、プレミアムな短編ストーリーテリングやブランド コンテンツを実現します。
出力フォーマット: 3 ~ 15 秒 / 16:9、9:16、1:1 / オプションの同期音声
| パラメータ | 必須 | タイプ | デフォルト | 範囲/オプション | 説明 |
|---|---|---|---|---|---|
| プロンプト* | はい (*) | 文字列 | — | — | 希望のシーン、モーション、カメラ スタイル、雰囲気をテキストで説明します。 |
| ネガティブプロンプト | いいえ | 文字列 | — | — | 動画から除外する要素。 |
| 期間 | いいえ | 数値 (秒) | 5 | 3–15 | ビデオの長さ (秒)。 |
| アスペクト比 | いいえ | 列挙型 | 16:9 | 16:9、9:16、1:1 | ビデオのアスペクト比。 |
| cfg_スケール | いいえ | 番号 | 0.5 | — | 即効性のある指導力。 |
| 音 | いいえ | ブール値 | 無効 | 有効/無効 | ビデオと同期したサウンドを生成します。 |
| マルチプロンプト | いいえ | 配列/文字列 | — | — | 複雑なシーン構成のための追加のプロンプト。 |
| 請求単位 | オーディオ | レート |
|---|---|---|
| 生成された秒あたり | 無効 | 1 秒あたり 0.112 ドル |
| 生成された秒あたり | 有効 | 1 秒あたり 0.168 ドル |
写真を自然な動きと音声で再現し、魅力的なトーキング動画を簡単生成
Hailuo 2.3で画像を高精度に動画化。リアルさと創造性を両立した映像制作を実現。
テキストから高精細な画像を瞬時に作成できるWan 2.2 Flash。創造力を形にする最先端ツール。
Veo 3.1が画像をリアルな動画へ変換。高速処理と高品質な表現で創作を加速。
AIが画像を滑らかに動画化。Wan 2.2で創造性あふれる映像制作をスマートに実現。
Dreamina 3.0でテキストから自然な映像を瞬時に生成。創造的なストーリーテリングをサポート。
Kling V3.0 Pro は、Kling V3.0 ファミリーのプレミアム層です。標準バージョンと比較して、より高い視覚的忠実度、より強力なモーション リアリズム、強化されたノイズ安定性を実現しながら、同じマルチショット映画シーケンス (クリップあたり最大 6 ショット)、同期された多言語オーディオ、一貫したキャラクター レンダリングを共有します。統合されたマルチモーダル アーキテクチャにより、テキスト、画像、ビデオの入力処理が 1 つのモデルに統合され、よりスムーズな移行と堅牢なオーディオとビデオの同期が実現します。
Kling V3.0 Pro は、主に持続時間 (最大 15 秒)、視覚的な忠実度、マルチショットのテキストからビデオへのシーケンス中の時間的一貫性の点で、Seedance 1.0 Pro や Wan 2.5 などのモデルを上回っています。このモデルは、リアルな動き、声と一致するスピーチ、シーン全体での俳優の顔の一貫性を優先しますが、競合他社は様式化されたレンダリングでは優れているものの、リアルな人間のダイナミクスに苦戦していることがよくあります。
Kling V3.0 Pro の場合、テキストからビデオへの出力は 1 世代あたり約 15 秒に制限されており、最大 6 つの連続ショットが可能です。通常、アスペクト比には 16:9、9:16、1:1 などがあります。通常、プロンプトは最大 1,200 個のトークンをサポートし、参照入力はノード構成に応じて世代ごとに少数に制限されます。
はい。 Kling V3.0 Pro では、高度なマルチショット機能を使用して、最大 6 つのショットを 1 つの一貫したテキストからビデオへのクリップにチェーンできます。開発者は、プロンプト内で直接、または RunComfy Playground の multi_prompt 経由でショット タイプ、カメラ アングル、トランジションを定義できます。このシステムは、ショット間で一貫したライティングとキャラクターの連続性を維持しますが、これは以前のリリースでは確実に達成できませんでした。
RunComfy Playground で Kling V3.0 Pro のテキストからビデオへのワークフローを検証したら、RunComfy API を介して運用環境に移行できます。 API は、ショット定義、マルチプロンプト セグメント、構成オプションを含むすべてのプレイグラウンド設定をミラーリングしますが、認証された REST エンドポイントを介して動作します。 API キーを生成し、プロダクション USD クレジットを割り当て、RunComfy のジョブ キュー構造を通じて非同期ビデオ取得を処理する必要があります。
はい。 Kling V3.0 Pro には、英語、中国語、日本語、韓国語、スペイン語の統合オーディオ合成機能とダイナミック リップシンク機能が含まれています。会話の説明を含むテキストからビデオへのクリップを生成すると、生成された音声と口の動きが自動的に同期され、同じ生成パス内で自然なキャラクターのパフォーマンスが実現されます。別のダビング手順は必要ありません。
Kling V3.0 Pro を使用すると、ユーザーはプロのカメラ セマンティクス (パン、ドリー、チルト、POV) とモーションの説明をテキスト プロンプトで直接指定できます。これにより、テクニカル アーティストは、以前の Kling モデルや同等のテキストからビデオへのシステムよりも映画のような制御が可能になり、現実的な視差深度、レンズ効果、構図バランスを生み出すことができます。
Kling V3.0 Pro の料金は、音声なしで 1 秒あたり 0.112 ドル、音声ありで 1 秒あたり 0.168 ドルです。一方、Standard バージョンの料金は、音声なしで 1 秒あたり 0.084 ドル、音声ありで 1 秒あたり 0.126 ドルです。 Pro はより高い視覚的忠実度とモーションのリアリズムを提供し、Standard はドラフトや大量のイテレーション向けの高速かつ低コストのオプションです。どちらも同じマルチモーダル アーキテクチャとパラメータ制御セットを共有します。
Kling V3.0 Pro のテキストからビデオへの出力の商用利用は、Kuaishou Technology が公開しているライセンス条項と RunComfy のサービス契約に依存します。一般に、生成されたビデオはマーケティングまたはクリエイティブ プロジェクトに使用できますが、展開する前に公式ライセンス ページで商用利用条項や帰属要件を確認する必要があります。
RunComfy Playground を使用する標準ユーザーの場合、すべてのレンダリングはクラウド側で行われるため、ローカル GPU は必要ありません。ただし、Kling V3.0 Pro のテキストからビデオへの生成を API 経由で統合する場合は、追加のモデルとオーディオ同期処理により、マルチショット出力の遅延が長くなることが予想されます。効率的なプロンプト設計と適度な設定により、生成時間とコストの両方が削減される可能性があります。
RunComfyは最高の ComfyUI プラットフォームです。次のものを提供しています: ComfyUIオンライン 環境とサービス、および ComfyUIワークフロー 魅力的なビジュアルが特徴です。 RunComfyはまた提供します AI Models, アーティストが最新のAIツールを活用して素晴らしいアートを作成できるようにする。





