logo
RunComfy
ComfyUIPlaygroundPricing
discord logo
ComfyUI>ワークフロー>Hunyuan Video | テキストからビデオへ

Hunyuan Video | テキストからビデオへ

Workflow Name: RunComfy/Hunyuan-Video
Workflow ID: 0000...1176
Hunyuan Videoは、Tencentによって開発されたオープンソースのビデオ基盤モデルです。これは、先端技術であるデータキュレーション、画像とビデオの共同トレーニング、最適化されたインフラストラクチャを活用して、高品質で大規模なビデオ生成を可能にします。

Hunyuan Videoは、Tencentという先進的な技術企業によって開発された、トップクラスのクローズドソースモデルに匹敵する、またはそれを超える性能を提供する革新的なオープンソースビデオ基盤モデルです。Hunyuan Videoは、データキュレーション、画像とビデオの共同モデルトレーニング、大規模モデルのトレーニングと推論のための効率的なインフラストラクチャなど、最新技術をモデル学習に取り入れています。Hunyuan Videoは、13億を超えるパラメータを持つ最大のオープンソースビデオ生成モデルを誇ります。

Hunyuan Videoの主要な機能には以下が含まれます

  • Hunyuan Videoは、画像とビデオの両方を生成するための統一されたアーキテクチャを提供します。それは、「デュアルストリームからシングルストリーム」という特別なTransformerモデルデザインを使用しています。これは、モデルが最初にビデオとテキスト情報を別々に処理し、それから最終的な出力を作成するためにそれらを組み合わせることを意味します。これにより、モデルはビジュアルとテキストの説明の関係をよりよく理解できます。
  • Hunyuan Videoのテキストエンコーダーは、Multimodal Large Language Model (MLLM)に基づいています。他の人気のあるテキストエンコーダー、例えばCLIPやT5-XXLと比較して、MLLMはテキストと画像の整合性に優れています。また、コンテンツに関するより詳細な説明と推論を提供できます。これにより、Hunyuan Videoは入力テキストにより正確に一致するビデオを生成できます。
  • 高解像度および高フレームレートのビデオを効率的に処理するために、Hunyuan VideoはCausalConv3Dを備えた3D Variational Autoencoder (VAE)を使用します。このコンポーネントは、ビデオと画像を潜在空間と呼ばれる小さな表現に圧縮します。この圧縮空間で作業することで、Hunyuan Videoは、あまり多くの計算リソースを使用せずに、元の解像度とフレームレートでビデオをトレーニングおよび生成できます。
  • Hunyuan Videoには、ユーザーの入力テキストをモデルの好みにより適合させるプロンプトリライトモデルが含まれています。利用可能なモードは2つあり、NormalとMasterです。Normalモードはユーザーの指示の理解を改善することに焦点を当て、Masterモードはより高い視覚品質のビデオを作成することに重点を置きます。ただし、Masterモードは時折、テキストの特定の詳細よりもビデオをより良く見せることを優先する場合があります。

ComfyUIでHunyuan Videoを使用する

このComfyUI-HunyuanVideoWrapperノードと関連するワークフローは、Kijaiによって開発されました。この革新的な作品に対し、Kijaiにすべての功績を捧げます。RunComfyプラットフォーム上では、彼の貢献をコミュニティに紹介しています。

  1. テキストプロンプトを入力する: HunyuanVideoTextEncodeノードの"prompt"フィールドに、希望するテキストプロンプトを入力します。こちらに参考用のプロンプト例があります。
  2. HunyuanVideoSamplerノードで出力ビデオ設定を構成します:
    • "width"および"height"を希望の解像度に設定します
    • "num_frames"を希望するビデオ長にフレーム単位で設定します
    • "steps"はノイズ除去/サンプリングステップの数を制御します(デフォルト: 30)
    • "embedded_guidance_scale"はプロンプトガイダンスの強さを決定します(デフォルト: 6.0)
    • "flow_shift"はビデオの長さに影響します(値が大きいほど短いビデオになります、デフォルト: 9.0)

Want More ComfyUI Workflows?

CogVideoX Tora | 画像から動画へのモデル

CogVideoXのための主題軌道ビデオデモ

LTX Video | 画像+テキストからビデオ

画像+テキストプロンプトからビデオを生成します。

OmniGen | Image-To-Image

OmniGen: 参照画像とプロンプトに基づいて画像を修正

Mochi Edit UnSampling | Video-to-Video

Mochi Edit: テキストベースのプロンプトとアップサンプリングを使用してビデオを修正。

EchoMimic | オーディオ駆動のポートレートアニメーション

提供されたオーディオと同期したリアルなトーキングヘッドとボディジェスチャーを生成します。

Blender + ComfyUI | AIレンダリング3Dアニメーション

Blenderを使用して3Dシーンを設定し、画像シーケンスを生成し、その後ComfyUIを使用してAIレンダリングを行います。

SVD + FreeU | 画像からビデオへ

FreeUとSVDを組み合わせることで、追加コストなしで画像からビデオへの変換品質を改善します。

SUPIR + Foolhardy Remacri | 8K画像/動画アップスケーラー

SUPIR + Foolhardy Remacri | 8K画像/動画アップスケーラー

SUPIRと4x Foolhardy Remacriモデルを使用して画像を8Kにアップスケールします。

フォローする
  • LinkedIn
  • Facebook
  • Instagram
  • Twitter
サポート
  • Discord
  • メール
  • システムステータス
  • アフィリエイト
リソース
  • 無料のComfyUIオンライン
  • ComfyUIガイド
  • RunComfy API
  • ComfyUIチュートリアル
  • ComfyUIノード
  • 詳細を見る
法的情報
  • 利用規約
  • プライバシーポリシー
  • Cookieポリシー
RunComfy
著作権 2025 RunComfy. All Rights Reserved.

RunComfyは最高の ComfyUI プラットフォームです。次のものを提供しています: ComfyUIオンライン 環境とサービス、および ComfyUIワークフロー 魅力的なビジュアルが特徴です。 RunComfyはまた提供します AI Playground, アーティストが最新のAIツールを活用して素晴らしいアートを作成できるようにする。