このワークフローは、Hunyuan Image 2.1を使用してプロンプトを鮮明なネイティブ2048×2048レンダーに変えます。Tencentの拡散トランスフォーマーをデュアルテキストエンコーダーと組み合わせてセマンティックアライメントとテキストレンダリング品質を向上させ、その後、対応する高圧縮VAEを通じて効率的にサンプリングしてデコードします。2Kで生産準備の整ったシーン、キャラクター、そして画像内の明確なテキストが必要で、スピードとコントロールを維持したい場合、このComfyUI Hunyuan Image 2.1ワークフローはあなたのために構築されています。
クリエイター、アートディレクター、およびテクニカルアーティストは、多言語プロンプトを入力し、いくつかのノブを微調整して、一貫してシャープな結果を得ることができます。グラフには、適切なネガティブプロンプト、ネイティブ2Kキャンバス、およびVRAMを制御するためのFP8 UNetが付属しており、Hunyuan Image 2.1の即時の成果を示しています。
グラフはプロンプトからピクセルまでの明確なパスをたどります: テキストを2つのエンコーダーでエンコードし、ネイティブ2Kの潜在キャンバスを準備し、Hunyuan Image 2.1でサンプリングし、対応するVAEを通じてデコードし、出力を保存します。
DualCLIPLoader
(#33)はHunyuan Image 2.1用に構成されたQwen2.5‑VL‑7BとByT5 Smallをロードします。このデュアルセットアップにより、モデルはシーンのセマンティクスを解析しつつ、グリフと多言語テキストに対して堅牢であり続けます。CLIPTextEncode
(#6)にメインの説明を入力します。英語または中国語で書くことができ、カメラヒントと照明を組み合わせ、画像内のテキスト指示を含めることができます。CLIPTextEncode
(#7)にあるすぐに使えるネガティブプロンプトは、一般的なアーティファクトを抑制します。スタイルに合わせて適応させたり、バランスのとれた結果を得るためにそのまま残したりできます。EmptyHunyuanImageLatent
(#29)は2048×2048でキャンバスを単一バッチで初期化します。Hunyuan Image 2.1は2K生成用に設計されているため、最高の品質を得るためにはネイティブ2Kサイズが推奨されます。UNETLoader
(#37)はFP8チェックポイントをロードしてVRAMを削減しつつ忠実度を維持し、その後KSampler
(#3)にフィードしてデノイズします。VAELoader
(#34)がHunyuan Image 2.1 VAEを導入し、VAEDecode
(#8)がモデルの32×圧縮スキームでサンプリングされた潜在画像から最終画像を再構築します。SaveImage
(#9)は出力を選択したディレクトリに書き込みます。シードやプロンプトを通して反復する予定がある場合は、明確なファイル名プレフィックスを設定してください。DualCLIPLoader
(#33)このノードはHunyuan Image 2.1が期待する一対のテキストエンコーダーをロードします。モデルタイプをHunyuanに設定し、Qwen2.5‑VL‑7BとByT5 Smallを選択して、強力なシーン理解とグリフ対応のテキスト処理を組み合わせます。スタイルを反復する場合は、エンコーダーを交換するのではなく、ガイダンスとともにポジティブプロンプトを調整してください。
CLIPTextEncode
(#6 and #7)これらのノードは、ポジティブおよびネガティブプロンプトを条件付けに変換します。ポジティブプロンプトは上部に簡潔に保ち、レンズ、照明、スタイルのヒントを追加します。ネガティブプロンプトを使用して、余分な肢やノイズのあるテキストなどのアーティファクトを抑制します。コンセプトに対して制限が厳しすぎると感じた場合は、削減してください。
EmptyHunyuanImageLatent
(#29)作業解像度とバッチを定義します。デフォルトの2048×2048はHunyuan Image 2.1のネイティブ2K能力に一致します。他のアスペクト比の場合、モデルに適した幅と高さのペアを選択し、正方形から遠く離れる場合はステップを少し増やすことを検討してください。
KSampler
(#3)Hunyuan Image 2.1でデノイズプロセスを推進します。微細なマイクロディテールが必要な場合はステップを増やし、クイックドラフトの場合は減らします。プロンプトの遵守を強化するためにガイダンスを上げますが、過度の飽和や硬直性に注意してください。より自然なバリエーションのために下げます。プロンプトを変更せずに構成を探索するためにシードを切り替えます。
UNETLoader
(#37)Hunyuan Image 2.1 UNetをロードします。含まれているFP8チェックポイントは、2K出力のためにメモリ使用量を控えめに保ちます。十分なVRAMがあり、積極的な設定のための最大の余地を望む場合、公式リリースから同じモデルの高精度バリアントを検討してください。
VAELoader
(#34)とVAEDecode
(#8)これらのノードは、正しくデコードするためにHunyuan Image 2.1リリースに一致する必要があります。モデルの高圧縮VAEは、迅速な2K生成の鍵であり、正しいVAEをペアリングすることで、色のずれやブロック状のテクスチャを避けることができます。ベースモデルを変更する場合は、常にVAEを適切に更新してください。
このワークフローは以下の作品とリソースを実装し、構築しています。我々はHunyuan Image 2.1 Demoの貢献とメンテナンスにおいて@Ai VerseとHunyuanに感謝しています。権威ある詳細については、以下にリンクされた元のドキュメントとリポジトリを参照してください。
注意: 参照されたモデル、データセット、およびコードの使用は、それぞれの著者および管理者によって提供されるライセンスおよび条件に従います。
RunComfyは最高の ComfyUI プラットフォームです。次のものを提供しています: ComfyUIオンライン 環境とサービス、および ComfyUIワークフロー 魅力的なビジュアルが特徴です。 RunComfyはまた提供します AI Playground, アーティストが最新のAIツールを活用して素晴らしいアートを作成できるようにする。