Wan 2.6 Image-to-Image:シームレスなビジュアル編集とスケーラブルなスタイル適応のための指示ベースAI
Flux 2 Klein 9B は、統一された生成と編集のためのプロンプトとオプションの参照画像を受け入れる、コンパクトな段階抽出されたテキストから画像へのジェネレーターです。強力な即時追従性と低遅延を備えた高品質の静止画像を出力するため、迅速なクリエイティブの反復、製品のビジュアル、インタラクティブなデザインのワークフローに最適です。
出力形式: 解像度 (通常 1024×1024) / fps (N/A) / 継続時間 (N/A) / アスペクト比 (スクエアまたはカスタム) / オーディオ (N/A)
| パラメータ | 必須 | タイプ | デフォルト | 範囲/オプション | 説明 |
|---|---|---|---|---|---|
| マルチパート* | はい (*) | オブジェクト | — | — | 最上位のマルチパート ペイロード コンテナー。 |
| ボディ | いいえ | オブジェクト | — | — | プロンプトや生成設定などのフィールドを保持するフォーム データ本体。 |
|コンテンツタイプ |いいえ |文字列 |マルチパート/フォームデータ | — |マルチパートリクエストのコンテンツタイプ。
共通のマルチパート本文フィールド (multipart.body 内):
| フィールド | 必須 | タイプ | デフォルト | 範囲/オプション | 説明 |
|---|---|---|---|---|---|
| プロンプト* | はい (*) | 文字列 | — | — | 希望する画像を説明するテキスト プロンプト。 |
| ステップ | いいえ | 整数 | 25 | 通常は 4 ~ 50 | 推論ステップの数。 Flux 2 Klein 9B は、非常に低いステップでうまく機能するように蒸留されています。 |
| 幅 | いいえ | 整数 | 1024 | 通常 512 ~ 1536 | ピクセル単位の出力幅。 |
|身長 |いいえ |整数 | 1024 |通常 512 ~ 1536 |出力の高さ (ピクセル単位)。
| 請求単位 | 価格 |
|---|---|
| 生成されたイメージごと | 画像あたり 0.003 ドル。 |
1) モデルを選択します。RunComfy で、Models ディレクトリから Flux 2 Klein 9B Text to Image を選択します。
2) プロンプトを作成します: 主題、スタイル、照明、カメラ、構成について説明します。 Flux 2 Klein 9B で最良の結果を得るには、簡潔かつ具体的にしてください。
3) オプションの参照: 編集またはスタイルの転送をガイドするために 1 つ以上の参照画像をアップロードします。可能な場合はアスペクト比を一致させます。
4) 解像度の設定: 速度を上げるには 1024×1024 から始めます。ターゲットのアスペクト比に合わせて幅/高さを調整します。
5) ステップを選択します。高速に反復するには 4 ~ 8 ステップから始めます。追加の調整が必要な場合にのみ、最大 25 ステップまで増やします。
6) 実行とレビュー: 詳細を生成、検査し、プロンプトまたは参照を調整します。 Flux 2 Klein 9B は、増分プロンプト編集によく反応します。
7) 結果を再現する: RunComfy セッションでシード コントロールが使用できる場合は、バリエーション間で一貫して反復するためにシードをロックします。
8) API の使用法: このページの API パネルを使用して、curl スニペットをコピーします。プロンプト、ステップ、幅、高さをマルチパート フォーム フィールドとして提供します。セルフホスティングは必要ありません。
Wan 2.6 Image-to-Image:シームレスなビジュアル編集とスケーラブルなスタイル適応のための指示ベースAI
10秒で4MP生成、リアル質感と柔軟な表現力が魅力のAI画像生成ツール
高精度・高速・豊かな表現力でプロの創造性を最大化
テキスト指示を即座に反映し、精密な画像生成と編集を実現する高性能AIツール。
GPT-4o Imageで写真やイラストをもとに新しい画像を自在に生成・編集。
直感的な操作で画像を自在に変換。FLUX Kontextがデザイン制作を効率化。
Flux 2 Klein 9B のテキストから画像への変換は現在、最大アスペクト比 16:9 で最大約 2K の出力解像度 (約 2 ~ 4 メガピクセル) をサポートしています。このシステムは、超高解像度の出力ではなく、低遅延推論用に最適化されています。安定した結果を得るには、プロンプトの長さは通常 512 トークンを超えてはなりません。
Flux 2 Klein 9B のテキストから画像への変換は、RunComfy Playground または API を通じて使用する場合、マルチリファレンス編集ワークフローを活用して、最大 4 つの参照画像をサポートします。参照を追加すると、GPU リソースに応じてレイテンシーが増加したり、忠実度が低下したりする可能性があります。
RunComfy Playground でのテストが成功したら、RunComfy API を使用して Flux 2 Klein 9B のテキストから画像へのパイプラインを運用環境に移行できます。ワークスペース ダッシュボードから API キーを取得し、プロンプトと参照パラメーターをミラーリングし、生成リクエストごとに usd トークンを消費するだけです。エンドポイント スキーマとレート制限については、RunComfy の開発者ドキュメントを参照してください。
Flux 2 Klein 9B のテキストから画像への変換は、強力な即時遵守を維持しながら、1 秒以内に高品質の結果を達成することに優れています。以前の Flux バージョンと比較すると、わずか 4 つの推論ステップで実行され、消費する VRAM が少なくなりますが、より鮮明なディテールとよりバランスの取れたトーンを実現します。
Flux 2 Klein 9B のテキストから画像への変換では、Seedream 4.5 や Nano Banana Pro (通常は約 2K に制限される) よりも最大解像度が低くなりますが、レイテンシと応答性ではそれらを大幅に上回ります。その速度により、ほぼ即時のフィードバックが重要となる、インタラクティブなワークフロー、プリビジュアライゼーション、ライブ アートの生成に最適です。
はい。 Flux 2 Klein 9B テキストから画像への変換では、8B Qwen3 テキスト エンベッダーが採用されており、レンダリングされたテキストと生成された画像内の細部の忠実度が大幅に向上します。この機能強化により、以前のモデルで見られた一般的なタイポグラフィの歪みが軽減されます。
Flux 2 Klein 9B のテキストから画像への変換は、超低レイテンシーを実現するように設計されており、高度な GPU では 1 秒未満の生成が可能です。段階的に抽出されたアーキテクチャ (4 段階の推論) により遅延が最小限に抑えられ、ライブ プレビュー、対話型セッション、および迅速な反復設計のユースケースに最適です。
RunComfyは最高の ComfyUI プラットフォームです。次のものを提供しています: ComfyUIオンライン 環境とサービス、および ComfyUIワークフロー 魅力的なビジュアルが特徴です。 RunComfyはまた提供します AI Models, アーティストが最新のAIツールを活用して素晴らしいアートを作成できるようにする。





