ComfyUI  >  ワークフロー  >  Step1X-Edit | AI画像編集ツール

Step1X-Edit | AI画像編集ツール

Step1X-Editは、参照画像とユーザー指示を処理して正確に編集された出力を作成する画像編集モデルです。この統一フレームワークは、Multimodal Large Language Modelsの強力なセマンティック推論を拡散アーキテクチャと組み合わせ、被写体の追加/削除、スタイル転送、テキスト修正など、11種類の編集操作を実行できます。単に画像を提供し、希望する変更を説明するだけで、Step1X-Editは主要なプロプライエタリモデルに匹敵するスタジオ品質の結果を提供します。

ComfyUI Step1X-Edit ワークフロー

Step1X-Edit ComfyUI Workflow | Advanced AI Image Editing
このワークフローを実行しますか?
  • 完全に動作するワークフロー
  • 欠落したノードやモデルはありません
  • 手動セットアップは不要
  • 魅力的なビジュアルを特徴としています

ComfyUI Step1X-Edit 例

ComfyUI Step1X-Edit 説明

1. Step1X-Editとは?

Step1X-Editは、StepFun AIによって開発された高度な画像編集モデルで、GPT-4oやGemini2 Flashのようなクローズドソースモデルに匹敵するパフォーマンスを提供することを目指しています。Step1X-Editフレームワークは、Multimedia Large Language Models (MLLM)のセマンティック推論能力とDiffusion in Transformer (DiT)アーキテクチャを組み合わせて、高品質な指示ベースの画像編集を実現します。

Step1X-Editは自然言語指示を理解し、画像の忠実性を保ちながら正確な編集を適用することに優れています。Step1X-Editモデルは、11の異なる編集カテゴリをカバーする100万以上の高品質な指示画像ペアでトレーニングされており、さまざまな編集タスクに対して非常に多才です。

2. ComfyUI Step1X-Editの利点:

  • 優れた指示理解能力: Step1X-EditはMLLM技術を活用して、テキストと視覚コンテンツの微妙な理解を伴う複雑な編集要求を理解します。
  • 包括的な編集機能: Step1X-Editは、被写体の追加/削除、背景の変更、色の変更、素材の変更、動きの変更など、11の異なる編集カテゴリを処理します。
  • 高忠実度の結果: Step1X-Editは、参照画像の再構築と編集プロンプトの遵守のバランスを保ち、画像品質を維持します。
  • 簡略化されたワークフロー: 編集プロセス中にマスクが必要なく、Step1X-Editのユーザーエクスペリエンスを簡略化します。
  • オープンソースの代替: Step1X-Editはプロプライエタリモデルに匹敵する結果を提供しながら、完全にオープンソースです。

3. クイックスタートガイド

3.1 システム要件

Step1X-Editはリソースを多く消費するモデルで、次の条件で最適に動作します:

  • VRAM: 最適なパフォーマンスには1024×1024解像度で80GBが推奨されます
  • 注意: RunComfyのクラウドGPUサービスは、Step1X-Editに必要なすべての計算能力を提供し、インストールは不要です。利用可能なオプションから十分なVRAMを備えたマシンを選択するだけです。

3.2 ワークフローオプション

Step1X-Editは2つの主要なワークフロー構成を提供します:

通常ワークフロー(非実在人物バージョン)
  • 最適な用途: Step1X-Editでオブジェクト、シーン、および非人間の被写体の一般的な編集
  • 特性:
    • シンプルな3ステッププロセス:画像をロードする → Step1X-Editで編集する → 結果を保存する
    • テキスト修正、被写体の追加/削除、スタイル転送、背景変更などに優れたパフォーマンス
    • 追加の顔処理なしで直接編集
    Step1X-Edit
実在人物ワークフロー(拡張バージョン)
  • 最適な用途: 顔のアイデンティティ保持が重要な人間の顔を含む画像の編集
  • 特性:
    • Step1X-Editと追加の顔の一貫性保持を組み合わせる
    • アイデンティティ保持を強化するためにFace Bounding Boxと簡単な人物説明を使用
    • 標準のStep1X-Editワークフローよりもアイデンティティ特徴をよく保持
    Step1X-Edit

3.3 パラメータリファレンス

メインStep1X-Editノードパラメータ:

  • cfg: ガイダンススケール、通常は約6.0(高いほどプロンプトへの遵守が強くなる)
  • size_level: 出力解像度を制御(512、768、または1024)
  • num_steps: 拡散ステップ数(通常は20-31)
  • mllm_model: ビジョンラングエッジモデル(デフォルト:Qwen2.5-VL-7B-Instruct)

実在人物ワークフローの追加パラメータ:

  • Face Bounding Box Node(FaceAnalysisから):
    • Index: 顔検出制御
      • -1: すべての顔を検出(デフォルト)
      • 0: 最大の顔のみを選択
      • 1: 2番目に大きい顔を選択
      • 複数の顔を扱う場合はワークフローを注意深く確認
    • padding: 顔の周りの追加スペース(デフォルト:0)
    • padding_percent: パーセンテージベースのパディング(デフォルト:0.30)
Step1X-Edit

3.4 編集タスクカテゴリ

Step1X-Editは、次の11の編集カテゴリに特化して最適化されています:

  1. 被写体の追加: Step1X-Editを使用してシーンに新しいオブジェクトや人物を追加
  2. 被写体の削除: Step1X-Editを使用して画像から不要な要素を削除
  3. 被写体の置換: Step1X-Editを使用して1つのオブジェクトを別のオブジェクトと交換
  4. 背景変更: 前景要素を保持しながら背景を変更または置換
  5. 色の変更: Step1X-Editを使用して画像内の特定の色を変更
  6. 素材の変更: オブジェクトの素材特性を変換(例:ガラスを金属に)
  7. 動きの変更: Step1X-Editを使用して被写体の位置やポーズを変更
  8. ポートレートの美化: 自然な改善でポートレートを強化または変更
  9. スタイル転送: Step1X-Editを使用して画像に芸術的なスタイルを適用
  10. テキスト修正: Step1X-Editを使用して画像内のテキストを編集または置換
  11. トーン変換: 画像全体のトーン、照明、または雰囲気を調整

3.5 ステップバイステップ使用ガイド

通常ワークフロー(非実在人物バージョン)
  1. 画像をアップロード Load Imageノードを使用
  2. 編集指示を入力 Step1X-Editノードに
  3. 必要に応じてパラメータを調整
    • cfg: Step1X-Editのデフォルトは6.0
    • size_level: テストには512、最終結果には1024
    • num_steps: 20-31(ステップが多いほど品質は向上するが遅くなる)
  4. 実行をクリック Step1X-Editで編集を処理
実在人物ワークフロー(顔編集)
  1. 画像をアップロード Load Imageノードを使用
  2. 簡単な人物説明を入力 CR Prompt Textノードに
    • 「若い女性」や「男性」のような基本的な用語を使用
    • Step1X-Editモデルが画像内の人物を理解するのに役立つ
  3. 編集指示を入力 Step1X-Editノードに
    • 変更したい人物について具体的に述べる
  4. 必要に応じてパラメータを調整
    • 通常のワークフローと同様、顔検出設定も必要に応じて
  5. 実行をクリック Step1X-Editで編集を処理
  6. 結果を表示およびダウンロード
Step1X-Edit Step1X-Edit

3.6 最良の結果を得るためのヒント

  • 明確な指示: Step1X-Editプロンプトは具体的で簡潔に
  • サイズの考慮: 大きなサイズ(1024)はより高品質だが処理に時間がかかる
  • 顔の処理: Step1X-Editで人間の顔を編集するときは実在人物ワークフローを使用
  • 複数の編集: 複雑な編集は別々のステップに分けて検討
  • ワークフローの選択: 被写体に基づいて適切なStep1X-Editワークフローを選ぶ
  • マシンの選択: 最適なStep1X-Editパフォーマンスには2X Large (80GB VRAM)または2XL Plus (80GB VRAM)を選ぶ

4. 謝辞

この実装は、StepFun AIチームが開発したStep1X-Editモデルに基づいています()。ComfyUIのStep1X-Edit統合はによって作成され、この強力な技術をComfyUI環境で利用可能にしました。

RunComfyは、Step1X-Edit技術を使いやすいクラウドワークフローに統合し、ローカルインストールや高性能ハードウェアを必要とせずに高度なAI画像編集を可能にしました。

このツールをコミュニティに提供してくれたオリジナルの著者とComfyUI統合開発者に心から感謝します。

より多くのComfyUIワークフローが必要ですか?

RunComfy
著作権 2025 RunComfy. All Rights Reserved.

RunComfyは最高の ComfyUI プラットフォームです。次のものを提供しています: ComfyUIオンライン 環境とサービス、および ComfyUIワークフロー 魅力的なビジュアルが特徴です。 RunComfyはまた提供します AI Playground, アーティストが最新のAIツールを活用して素晴らしいアートを作成できるようにする。