Consistent Character Creator 3.8: 1枚の写真からハイパーリアリスティックでアイデンティティの一貫性のあるAIキャラクター
Consistent Character Creator 3.8は、単一の参照画像を完全でアイデンティティの一貫性のあるキャラクターパックに変えるモジュラーComfyUIワークフローです。速度と再現性に焦点を当て、ビューやシーン全体で被写体のプロポーション、衣服、顔の特徴を保持します。
Qwen‑Image‑Edit‑2511を中心に構築されており、このバージョンはより豊かなターンアラウンド、複数のシーンバリアント、クローズアップ、試着およびポーズパス、データセットエクスポートユーティリティを追加します。その結果、キャラクターアーティスト、ゲーム開発者、および高速で一貫性のある出力を必要とするクリエーターのためのワンキャンバスシステムが得られます。
Comfyui Consistent Character Creator 3.8 ワークフローの主要モデル
- Qwen-Image-Edit-2511 (GGUF) UNet。参照写真からアイデンティティとスタイルを定着させる画像ガイドジェネレーター。"Qwen Image Edit"ノードを介して使用され、ComfyUIに最適化されたGGUFウェイトを使用。unsloth/Qwen-Image-Edit-2511-GGUF
- Qwen ImageエンコーダーとVAE。Qwen image-edit UNetとペアを組み、参照画像を正確に解釈し、高品質のピクセルをデコードするテキストエンコーダーとVAE。Comfy-Org/Qwen-Image_ComfyUI
- Qwen-Image-Edit-2511-Lightning LoRA。アイデンティティを保持しながらQwen画像編集を高速化し安定化する軽量LoRA。lightx2v/Qwen-Image-Edit-2511-Lightning
- FLUX.1‑devチェックポイント。スタイル認識のアップスケーリングと洗練のためにデータセットパイプラインで使用されます。Comfy-Org/flux1-dev
- USO FLUXプロジェクターモデルパッチ。FLUXにCLIP‑Visionスタイルの特徴を組み込み、スタイルの一貫性のある洗練とデータセット準備を実現。Comfy-Org/USO_1.0_Repackaged
- SigCLIP Vision 384。データセットパスでのスタイル参照とガイダンスのために視覚的特徴を抽出します。Comfy-Org/sigclip_vision_384
- Florence‑2‑FLUX‑Large。データセットエクスポートのために高品質の自動キャプションを生成します。gokaygokay/Florence-2-Flux-Large
- 4x-UltraSharpアップスケーラー。データセットフローで使用されるシャープで自然なアップスケーリング。互換性のあるアップスケーラーを交換可能。
Comfyui Consistent Character Creator 3.8 ワークフローの使用方法
全体のロジックはシンプルです: クリーンな参照画像をインポートし、キャラクターに短い名前を付け(フォルダーやキャプションに使用)、オプションで一文のスタイルプロンプトを追加してから、必要なグループを実行します。各グループは自給自足であり、視覚的に一貫性を保ちながらクローズアップ、ターンアラウンド、ポーズ、シーン、データセットエクスポートを作成するために独立してトリガーできます。
モデルのロード
このユーティリティグループは、Qwen image-editエンコーダー、ペアVAE、およびCLIPテキスト/ビジョンバックボーンを初期化します。Qwen-Image-Edit-2511 GGUFウェイトとLightning LoRAがロードされて結合されるので、手動設定なしで迅速に反復できます。チェックポイントやエンコーダーを交換したい場合を除いて、ここで何かを変更する必要はありません。
GGUFモデル
このグループは、すべての生成パスで使用されるQwen-Image-Edit-2511 GGUF UNetにグラフをポイントします。Lightning LoRAがステップを加速する間、キャンバス全体でサンプリングを安定させます。アイデンティティを強制するバックボーンとして扱います。
アップスケールモデル
FLUX.1‑devチェックポイント、USO FLUXプロジェクターモデルパッチ、CLIP‑Visionエンコーダー、および選択したアップスケーラーをロードします。これらのアセットは主にデータセットパイプライン内で使用され、スタイルの一貫性のあるトレーニング画像とキャプションを生成します。デフォルトのままにするか、異なるアップスケーラーを選択するか、スタイルプロジェクターを交換する必要がある場合を除いて、設定をそのままにしておくことができます。
CHARACTER TURNAROUND
単一の入力画像からクリーンなマルチビューシートを生成します。Qwenエンコーダーは参照と短い指示に基づいて条件を設定し、均一で白い背景のラインアップを要求します。シーンやポーズを実行する前に迅速なアイデンティティチェックが必要な場合に使用します。出力は後のグループで簡単に再利用できるように、キャラクターの名前の下に保存されます。
CLOSE UP
肌のトーン、顔の特徴、微細なディテールをロックするフロントのニュートラルなクローズアップを作成します。エンコーダーはテキストよりも参照画像を優先するため、類似性が保たれます。サムネイル、IDカード、またはアイデンティティが広いシーンに対応できるかどうかを判断するために使用します。
PROFILE
プロファイルおよびシルエット検証のための側面ビューのクローズアップを生成します。プロンプトはプロポーションを一貫させるためのクリーンなフレーミングを要求します。耳、鼻、顎の形状を確認するために早期に実行し、全身ショットに進む前に確認します。
BACK
ポートレート範囲を完成させるために肩越しまたは背面ビューをレンダリングします。髪のシルエット、衣服の縫い目、背面のプロポーションを検証するのに役立ちます。後でアニメーションやターンアラウンドを生成する予定の場合に特に便利です。
T‑POSE
リギング、試着、またはテンプレート作業のために白い背景で中立的なTポーズの全身を生成します。同じ参照によって条件付けされているため、プロポーションと衣服がドリフトせずに転送されます。動きやスタイライズされたポーズを試みる前にベースとして使用します。
MODEL POSE
試着およびルックブックスタイルのショットのためにスタジオでリラックスしたポーズでキャラクターを配置します。衣服、髪型、スタイリングを維持しながら、体の姿勢を変更するように設計されています。アパレルの視覚化やアートディレクションのテストに最適です。
SIDE VIEW
スケールと姿勢の整合性のための全身側面ビューを構築します。SIDE VIEWとBACK VIEWを実行することで、モデリングや2Dリギングに使用できる正投影の参照が得られます。同じ条件スタックを使用しているため、アイデンティティが保持されます。
BACK VIEW
正投影カバレッジを完成させる全身背面ビューを作成します。衣服の背面の詳細、バックパック、または髪の長さのチェックに役立ちます。ターンアラウンドシートを組み立てるときにSIDE VIEWおよびT-POSEと一緒に使用します。
WALKING
衣服とシルエットを維持しながら、映画的な側面のウォーキングフレームを生成します。指示は、アイデンティティを壊さずに自然な動きを促します。クイックストーリーボードやショットテストに便利です。
SCENE_02
キャラクターをムーディーなインテリアに移動し、衣服と顔を維持しながら照明を変更します。スタイライズされた照明の下でキャラクターがどのように持ちこたえるかをテストするために使用します。アイデンティティの一貫性は、画像優先の条件付けによって維持されます。
SCENE_03
キャラクターを屋外に配置し、暖かい光と前景の小道具を備え、同じルックとワードローブを維持します。色のバランスのシフトに対するストレステストとして良いです。明るく、彩度の高い結果を望む場合にこれを使用します。
SCENE_04
異なるカメラアングルを使用した日当たりの良い公園のセットアップを提供し、低い角度の顔の安定性を確認します。ニュートラルパックの後にこれを実行し、上向きのショットの下での類似性を確認します。ソーシャル、ライフスタイル、または製品コンテキストに便利です。
SCENE_05
居心地の良いカフェ環境とハンドヘルドプロップガイダンスを追加し、衣装とスタイルを維持します。アイデンティティを失うことなく、インテリア照明と手のやり取りをミックスする現実性のチェックです。自然なストーリーテリングフレームが必要な場合に使用します。
SCENE_06
公共交通機関にキャラクターを移動し、衣服とカラーパレットを維持します。よりタイトで忙しい背景でアイデンティティを検証します。エディトリアルや都市の物語のパネルに便利です。
CONCEPT ART
元のプロポーションと衣装を尊重しつつ、スタイルを推定するアートディレクトされたバリアントを生成します。ムードボード、キーアート、またはプレプロダクションスケッチに意図されています。同じ参照を活用しているため、キャラクターは認識可能なままです。
04_EMOTIONS
微妙な表情の変化を伴う複数のクローズアップバリエーションを作成します。UIアバター、リアクションシート、またはダイアログポートレートに役立ち、被写体に忠実であり続けます。同じアイデンティティに一致するコンパクトな感情パックが必要な場合にこのグループをトリガーします。
B - DATASET CREATION
パックを生成した後、このグループは選択した画像をロードし、アップスケールして正規化し、Florence-2で自動キャプションを付け、トレーニング準備が整ったフォルダーに書き込みます。スタイル参照パスを使用して、データセットが生成されたパックと同じルックを保持します。キャラクター名を一度設定すると、エクスポーターは画像とキャプションを将来のファインチューンのための専用データセットフォルダーに保存します。
Comfyui Consistent Character Creator 3.8 ワークフローの主要ノード
TextEncodeQwenImageEditPlus(#1199)。参照画像と短い指示をQwenにフィードし、モデルが何を変更し、何を保持するかを理解させます。ポーズやシーンの変更が必要な場合は、image1をキャラクター写真に接続し、簡潔なpromptテキストを書きます。アイデンティティを過度に記述しないほど、出力は一貫性を保ちます。FluxKontextMultiReferenceLatentMethod(#1351)。サンプリングスケジュールの早い段階でアイデンティティの特徴をロックし、被写体が角度や照明を超えて生き残ります。最強のアイデンティティのために提供されたまま使用し、意図的にリスタイリングを望む場合のみリラックスさせます。KSampler(#199)。すべてのパックで条件を画像に変換します。より高い忠実度が必要な場合はstepsを調整し、指示に対する緩やかな順守が必要な場合はcfgを調整します。ここでの小さな調整が予測可能な方法で各グループに影響を与えます。LoraLoaderModelOnly(#547)。Qwen-Image-Edit-2511-Lightning LoRAをUNetにアタッチします。オーバーシャープニングやルックがドリフトする場合は、strength_modelを少し下げます。編集が弱すぎると感じる場合は上げます。これはQwen編集の速度対品質のダイヤルです。lightx2v/Qwen-Image-Edit-2511-LightningUSOStyleReference(サブグラフ)。CLIP‑Visionの特徴をFLUXと組み合わせ、アップスケーリング時にパックのスタイルを維持します。顔があまりにもきつくまたはゆるくクロップされる場合は、CLIP‑Visionエンコーダーのcropオプションを調整して、より安定したフレーミングを行います。Comfy-Org/USO_1.0_RepackagedFlorence2Run(#1413)。データセットライターが使用するキャプションを自動生成します。トレーニングデータセットにはキャプションtaskを詳細モードにしておきます。コンパクトなタグが必要な場合のみ短いモードに切り替えます。[gokaygokay/Florence-2-Flux-Large](https://huggingface.co/gokaygokayjson
/Florence-2-Flux-Large)
SaveImageTextDataSetToFolder(#1440)。画像とペアになったキャプションをキャラクター名を使用してクリーンなフォルダーに書き込みます。データセットをキャラクターごとに分離するためにfolder_nameを設定し、再現可能な命名のためにfilename_prefixを設定します。
オプションの追加機能
- CLOSE UPとPROFILEから始めて類似性を検証し、CHARACTER TURNAROUNDを実行してからシーンとポーズを探索します。
- プロンプトをカメラ、ポーズ、または環境を記述する短いものにし、参照画像でアイデンティティを定義します。
- 単純でユニークなNAMEを使用します。それが出力フォルダーとキャプションの便利なトリガートークンになります。
- パックに満足したら、B - DATASET CREATIONを一度実行して、ファインチューン用の正規化された画像とキャプションをエクスポートします。
- “試着”ルックの場合は、MODEL POSEまたはT-POSEを最初に実行してプロポーションをロックし、その後お好みのシーングループに切り替えます。
謝辞
このワークフローは以下の作品とリソースを実装および構築しています。MickMumpitzに感謝し、New Video Createワークフローソースページと付随するソースアーカイブの貢献とメンテナンスに感謝します。権威ある詳細については、以下にリンクされた元のドキュメントとリポジトリを参照してください。
リソース
- MickMumpitz/ワークフローソースページ
- ドキュメント / リリースノート: MickMumpitzからのワークフローソースページ
- MickMumpitz/ソースアーカイブ
- セットアップに使用されたローカルソースファイル:
260106_MICKMUMPITZ_CCC_3-8_SMPL.json
- セットアップに使用されたローカルソースファイル:
注: 参照されたモデル、データセット、およびコードの使用は、それぞれの著者およびメンテナーが提供するライセンスおよび条件に従います。




