ComfyUI>Workflow>FLUX.2 Klein 9B LoRA Inferenza | AI Toolkit ComfyUI

FLUX.2 Klein 9B LoRA Inferenza | AI Toolkit ComfyUI

Workflow Name: RunComfy/FLUX2-Klein-9B-LoRA-ComfyUI-Inference
Workflow ID: 0000...1360
FLUX.2 Klein 9B LoRA ComfyUI Inferenza ti fornisce un grafico ComfyUI pronto per l'uso per applicare LoRA addestrati dall'AI Toolkit su FLUX.2 Klein 9B con precisione a livello di pipeline. Flux2Klein9BPipeline avvolge la pipeline di inferenza Klein 9B-codifica del testo Qwen3-8B, pianificazione del flusso e iniezione dell'adattatore interno-così che la generazione ComfyUI si comporti nello stesso modo in cui l'AI Toolkit rende le anteprime dell'addestramento. Il caricamento dell'adattatore supporta file locali in models/loras o URL .safetensors diretti, controllati da lora_path e lora_scale. Poiché Klein 9B non è guidance-distilled, guidance_scale modella direttamente la qualità dell'output; allinearlo alla tua configurazione del campione di addestramento evita la fonte più comune di disallineamento delle anteprime. Il workflow genera immagini standard attraverso SaveImage per un confronto diretto fianco a fianco con le anteprime di addestramento.

FLUX.2 Klein 9B LoRA ComfyUI Inference Workflow

FLUX.2 Klein 9B LoRA ComfyUI Inference | RunComfy Workflow (Training-Matched Results)
Want to run this workflow?
  • Fully operational workflows
  • No missing nodes or models
  • No manual setups required
  • Features stunning visuals

FLUX.2 Klein 9B LoRA ComfyUI Inference Examples

FLUX.2 Klein 9B LoRA ComfyUI Inferenza: generazione di LoRA allineata alle anteprime dell'AI Toolkit in ComfyUI#

Usa questo workflow di RunComfy quando hai bisogno di un'inferenza ComfyUI che rimanga coerente con le anteprime di addestramento dell'AI Toolkit per i FLUX.2 Klein 9B LoRAs. L'impostazione instrada la generazione attraverso Flux2Klein9BPipeline—un wrapper di pipeline specifico del modello open-source da RunComfy—piuttosto che un grafico di campionamento standard. Il tuo adattatore viene applicato tramite lora_path e lora_scale all'interno di quella pipeline, offrendoti un comportamento corrispondente all'addestramento LoRA senza ricostruzione manuale della pipeline.

Perché FLUX.2 Klein 9B LoRA ComfyUI Inferenza spesso appare diversa in ComfyUI#

Quando l'AI Toolkit rende un'anteprima di addestramento, esegue la completa pipeline di inferenza FLUX.2 Klein 9B—codifica del testo Qwen3-8B, pianificazione del flusso e iniezione interna di LoRA avvengono tutte come un'unità coordinata. Un tipico grafico ComfyUI riassembla questi componenti in modo indipendente, il che introduce sottili differenze nel condizionamento, nella pianificazione del rumore e nell'ordine di applicazione dell'adattatore. Il risultato è una deriva a livello di pipeline, non un singolo controllo mal configurato. Flux2Klein9BPipeline colma questo divario eseguendo la pipeline del modello end-to-end e iniettando il tuo LoRA al suo interno. Riferimento: `src/pipelines/flux2_klein.py`.

Come utilizzare il workflow FLUX.2 Klein 9B LoRA ComfyUI Inferenza#

Passo 1: Ottieni il percorso LoRA e caricalo nel workflow (2 opzioni)#

Opzione A — Risultato dell'addestramento RunComfy > scarica su ComfyUI locale:

  1. Vai a Trainer > LoRA Assets
  2. Trova il FLUX.2 Klein 9B LoRA che desideri utilizzare
  3. Clicca sul menu ... (tre punti) a destra > seleziona Copia Link LoRA
  4. Nella pagina del workflow ComfyUI, incolla il link copiato nel campo di input Download nell'angolo in alto a destra dell'interfaccia
  5. Prima di cliccare su Download, assicurati che la cartella di destinazione sia impostata su ComfyUI > models > loras (questa cartella deve essere selezionata come destinazione di download)
  6. Clicca su Download — il file LoRA viene salvato nella directory models/loras corretta
  7. Dopo che il download è terminato, aggiorna la pagina
  8. Ora il LoRA appare nel menu a discesa di selezione LoRA — selezionalo
FLUX.2 Klein 9B: copia il link LoRA dall

Opzione B — URL diretto LoRA (sostituisce l'Opzione A):

  1. Incolla l'URL diretto di download .safetensors nel campo di input path / url del nodo LoRA
  2. Quando un URL è fornito qui, sostituisce l'Opzione A — il workflow recupera il LoRA direttamente dall'URL al momento dell'esecuzione
  3. Non è richiesto alcun download locale o posizionamento di file

Suggerimento: conferma che l'URL risolva effettivamente il file .safetensors, non una pagina di destinazione o un reindirizzamento.

FLUX.2 Klein 9B: incolla un URL diretto LoRA nel campo path/url sul nodo LoRA

Passo 2: Allinea i parametri di inferenza con le impostazioni del tuo campione di addestramento#

Imposta lora_scale sul nodo LoRA per controllare la forza dell'adattatore—inizia con il valore utilizzato durante le anteprime di addestramento e regola da lì.

I parametri rimanenti sono sui nodi Generate e Load Pipeline:

  • prompt — il tuo prompt di testo; includi eventuali parole chiave di attivazione dall'addestramento
  • width / height — risoluzione di output; abbina la dimensione dell'anteprima di addestramento per un confronto diretto (multipli di 16)
  • sample_steps — passi di inferenza; FLUX.2 Klein 9B predefiniti a 25
  • guidance_scale — forza CFG; il valore predefinito è 4.0 (Klein 9B non è guidance-distilled, quindi questo valore modella direttamente la qualità dell'output)
  • seed — fissa un seed per riprodurre un output specifico; cambia per esplorare variazioni
  • seed_modefixed o randomize
  • hf_token — è richiesto un valido token Hugging Face poiché FLUX.2 Klein 9B è un modello con accesso limitato; incolla il tuo token nel campo hf_token sul nodo Load Pipeline

Suggerimento per l'allineamento dell'addestramento: se hai personalizzato i valori di campionamento durante l'addestramento (seed, guidance_scale, sample_steps, parole chiave di attivazione), copia quegli esatti valori nei campi corrispondenti. Se hai addestrato su RunComfy, apri Trainer > LoRA Assets > Config per visualizzare il YAML risolto e trasferire le impostazioni di anteprima/campione.

FLUX.2 Klein 9B: impostazioni di anteprima e campione nella schermata Config di RunComfy LoRA

Passo 3: Esegui FLUX.2 Klein 9B LoRA ComfyUI Inferenza#

Clicca su Queue/Run — il nodo SaveImage scrive i risultati nella tua cartella di output ComfyUI.

⚠️ Importante · Accesso a FLUX.2 & token Hugging Face richiesti#

I modelli FLUX.2 Klein 9B richiedono autorizzazione esplicita su Hugging Face.

Prima di eseguire questo workflow:

  1. Assicurati che il tuo account Hugging Face abbia ottenuto l'accesso a FLUX.2 (Klein 9B)
  2. Crea un token di accesso Hugging Face
  3. Incolla il tuo token nel campo hf_token nel nodo RC FLUX.2

Senza un token valido e un accesso corretto al modello, il workflow non funzionerà.

Per istruzioni dettagliate, vedi: https://www.runcomfy.com/trainer/ai-toolkit/huggingface-token-flux-ostris-ai-toolkit

Checklist rapida:

  • ✅ L'account Hugging Face ha accesso a FLUX.2 Klein 9B e un token valido è in hf_token
  • ✅ LoRA è: scaricato in ComfyUI/models/loras (Opzione A), o caricato tramite un URL diretto .safetensors (Opzione B)
  • ✅ Pagina aggiornata dopo il download locale (solo Opzione A)
  • ✅ I parametri di inferenza corrispondono alla configurazione del campione di addestramento (se personalizzati)

Se tutto sopra è corretto, i risultati dell'inferenza qui dovrebbero corrispondere strettamente alle tue anteprime di addestramento.

Risoluzione dei problemi FLUX.2 Klein 9B LoRA ComfyUI Inferenza#

La maggior parte delle discrepanze "anteprima di addestramento vs inferenza ComfyUI" su FLUX.2 Klein 9B derivano da differenze a livello di pipeline (percorso dell'encoder di testo, pianificazione/condizionamento e dove/come viene applicato l'adattatore). Il workflow RunComfy evita di ricostruire manualmente la pipeline eseguendo la generazione attraverso Flux2Klein9BPipeline e iniettando il LoRA all'interno di quella pipeline tramite lora_path / lora_scale, che è il modo più vicino per riprodurre il comportamento dell'anteprima dell'AI Toolkit in ComfyUI.

(1) Errore 401 Client.#

Perché succede FLUX.2 Klein 9B è un modello con accesso limitato su Hugging Face. Se il tuo account non ha accesso, o non viene fornito un token valido, i pesi del modello non possono essere scaricati e l'inferenza fallisce con un errore 401.

Come risolvere

  • Assicurati che il tuo account Hugging Face abbia ottenuto l'accesso a black-forest-labs/FLUX.2-klein-base-9B.
  • Crea un token di accesso Hugging Face e incollalo nel campo hf_token sul nodo Load Pipeline.
  • Dopo che l'accesso e il token sono stati confermati, esegui l'inferenza attraverso i nodi della pipeline AI Toolkit di RunComfy in modo che autenticazione e caricamento del modello avvengano in un'unica pipeline coerente.
  • Per istruzioni dettagliate, vedi: https://www.runcomfy.com/trainer/ai-toolkit/huggingface-token-flux-ostris-ai-toolkit

(2) Errori CLIPLoader dei modelli Flux 2 Klein#

Perché succede Questi errori sono causati da un disallineamento dell'encoder di testo—ad esempio, caricando un encoder incompatibile o mescolando asset dell'encoder Klein 4B e Klein 9B. Questo spesso appare come disallineamenti di dimensioni di embedding o vocabolario durante il caricamento del CLIP/encoder di testo.

Come risolvere

  • Aggiorna ComfyUI all'ultima versione per assicurarti che il supporto FLUX.2 Klein sia completo.
  • Assicurati che venga utilizzato l'encoder di testo corretto per Klein 9B (Klein 9B richiede Qwen3-8B; l'uso di un encoder 4B fallirà).
  • Per un'inferenza LoRA allineata alle anteprime, preferisci il wrapper di pipeline di RunComfy, che carica l'encoder corretto e applica il LoRA nella stessa pipeline utilizzata per le anteprime dell'AI Toolkit.

(3) le forme di mat1 e mat2 non possono essere moltiplicate (512x2560 e 7680x3072)#

Perché succede Questo errore indica un disallineamento delle dimensioni del condizionamento, tipicamente causato dall'uso dell'encoder sbagliato o di un tipo di clip/condizionamento errato per FLUX.2 Klein 9B. Il modello riceve embedding della forma sbagliata, causando il fallimento della moltiplicazione delle matrici durante il campionamento.

Come risolvere

  • Se costruisci grafici manualmente, verifica di utilizzare l'encoder di testo specifico per FLUX.2 Klein e che il tipo di clip/condizionamento corrisponda alle aspettative di FLUX.2 Klein.
  • Per la soluzione più affidabile, esegui l'inferenza attraverso il wrapper di pipeline FLUX.2 Klein 9B di RunComfy (model_type = flux2_klein_9b) e inietta il tuo LoRA tramite lora_path. Questo mantiene l'intero stack di inferenza—encoder, pianificatore e adattatore—allineato alla pipeline con le anteprime dell'AI Toolkit.

Esegui ora FLUX.2 Klein 9B LoRA ComfyUI Inferenza#

Carica il workflow, incolla il tuo lora_path, inserisci un valido hf_token, e lascia che Flux2Klein9BPipeline mantenga l'output ComfyUI allineato con le tue anteprime di addestramento dell'AI Toolkit.

RunComfy
Copyright 2026 RunComfy. Tutti i Diritti Riservati.

RunComfy è la piattaforma principale ComfyUI che offre ComfyUI online ambiente e servizi, insieme a workflow di ComfyUI con visuali mozzafiato. RunComfy offre anche AI Models, consentire agli artisti di sfruttare gli ultimi strumenti di AI per creare arte incredibile.