FLUX.2 Klein 9B LoRA ComfyUI Inferenza: generazione di LoRA allineata alle anteprime dell'AI Toolkit in ComfyUI#
Usa questo workflow di RunComfy quando hai bisogno di un'inferenza ComfyUI che rimanga coerente con le anteprime di addestramento dell'AI Toolkit per i FLUX.2 Klein 9B LoRAs. L'impostazione instrada la generazione attraverso Flux2Klein9BPipeline—un wrapper di pipeline specifico del modello open-source da RunComfy—piuttosto che un grafico di campionamento standard. Il tuo adattatore viene applicato tramite lora_path e lora_scale all'interno di quella pipeline, offrendoti un comportamento corrispondente all'addestramento LoRA senza ricostruzione manuale della pipeline.
Perché FLUX.2 Klein 9B LoRA ComfyUI Inferenza spesso appare diversa in ComfyUI#
Quando l'AI Toolkit rende un'anteprima di addestramento, esegue la completa pipeline di inferenza FLUX.2 Klein 9B—codifica del testo Qwen3-8B, pianificazione del flusso e iniezione interna di LoRA avvengono tutte come un'unità coordinata. Un tipico grafico ComfyUI riassembla questi componenti in modo indipendente, il che introduce sottili differenze nel condizionamento, nella pianificazione del rumore e nell'ordine di applicazione dell'adattatore. Il risultato è una deriva a livello di pipeline, non un singolo controllo mal configurato. Flux2Klein9BPipeline colma questo divario eseguendo la pipeline del modello end-to-end e iniettando il tuo LoRA al suo interno. Riferimento: `src/pipelines/flux2_klein.py`.
Come utilizzare il workflow FLUX.2 Klein 9B LoRA ComfyUI Inferenza#
Passo 1: Ottieni il percorso LoRA e caricalo nel workflow (2 opzioni)#
Opzione A — Risultato dell'addestramento RunComfy > scarica su ComfyUI locale:
- Vai a Trainer > LoRA Assets
- Trova il FLUX.2 Klein 9B LoRA che desideri utilizzare
- Clicca sul menu ... (tre punti) a destra > seleziona Copia Link LoRA
- Nella pagina del workflow ComfyUI, incolla il link copiato nel campo di input Download nell'angolo in alto a destra dell'interfaccia
- Prima di cliccare su Download, assicurati che la cartella di destinazione sia impostata su ComfyUI > models > loras (questa cartella deve essere selezionata come destinazione di download)
- Clicca su Download — il file LoRA viene salvato nella directory
models/lorascorretta - Dopo che il download è terminato, aggiorna la pagina
- Ora il LoRA appare nel menu a discesa di selezione LoRA — selezionalo

Opzione B — URL diretto LoRA (sostituisce l'Opzione A):
- Incolla l'URL diretto di download
.safetensorsnel campo di inputpath / urldel nodo LoRA - Quando un URL è fornito qui, sostituisce l'Opzione A — il workflow recupera il LoRA direttamente dall'URL al momento dell'esecuzione
- Non è richiesto alcun download locale o posizionamento di file
Suggerimento: conferma che l'URL risolva effettivamente il file .safetensors, non una pagina di destinazione o un reindirizzamento.

Passo 2: Allinea i parametri di inferenza con le impostazioni del tuo campione di addestramento#
Imposta lora_scale sul nodo LoRA per controllare la forza dell'adattatore—inizia con il valore utilizzato durante le anteprime di addestramento e regola da lì.
I parametri rimanenti sono sui nodi Generate e Load Pipeline:
prompt— il tuo prompt di testo; includi eventuali parole chiave di attivazione dall'addestramentowidth/height— risoluzione di output; abbina la dimensione dell'anteprima di addestramento per un confronto diretto (multipli di 16)sample_steps— passi di inferenza; FLUX.2 Klein 9B predefiniti a 25guidance_scale— forza CFG; il valore predefinito è 4.0 (Klein 9B non è guidance-distilled, quindi questo valore modella direttamente la qualità dell'output)seed— fissa un seed per riprodurre un output specifico; cambia per esplorare variazioniseed_mode—fixedorandomizehf_token— è richiesto un valido token Hugging Face poiché FLUX.2 Klein 9B è un modello con accesso limitato; incolla il tuo token nel campohf_tokensul nodo Load Pipeline
Suggerimento per l'allineamento dell'addestramento: se hai personalizzato i valori di campionamento durante l'addestramento (seed, guidance_scale, sample_steps, parole chiave di attivazione), copia quegli esatti valori nei campi corrispondenti. Se hai addestrato su RunComfy, apri Trainer > LoRA Assets > Config per visualizzare il YAML risolto e trasferire le impostazioni di anteprima/campione.

Passo 3: Esegui FLUX.2 Klein 9B LoRA ComfyUI Inferenza#
Clicca su Queue/Run — il nodo SaveImage scrive i risultati nella tua cartella di output ComfyUI.
⚠️ Importante · Accesso a FLUX.2 & token Hugging Face richiesti#
I modelli FLUX.2 Klein 9B richiedono autorizzazione esplicita su Hugging Face.
Prima di eseguire questo workflow:
- Assicurati che il tuo account Hugging Face abbia ottenuto l'accesso a FLUX.2 (Klein 9B)
- Crea un token di accesso Hugging Face
- Incolla il tuo token nel campo
hf_tokennel nodo RC FLUX.2
Senza un token valido e un accesso corretto al modello, il workflow non funzionerà.
Per istruzioni dettagliate, vedi: https://www.runcomfy.com/trainer/ai-toolkit/huggingface-token-flux-ostris-ai-toolkit
Checklist rapida:
- ✅ L'account Hugging Face ha accesso a FLUX.2 Klein 9B e un token valido è in
hf_token - ✅ LoRA è: scaricato in
ComfyUI/models/loras(Opzione A), o caricato tramite un URL diretto.safetensors(Opzione B) - ✅ Pagina aggiornata dopo il download locale (solo Opzione A)
- ✅ I parametri di inferenza corrispondono alla configurazione del campione di addestramento (se personalizzati)
Se tutto sopra è corretto, i risultati dell'inferenza qui dovrebbero corrispondere strettamente alle tue anteprime di addestramento.
Risoluzione dei problemi FLUX.2 Klein 9B LoRA ComfyUI Inferenza#
La maggior parte delle discrepanze "anteprima di addestramento vs inferenza ComfyUI" su FLUX.2 Klein 9B derivano da differenze a livello di pipeline (percorso dell'encoder di testo, pianificazione/condizionamento e dove/come viene applicato l'adattatore). Il workflow RunComfy evita di ricostruire manualmente la pipeline eseguendo la generazione attraverso Flux2Klein9BPipeline e iniettando il LoRA all'interno di quella pipeline tramite lora_path / lora_scale, che è il modo più vicino per riprodurre il comportamento dell'anteprima dell'AI Toolkit in ComfyUI.
(1) Errore 401 Client.#
Perché succede FLUX.2 Klein 9B è un modello con accesso limitato su Hugging Face. Se il tuo account non ha accesso, o non viene fornito un token valido, i pesi del modello non possono essere scaricati e l'inferenza fallisce con un errore 401.
Come risolvere
- Assicurati che il tuo account Hugging Face abbia ottenuto l'accesso a
black-forest-labs/FLUX.2-klein-base-9B. - Crea un token di accesso Hugging Face e incollalo nel campo
hf_tokensul nodo Load Pipeline. - Dopo che l'accesso e il token sono stati confermati, esegui l'inferenza attraverso i nodi della pipeline AI Toolkit di RunComfy in modo che autenticazione e caricamento del modello avvengano in un'unica pipeline coerente.
- Per istruzioni dettagliate, vedi: https://www.runcomfy.com/trainer/ai-toolkit/huggingface-token-flux-ostris-ai-toolkit
(2) Errori CLIPLoader dei modelli Flux 2 Klein#
Perché succede Questi errori sono causati da un disallineamento dell'encoder di testo—ad esempio, caricando un encoder incompatibile o mescolando asset dell'encoder Klein 4B e Klein 9B. Questo spesso appare come disallineamenti di dimensioni di embedding o vocabolario durante il caricamento del CLIP/encoder di testo.
Come risolvere
- Aggiorna ComfyUI all'ultima versione per assicurarti che il supporto FLUX.2 Klein sia completo.
- Assicurati che venga utilizzato l'encoder di testo corretto per Klein 9B (Klein 9B richiede Qwen3-8B; l'uso di un encoder 4B fallirà).
- Per un'inferenza LoRA allineata alle anteprime, preferisci il wrapper di pipeline di RunComfy, che carica l'encoder corretto e applica il LoRA nella stessa pipeline utilizzata per le anteprime dell'AI Toolkit.
(3) le forme di mat1 e mat2 non possono essere moltiplicate (512x2560 e 7680x3072)#
Perché succede Questo errore indica un disallineamento delle dimensioni del condizionamento, tipicamente causato dall'uso dell'encoder sbagliato o di un tipo di clip/condizionamento errato per FLUX.2 Klein 9B. Il modello riceve embedding della forma sbagliata, causando il fallimento della moltiplicazione delle matrici durante il campionamento.
Come risolvere
- Se costruisci grafici manualmente, verifica di utilizzare l'encoder di testo specifico per FLUX.2 Klein e che il tipo di clip/condizionamento corrisponda alle aspettative di FLUX.2 Klein.
- Per la soluzione più affidabile, esegui l'inferenza attraverso il wrapper di pipeline FLUX.2 Klein 9B di RunComfy (
model_type = flux2_klein_9b) e inietta il tuo LoRA tramitelora_path. Questo mantiene l'intero stack di inferenza—encoder, pianificatore e adattatore—allineato alla pipeline con le anteprime dell'AI Toolkit.
Esegui ora FLUX.2 Klein 9B LoRA ComfyUI Inferenza#
Carica il workflow, incolla il tuo lora_path, inserisci un valido hf_token, e lascia che Flux2Klein9BPipeline mantenga l'output ComfyUI allineato con le tue anteprime di addestramento dell'AI Toolkit.


