Questo flusso di lavoro offre modifiche rapide e controllabili delle immagini alimentate dalla famiglia Qwen. Con un singolo prompt, puoi fare inpainting, sostituire sfondi, inserire o rimuovere oggetti e applicare riluminazione cinematografica mantenendo i dettagli locali. Qwen Image Edit è ideale per artisti e creatori che vogliono trasformazioni precise senza dover lottare con grafici di nodi complessi.
Il grafico è organizzato in semplici passaggi: caricare i modelli, caricare un'immagine, scrivere prompt, quindi campionare e salvare. Viene fornito con un'opzione Lightning LoRA per modifiche ultra-rapide in 4 passaggi, così puoi iterare rapidamente e fissare l'aspetto desiderato.
qwen_image_edit_fp8_e4m3fn.safetensors
in .qwen_2.5_vl_7b_fp8_scaled.safetensors
in .qwen_image_vae.safetensors
in .Qwen-Image-Lightning-4steps-V1.0.safetensors
su .Il grafico carica l'edit UNet con UNETLoader
(#37), il codificatore di testo con CLIPLoader
(#38) e il codec latente con VAELoader
(#39). Se desideri iterazioni più veloci, attiva l'opzione LoraLoaderModelOnly
(#89) per applicare il Lightning LoRA sopra il modello base. ModelSamplingAuraFlow
(#66) e CFGNorm
(#75) preparano il campionatore affinché il modello Qwen Image Edit segua i prompt senza esagerare nei dettagli.
Usa LoadImage
(#78) per selezionare la foto che vuoi modificare. L'immagine passa attraverso ImageScaleToTotalPixels
(#93) per mantenere la risoluzione in un intervallo di qualità-friendly, il che aiuta Qwen Image Edit a evitare artefatti da input molto grandi. VAEEncode
(#88) converte i pixel in latenti per una modifica efficiente preservando la struttura.
Scrivi la tua istruzione in TextEncodeQwenImageEdit
(#76) come direttiva positiva. Esempi includono "sostituisci lo sfondo con un tramonto sulla città," "rimuovi la persona sullo sfondo," o "luce chiave dorata morbida da sinistra." Usa il secondo TextEncodeQwenImageEdit
(#77) come guida negativa quando devi evitare cambiamenti, per esempio "non alterare il viso del soggetto" o "mantieni il colore della giacca." Entrambi i codificatori vedono la tua immagine caricata e il VAE in modo che il condizionamento rimanga allineato con il contenuto.
KSampler
(#3) esegue la modifica utilizzando il modello patchato e il tuo condizionamento. Se il Lightning LoRA è attivato, puoi convergere con pochissimi passaggi; altrimenti, usa più passaggi per massima fedeltà. Il latente modificato è decodificato da VAEDecode
(#8) e scritto su disco tramite SaveImage
(#60).
TextEncodeQwenImageEdit
(#76)Encodes the main instruction that drives the edit. Favor direct verbs like "replace," "insert," "remove," "recolor," and "relight." If the change should be local, name the region or object explicitly. Keep prompts concise; long lists of style tags are rarely needed.
TextEncodeQwenImageEdit
(#77)Provides negative or protective guidance. Use it to tell the model what to avoid or to preserve key attributes. Good patterns: "keep skin tone," "do not change composition," "ignore background text."
LoraLoaderModelOnly
(#89)Applies the Qwen-Image-Lightning LoRA for rapid iteration. Turn it on when you need near-instant results. Reduce sampler steps substantially when this LoRA is active to maintain crisp edits.
ImageScaleToTotalPixels
(#93)Downscales oversized inputs to a target megapixel budget to stabilize quality. Use it when source images are very large or contain heavy compression; it often improves edge smoothness and reduces halos.
CFGNorm
(#75)Normalizes classifier-free guidance behavior so the model follows prompts without pushing artifacts. If you see oversaturation or "over-editing," lower the strength slightly; if edits feel timid, raise it a bit.
KSampler
(#3)Runs the diffusion loop. Start with modest steps for fp8 and increase only if the edit is incomplete. Keep guidance moderate; very high values can wash out preserved regions. When the Lightning LoRA is on, use very few steps to capture its speed benefit.
Questo flusso di lavoro implementa e si basa sui seguenti lavori e risorse. Ringraziamo calorosamente QwenLM per Qwen-Image-Edit, QwenLM per Qwen-Image, e ComfyOrg per ComfyUI Native Workflow Example per i loro contributi e manutenzione. Per dettagli autorevoli, si prega di fare riferimento alla documentazione originale e ai repository collegati di seguito.
Nota: L'uso dei modelli, dei dataset e del codice di riferimento è soggetto alle rispettive licenze e condizioni fornite dai loro autori e manutentori.
RunComfy è la piattaforma principale ComfyUI che offre ComfyUI online ambiente e servizi, insieme a workflow di ComfyUI con visuali mozzafiato. RunComfy offre anche AI Playground, consentire agli artisti di sfruttare gli ultimi strumenti di AI per creare arte incredibile.