Qwen Image Edit pour ComfyUI : Édition de photos basée sur des invites, remplacement et relighting
Ce flux de travail offre des éditions d'images rapides et contrôlables grâce à la famille Qwen. Avec une seule invite, vous pouvez inpaint, remplacer les arrière-plans, insérer ou supprimer des objets, et appliquer un relighting cinématographique tout en préservant les détails locaux. Qwen Image Edit est idéal pour les artistes et créateurs qui souhaitent des transformations précises sans se battre avec des graphes de nœuds complexes.
Le graphe est organisé en étapes simples : charger les modèles, télécharger une image, écrire des invites, puis échantillonner et sauvegarder. Il est livré avec un Lightning LoRA optionnel pour des éditions ultra-rapides en 4 étapes, vous permettant d'itérer rapidement et de verrouiller le look souhaité.
Modèles clés dans le flux de travail Comfyui Qwen Image Edit
- Modèle de diffusion Qwen Image Edit UNet d'édition d'image principal utilisé pour des éditions guidées par instructions. Emballé pour ComfyUI comme
qwen_image_edit_fp8_e4m3fn.safetensorsdans Comfy-Org/Qwen-Image-Edit_ComfyUI. - Encodeur de texte Qwen 2.5 VL 7B Encodeur de texte multimodal qui interprète les instructions d'édition et conditionne le modèle. Fourni comme
qwen_2.5_vl_7b_fp8_scaled.safetensorsdans Comfy-Org/Qwen-Image_ComfyUI. - Qwen Image VAE Codec latent adapté pour les modèles Qwen Image, améliorant la qualité de reconstruction. Distribué comme
qwen_image_vae.safetensorsdans Comfy-Org/Qwen-Image_ComfyUI. - Qwen-Image-Lightning LoRA (optionnel) LoRA optimisé pour la vitesse qui permet des éditions de haute qualité en seulement 4 étapes. Disponible comme
Qwen-Image-Lightning-4steps-V1.0.safetensorssur lightx2v/Qwen-Image-Lightning.
Comment utiliser le flux de travail Comfyui Qwen Image Edit
Étape 1 – Charger les modèles
Le graphe charge l'UNet d'édition avec UNETLoader (#37), l'encodeur de texte avec CLIPLoader (#38), et le codec latent avec VAELoader (#39). Si vous souhaitez une itération plus rapide, activez l'option LoraLoaderModelOnly (#89) pour appliquer le Lightning LoRA au-dessus du modèle de base. ModelSamplingAuraFlow (#66) et CFGNorm (#75) préparent l'échantillonneur pour que le modèle Qwen Image Edit suive les invites sans trop de détails.
Étape 2 – Télécharger l'image pour l'édition
Utilisez LoadImage (#78) pour sélectionner la photo que vous souhaitez modifier. L'image passe par ImageScaleToTotalPixels (#93) pour maintenir la résolution dans une plage de qualité, ce qui aide Qwen Image Edit à éviter les artefacts des entrées très grandes. VAEEncode (#88) convertit les pixels en latents pour une édition efficace tout en préservant la structure.
Étape 3 – Invite
Écrivez votre instruction dans TextEncodeQwenImageEdit (#76) comme une directive positive. Les exemples incluent "remplacer l'arrière-plan par un paysage urbain au coucher du soleil," "supprimer la personne à l'arrière," ou "lumière clé dorée douce depuis la gauche." Utilisez le second TextEncodeQwenImageEdit (#77) comme guide négatif lorsque vous devez éviter des changements, par exemple "ne pas altérer le visage du sujet" ou "conserver la couleur de la veste." Les deux encodeurs voient votre image téléchargée et le VAE pour que le conditionnement reste aligné avec le contenu.
Échantillonnage et sortie
KSampler (#3) exécute l'édition en utilisant le modèle patché et votre conditionnement. Si le Lightning LoRA est activé, vous pouvez converger en très peu d'étapes ; sinon, utilisez plus d'étapes pour une fidélité maximale. Le latent édité est décodé par VAEDecode (#8) et écrit sur le disque via SaveImage (#60).
Nœuds clés dans le flux de travail Comfyui Qwen Image Edit
TextEncodeQwenImageEdit (#76)
Encode l'instruction principale qui dirige l'édition. Favorisez les verbes directs comme "remplacer," "insérer," "supprimer," "recolorer," et "relighter." Si le changement doit être local, nommez explicitement la région ou l'objet. Gardez les invites concises ; les longues listes de balises de style sont rarement nécessaires.
TextEncodeQwenImageEdit (#77)
Fournit des conseils négatifs ou protecteurs. Utilisez-le pour indiquer au modèle ce qu'il doit éviter ou pour préserver des attributs clés. Bonnes pratiques : "conserver le teint," "ne pas changer la composition," "ignorer le texte de fond."
LoraLoaderModelOnly (#89)
Applique le Qwen-Image-Lightning LoRA pour une itération rapide. Activez-le lorsque vous avez besoin de résultats quasi-instantanés. Réduisez considérablement les étapes de l'échantillonneur lorsque ce LoRA est actif pour maintenir des éditions nettes.
ImageScaleToTotalPixels (#93)
Réduit les entrées surdimensionnées à un budget de mégapixels cible pour stabiliser la qualité. Utilisez-le lorsque les images sources sont très grandes ou contiennent une forte compression ; cela améliore souvent la douceur des bords et réduit les halos.
CFGNorm (#75)
Normalise le comportement de guidance sans classificateur pour que le modèle suive les invites sans produire d'artefacts. Si vous voyez une saturation excessive ou un "sur-édition," baissez légèrement la force ; si les éditions semblent timides, augmentez-la un peu.
KSampler (#3)
Exécute la boucle de diffusion. Commencez avec des étapes modestes pour fp8 et augmentez seulement si l'édition est incomplète. Gardez la guidance modérée ; des valeurs très élevées peuvent effacer les régions préservées. Lorsque le Lightning LoRA est activé, utilisez très peu d'étapes pour profiter de son avantage de vitesse.
Extras optionnels
- Décrivez les éditions simplement. Qwen Image Edit répond mieux aux instructions courtes et actionnables comme "rendre le ciel couvert et ajouter de la pluie" ou "échanger le texte de l'affiche par 'RunComfy' en blanc."
- Pour le remplacement d'arrière-plan, spécifiez à la fois la nouvelle scène et l'ambiance, par exemple "remplacer l'arrière-plan par une ligne d'horizon au crépuscule, brume orange, lumières de la ville faiblement visibles."
- Pour le travail sur les objets, combinez une action et un placement : "insérer un parapluie rouge dans la main droite du sujet," ou "supprimer la poubelle à gauche."
- Pour le relighting, nommez la direction, la qualité et l'intensité : "lumière clé douce depuis la droite de la caméra, lumière de contour subtile, ton chaud."
- Si les résultats semblent surtraités, réduisez la guidance ou désactivez le LoRA ; si les éditions sont trop faibles, augmentez légèrement les étapes ou renforcez l'instruction.
Remerciements
Ce flux de travail implémente et s'appuie sur les travaux et ressources suivants. Nous remercions QwenLM pour Qwen-Image-Edit, QwenLM pour Qwen-Image, et ComfyOrg pour ComfyUI Native Workflow Example pour leurs contributions et leur maintenance. Pour des détails autoritaires, veuillez vous référer à la documentation originale et aux référentiels liés ci-dessous.
Ressources
- Référence Comfy/Qwen Image-Edit
- GitHub: QwenLM/Qwen-Image
- Hugging Face: Qwen/Qwen-Image-Edit
- arXiv: Qwen-Image Technical Report
- Docs / Notes de version: Qwen-Image-Edit ComfyUI Native Workflow Example
Remarque : L'utilisation des modèles, ensembles de données et codes référencés est soumise aux licences et conditions respectives fournies par leurs auteurs et mainteneurs.

