Ce flux de travail offre des éditions d'images rapides et contrôlables grâce à la famille Qwen. Avec une seule invite, vous pouvez inpaint, remplacer les arrière-plans, insérer ou supprimer des objets, et appliquer un relighting cinématographique tout en préservant les détails locaux. Qwen Image Edit est idéal pour les artistes et créateurs qui souhaitent des transformations précises sans se battre avec des graphes de nœuds complexes.
Le graphe est organisé en étapes simples : charger les modèles, télécharger une image, écrire des invites, puis échantillonner et sauvegarder. Il est livré avec un Lightning LoRA optionnel pour des éditions ultra-rapides en 4 étapes, vous permettant d'itérer rapidement et de verrouiller le look souhaité.
qwen_image_edit_fp8_e4m3fn.safetensors
dans .qwen_2.5_vl_7b_fp8_scaled.safetensors
dans .qwen_image_vae.safetensors
dans .Qwen-Image-Lightning-4steps-V1.0.safetensors
sur .Le graphe charge l'UNet d'édition avec UNETLoader
(#37), l'encodeur de texte avec CLIPLoader
(#38), et le codec latent avec VAELoader
(#39). Si vous souhaitez une itération plus rapide, activez l'option LoraLoaderModelOnly
(#89) pour appliquer le Lightning LoRA au-dessus du modèle de base. ModelSamplingAuraFlow
(#66) et CFGNorm
(#75) préparent l'échantillonneur pour que le modèle Qwen Image Edit suive les invites sans trop de détails.
Utilisez LoadImage
(#78) pour sélectionner la photo que vous souhaitez modifier. L'image passe par ImageScaleToTotalPixels
(#93) pour maintenir la résolution dans une plage de qualité, ce qui aide Qwen Image Edit à éviter les artefacts des entrées très grandes. VAEEncode
(#88) convertit les pixels en latents pour une édition efficace tout en préservant la structure.
Écrivez votre instruction dans TextEncodeQwenImageEdit
(#76) comme une directive positive. Les exemples incluent "remplacer l'arrière-plan par un paysage urbain au coucher du soleil," "supprimer la personne à l'arrière," ou "lumière clé dorée douce depuis la gauche." Utilisez le second TextEncodeQwenImageEdit
(#77) comme guide négatif lorsque vous devez éviter des changements, par exemple "ne pas altérer le visage du sujet" ou "conserver la couleur de la veste." Les deux encodeurs voient votre image téléchargée et le VAE pour que le conditionnement reste aligné avec le contenu.
KSampler
(#3) exécute l'édition en utilisant le modèle patché et votre conditionnement. Si le Lightning LoRA est activé, vous pouvez converger en très peu d'étapes ; sinon, utilisez plus d'étapes pour une fidélité maximale. Le latent édité est décodé par VAEDecode
(#8) et écrit sur le disque via SaveImage
(#60).
TextEncodeQwenImageEdit
(#76)Encode l'instruction principale qui dirige l'édition. Favorisez les verbes directs comme "remplacer," "insérer," "supprimer," "recolorer," et "relighter." Si le changement doit être local, nommez explicitement la région ou l'objet. Gardez les invites concises ; les longues listes de balises de style sont rarement nécessaires.
TextEncodeQwenImageEdit
(#77)Fournit des conseils négatifs ou protecteurs. Utilisez-le pour indiquer au modèle ce qu'il doit éviter ou pour préserver des attributs clés. Bonnes pratiques : "conserver le teint," "ne pas changer la composition," "ignorer le texte de fond."
LoraLoaderModelOnly
(#89)Applique le Qwen-Image-Lightning LoRA pour une itération rapide. Activez-le lorsque vous avez besoin de résultats quasi-instantanés. Réduisez considérablement les étapes de l'échantillonneur lorsque ce LoRA est actif pour maintenir des éditions nettes.
ImageScaleToTotalPixels
(#93)Réduit les entrées surdimensionnées à un budget de mégapixels cible pour stabiliser la qualité. Utilisez-le lorsque les images sources sont très grandes ou contiennent une forte compression ; cela améliore souvent la douceur des bords et réduit les halos.
CFGNorm
(#75)Normalise le comportement de guidance sans classificateur pour que le modèle suive les invites sans produire d'artefacts. Si vous voyez une saturation excessive ou un "sur-édition," baissez légèrement la force ; si les éditions semblent timides, augmentez-la un peu.
KSampler
(#3)Exécute la boucle de diffusion. Commencez avec des étapes modestes pour fp8 et augmentez seulement si l'édition est incomplète. Gardez la guidance modérée ; des valeurs très élevées peuvent effacer les régions préservées. Lorsque le Lightning LoRA est activé, utilisez très peu d'étapes pour profiter de son avantage de vitesse.
Ce flux de travail implémente et s'appuie sur les travaux et ressources suivants. Nous remercions QwenLM pour Qwen-Image-Edit, QwenLM pour Qwen-Image, et ComfyOrg pour ComfyUI Native Workflow Example pour leurs contributions et leur maintenance. Pour des détails autoritaires, veuillez vous référer à la documentation originale et aux référentiels liés ci-dessous.
Remarque : L'utilisation des modèles, ensembles de données et codes référencés est soumise aux licences et conditions respectives fournies par leurs auteurs et mainteneurs.
RunComfy est la première ComfyUI plateforme, offrant des ComfyUI en ligne environnement et services, ainsi que des workflows ComfyUI proposant des visuels époustouflants. RunComfy propose également AI Playground, permettant aux artistes d'utiliser les derniers outils d'IA pour créer des œuvres d'art incroyables.