Dieser Workflow liefert schnelle, kontrollierbare Bildbearbeitungen, die von der Qwen-Familie angetrieben werden. Mit einem einzigen Prompt können Sie Inpainting durchführen, Hintergründe ersetzen, Objekte einfügen oder entfernen und filmische Neubeleuchtung anwenden, während lokale Details erhalten bleiben. Qwen Image Edit ist ideal für Künstler und Kreative, die präzise Transformationen ohne komplexe Knotengraphen wünschen.
Der Graph ist in einfache Schritte organisiert: Modelle laden, ein Bild hochladen, Prompts schreiben, dann sampeln und speichern. Er wird mit einem optionalen Lightning LoRA für ultraschnelle 4-Schritt-Bearbeitungen geliefert, sodass Sie schnell iterieren und den gewünschten Look festlegen können.
qwen_image_edit_fp8_e4m3fn.safetensors
in .qwen_2.5_vl_7b_fp8_scaled.safetensors
in .qwen_image_vae.safetensors
in .Qwen-Image-Lightning-4steps-V1.0.safetensors
auf .Der Graph lädt das Edit UNet mit UNETLoader
(#37), den Text-Encoder mit CLIPLoader
(#38) und den latenten Codec mit VAELoader
(#39). Wenn Sie schnellere Iterationen wünschen, aktivieren Sie das optionale LoraLoaderModelOnly
(#89), um das Lightning LoRA auf das Basismodell anzuwenden. ModelSamplingAuraFlow
(#66) und CFGNorm
(#75) bereiten den Sampler vor, damit das Qwen Image Edit Modell Prompts sauber folgt, ohne Details zu übertreiben.
Verwenden Sie LoadImage
(#78), um das Foto auszuwählen, das Sie bearbeiten möchten. Das Bild wird durch ImageScaleToTotalPixels
(#93) geleitet, um die Auflösung in einem qualitätsfreundlichen Bereich zu halten, was hilft, dass Qwen Image Edit Artefakte von sehr großen Eingaben vermeidet. VAEEncode
(#88) konvertiert Pixel in Latenten für effiziente Bearbeitung, während die Struktur erhalten bleibt.
Schreiben Sie Ihre Anweisung in TextEncodeQwenImageEdit
(#76) als positive Direktive. Beispiele sind "ersetze den Hintergrund durch eine Sonnenuntergangsstadtlandschaft", "entferne die Person im Hintergrund" oder "weiches goldenes Hauptlicht von links". Verwenden Sie den zweiten TextEncodeQwenImageEdit
(#77) als negativen Leitfaden, wenn Sie Änderungen vermeiden müssen, zum Beispiel "verändere das Gesicht des Subjekts nicht" oder "behalte die Farbe der Jacke". Beide Encoder sehen Ihr hochgeladenes Bild und das VAE, sodass die Konditionierung mit dem Inhalt übereinstimmt.
KSampler
(#3) führt die Bearbeitung mit dem gepatchten Modell und Ihrer Konditionierung durch. Wenn das Lightning LoRA aktiviert ist, können Sie mit sehr wenigen Schritten konvergieren; andernfalls verwenden Sie mehr Schritte für maximale Treue. Das bearbeitete Latent wird von VAEDecode
(#8) dekodiert und über SaveImage
(#60) auf die Festplatte geschrieben.
TextEncodeQwenImageEdit
(#76)Kodiert die Hauptanweisung, die die Bearbeitung antreibt. Bevorzugen Sie direkte Verben wie "ersetzen", "einfügen", "entfernen", "umfärben" und "neu beleuchten". Wenn die Änderung lokal sein soll, benennen Sie die Region oder das Objekt explizit. Halten Sie Prompts prägnant; lange Listen von Stil-Tags sind selten erforderlich.
TextEncodeQwenImageEdit
(#77)Bietet negative oder schützende Anleitungen. Verwenden Sie es, um dem Modell zu sagen, was es vermeiden soll oder um wichtige Attribute zu bewahren. Gute Muster: "behalte den Hautton", "verändere die Komposition nicht", "ignoriere den Hintergrundtext".
LoraLoaderModelOnly
(#89)Wendet das Qwen-Image-Lightning LoRA für schnelle Iterationen an. Schalten Sie es ein, wenn Sie nahezu sofortige Ergebnisse benötigen. Reduzieren Sie die Sampler-Schritte erheblich, wenn dieses LoRA aktiv ist, um scharfe Bearbeitungen aufrechtzuerhalten.
ImageScaleToTotalPixels
(#93)Skaliert übergroße Eingaben auf ein Ziel-Megapixel-Budget herunter, um die Qualität zu stabilisieren. Verwenden Sie es, wenn Ausgangsbilder sehr groß sind oder starke Kompression enthalten; es verbessert oft die Kantenglättung und reduziert Halos.
CFGNorm
(#75)Normalisiert das verhaltensfreie Anleitung, damit das Modell Prompts folgt, ohne Artefakte zu erzeugen. Wenn Sie Übersättigung oder "Überbearbeitung" sehen, verringern Sie die Stärke leicht; wenn Bearbeitungen schüchtern erscheinen, erhöhen Sie sie ein wenig.
KSampler
(#3)Führt die Diffusionsschleife aus. Beginnen Sie mit moderaten Schritten für fp8 und erhöhen Sie nur, wenn die Bearbeitung unvollständig ist. Halten Sie die Anleitung moderat; sehr hohe Werte können geschützte Regionen auswaschen. Wenn das Lightning LoRA aktiv ist, verwenden Sie sehr wenige Schritte, um den Geschwindigkeitsvorteil zu nutzen.
Dieser Workflow implementiert und baut auf den folgenden Arbeiten und Ressourcen auf. Wir danken QwenLM für Qwen-Image-Edit, QwenLM für Qwen-Image und ComfyOrg für ComfyUI Native Workflow Example für ihre Beiträge und Wartung. Für autoritative Details verweisen Sie bitte auf die unten verlinkte Originaldokumentation und Repositories.
Hinweis: Die Nutzung der referenzierten Modelle, Datensätze und Codes unterliegt den jeweiligen Lizenzen und Bedingungen der Autoren und Wartenden.
RunComfy ist die führende ComfyUI Plattform, die ComfyUI online Umgebung und Services bietet, zusammen mit ComfyUI Workflows mit atemberaubenden Visualisierungen. RunComfy bietet auch AI-Spielplatz, Künstlern ermöglichen, die neuesten AI-Tools zu nutzen, um unglaubliche Kunst zu schaffen.