LongCat Image Edit Turbo: Schnelle promptgeführte Bildbearbeitung in ComfyUI#
LongCat Image Edit Turbo ist ein speziell entwickelter ComfyUI Arbeitsablauf für schnelle, promptgeführte Bearbeitungen, die Ihr Subjekt und die Komposition intakt halten. Es kombiniert das LongCat Image Edit Turbo Modell mit Qwen2.5-VL-Konditionierung und dem AE VAE, um Charakterneugestaltungen, maskenähnliche lokale Änderungen und filmische Beleuchtungsanpassungen in einer schnellen, iterativen Schleife zu liefern.
Entwickelt für Kreative und Power-User, akzeptiert dieser LongCat Image Edit Turbo Graph jedes Quellbild, interpretiert Ihre Bearbeitungsabsicht durch einen Vision-Language-Encoder und liefert hochauflösende Ergebnisse, die das ursprüngliche Framing bewahren. Es ist RunComfy-ready und optimiert für schnelle Vorschauen und kontrollierte Verfeinerung.
Wichtige Modelle im ComfyUI LongCat Image Edit Turbo Arbeitsablauf#
- LongCat Image Edit Turbo (bf16). Das Diffusionsmodell, das schnelle, kompositionsbewahrende Bildbearbeitungen ermöglicht und stark auf Textanweisungen reagiert. Model file
- Qwen2.5-VL 7B Text Encoder (FP8 skaliert, ComfyUI verpackt). Erzeugt reichhaltige Konditionierung, indem er sowohl Ihren Prompt als auch den visuellen Kontext aus dem Eingabebild versteht. Encoder file
- AE VAE (ae.safetensors). Rekonstruiert Bilder aus Latenten mit geringem Verlust, was LongCat Image Edit Turbo hilft, feine Details nach dem Sampling zu bewahren. VAE file
Wie man den ComfyUI LongCat Image Edit Turbo Arbeitsablauf benutzt#
Der Arbeitsablauf folgt einem klaren Pfad von Ihrem Bild und Prompt zu einem dekodierten Ergebnis. Die Phasen sind um einige entscheidende Komponenten organisiert, die Bearbeitungen schnell und stabil halten.
Laden und Vorbereiten Ihres Quellbildes#
- Importieren Sie Ihr Bild mit
LoadImage(#79). Der Graph leitet es durchFluxKontextImageScale(#64), um die Skalierung für robuste Bearbeitung zu standardisieren. - Das Bild setzt dann die Arbeitsfläche über
GetImageSize(#72) undEmptyLatentImage(#61), was LongCat Image Edit Turbo hilft, Komposition und Subjektplatzierung zu bewahren. - Diese Vorbereitung stellt sicher, dass nachfolgende Bearbeitungen wie intelligente, maskenähnliche Anpassungen wirken, anstatt einer umfassenden Neusynthese.
Kodieren Sie Ihre Bearbeitungsabsicht mit Qwen#
- Der Arbeitsablauf lädt den Qwen2.5-VL-Encoder mit
CLIPLoader(#19). - Beschreiben Sie die gewünschte Änderung in
TextEncodeQwenImageEditPlus (Positive)(#53). Verwenden Sie klare Stil-, Beleuchtungs- oder Attributhinweise, die LongCat Image Edit Turbo anwenden soll. - Verwenden Sie
TextEncodeQwenImageEditPlus (Negative)(#54), um Elemente aufzulisten, die vermieden oder geschützt werden sollen, was hilft, Identität und unerwünschte Änderungen zu bewahren. - Der Encoder liest sowohl Ihren Text als auch das Quellbild und erstellt eine bearbeitungsbewusste Konditionierung, die Änderungen an der ursprünglichen Szene verankert.
Formgebung von Führung und Referenzmischung#
FluxGuidance(#21) undFluxGuidance(#22) passen an, wie stark positive und negative Anweisungen das Ergebnis beeinflussen. Höhere Betonung führt zu stärkeren Bearbeitungen; niedrigere begünstigt subtile, kompositionssichere Anpassungen.FluxKontextMultiReferenceLatentMethod(#51) undFluxKontextMultiReferenceLatentMethod(#52) steuern, wie mehrere Referenzen gemischt werden, wenn Sie sich entscheiden, sie hinzuzufügen. Standardmäßig bleibt der als “DO NOT USE (LEAVE BYPASSED)” gekennzeichnete Hilfsuntergraph inaktiv; ersetzen Sie ihn durch Ihre eigenen Bildlader, wenn Sie zusätzliche Stil- oder Attributreferenzen wünschen.
Führen Sie den Sampler aus#
- Der LongCat Image Edit Turbo UNet wird von
UNETLoader(#18) geladen und für stabile Führung mitCFGNorm(#23) normalisiert. KSampler(#27) führt die eigentlichen Diffusionsschritte durch, die Ihre Absicht und den Kontext in ein neues Latent verwandeln. Beginnen Sie mit schnellen Iterationen für Vorschauen, dann verfeinern Sie Ihren Prompt oder die Führungsstärke nach Bedarf für die endgültige Qualität.- Halten Sie Bearbeitungen fokussiert auf ein einzelnes, klares Ziel pro Durchlauf für die vorhersehbarsten Ergebnisse.
Dekodieren und Exportieren#
- Der AE VAE wird über
VAELoader(#20) eingebracht und vonVAEDecode(#25) verwendet, um das Bild aus dem gesampelten Latent mit hoher Treue zu rekonstruieren. SaveImage(#9) schreibt das Ergebnis in Ihr Ausgabeverzeichnis mit einem klaren Präfix, was es einfach macht, Variationen über Läufe hinweg zu verfolgen.
Wichtige Knoten im ComfyUI LongCat Image Edit Turbo Arbeitsablauf#
TextEncodeQwenImageEditPlus (Positive)(#53). Wandelt Ihre gewünschte Änderung in eine bearbeitungsbewusste Konditionierung unter Verwendung von Qwen2.5-VL und dem Quellbild um. Konzentrieren Sie Ihren Prompt auf das Subjekt und die gewünschte Änderung, wie Outfit, Stimmung, Beleuchtung oder Material, um LongCat Image Edit Turbo ohne Abweichung der Szene zu leiten.TextEncodeQwenImageEditPlus (Negative)(#54). Schützt Identität und Komposition, indem spezifiziert wird, was vermieden werden soll. Verwenden Sie es, um Artefakte zu reduzieren oder unerwünschte Neugestaltungen zu verhindern, während die Szene kohärent bleibt.FluxGuidance(#21). Bestimmt, wie stark positive Anweisungen die Bearbeitung antreiben. Erhöhen für stärkere Neugestaltung oder dramatische Beleuchtung; verringern, um mehr vom ursprünglichen Look zu bewahren. Balancieren Sie dies mit der Detailgenauigkeit Ihres Prompts und der Anzahl der bereitgestellten Referenzen.FluxKontextMultiReferenceLatentMethod(#51). Bestimmt, wie mehrere Referenzen in die Konditionierung gemischt werden. Wählen Sie eine Methode, die Ihrem Ziel entspricht, z.B. stärkere Fusion für Stilübertragungen vs. leichtere Einflüsse für Attributanpassungen.CFGNorm(#23). Normalisiert das Führungsverhalten, sodass Änderungen über verschiedene Einstellungen hinweg konsistent bleiben. Es hilft LongCat Image Edit Turbo, stabil zu bleiben, wenn Sie Prompts iterieren oder Sampler wechseln.KSampler(#27). Das Herzstück der Generierung. Verwenden Sie es, um schnell zu iterieren, einen Seed für Reproduzierbarkeit zu fixieren und mit verschiedenen Samplern zu experimentieren, sobald Ihnen die Richtung gefällt. Passen Sie es im Tandem mitFluxGuidancean, um Bearbeitungsstärke gegen Treue zum Original abzuwägen.FluxKontextImageScale(#64). Bereitet das Eingabebild für nachgelagerte Knoten vor und skaliert es. Dieser Schritt ist entscheidend, um Framing und Proportionen während der Bearbeitung stabil zu halten.
Optionale Extras#
- Fügen Sie weitere Referenzen hinzu. Wenn Sie Multi-Image-Führung wünschen, ersetzen Sie den überbrückten Hilfsuntergraphen durch Ihre eigenen
LoadImage-Knoten und schließen Sie sie an die zusätzlichen Referenzeingänge der Qwen-Kodierknoten an. Dies ist nützlich für Stil- oder Garderobenübertragungen bei gleichzeitiger Beibehaltung von Pose und Layout. - Schnelle Iterationstipps. Beginnen Sie mit prägnanten Prompts, führen Sie eine schnelle Vorschau durch, dann verfeinern Sie die Formulierung oder die Führungsstärke. Verwenden Sie Seeds, um ein bevorzugtes Aussehen zu reproduzieren und kleine Variationen zu verzweigen.
- Lokalisierte Änderungen durch Formulierung. Geben Sie das Ziel klar an, z.B. „nur die Jacke in Rot ändern“ oder „sanftes Randlicht auf das Subjekt“, um maskenähnliche Bearbeitungen ohne explizite Maske zu steuern.
- GGUF-Variante. Für CPU- oder sehr niedrige VRAM-Szenarien können Sie zu quantisierten LongCat Image Edit Turbo-Gewichten mit
UnetLoaderGGUF(#77) wechseln. Siehe das GGUF-Paket für verfügbare Quantisierungen. Model variants
Danksagungen#
Dieser Arbeitsablauf implementiert und baut auf den folgenden Arbeiten und Ressourcen auf. Wir danken Comfy-Org für LongCat Image Edit Turbo und verwandte Komponenten, vantagewithai für LongCat Image Edit Turbo GGUF-Modelle und der Civitai-Community für den LongCat Image Edit Turbo Arbeitsablauf für ihre Beiträge und Wartung. Für autoritative Details verweisen wir auf die originale Dokumentation und die unten verlinkten Repositories.
Ressourcen#
- Civitai/Civitai Arbeitsablaufquelle
- Docs / Release Notes: Civitai model page
- Comfy-Org/LongCat Image Edit Turbo bf16 Modell
- Hugging Face: Comfy-Org/LongCat-Image
- vantagewithai/LongCat Image Edit Turbo GGUF Modelle
- Hugging Face: vantagewithai/LongCat-Image-Edit-Turbo-GGUF
- Comfy-Org/Qwen 2.5 VL Text Encoder
- Hugging Face: Comfy-Org/Qwen-Image_ComfyUI
- Comfy-Org/AE VAE
- Hugging Face: Comfy-Org/z_image_turbo
Hinweis: Die Nutzung der referenzierten Modelle, Datensätze und Codes unterliegt den jeweiligen Lizenzen und Bedingungen, die von ihren Autoren und Betreuern bereitgestellt werden.










