Dieser Workflow bringt Z Image Turbo in ComfyUI, sodass Sie hochauflösende, fotorealistische Bilder mit sehr wenigen Schritten und enger Prompt-Beachtung erzeugen können. Er ist für Kreative gedacht, die schnelle, konsistente Renderings für Konzeptkunst, Werbekompositionen, interaktive Medien und schnelles A/B-Testing benötigen.
Der Graph folgt einem klaren Pfad von Text-Prompts zu einem Bild: Er lädt das Z Image-Modell und unterstützende Komponenten, kodiert positive und negative Prompts, erstellt eine latente Leinwand, sampelt mit einem AuraFlow-Zeitplan, und dekodiert dann zu RGB zum Speichern. Das Ergebnis ist eine optimierte Z Image-Pipeline, die Geschwindigkeit ohne Detailverlust bevorzugt.
Auf hoher Ebene läuft der Pfad vom Prompt zur Konditionierung, durch Z Image-Sampling, dann Dekodierung zu einem Bild. Knoten sind in Stufen gruppiert, um den Betrieb einfach zu halten.
UNETLoader (#16), CLIPLoader (#18), VAELoader (#17)Diese Stufe lädt den Kern-Z Image Turbo-Checkpoint, den Text-Encoder und den Autoencoder. Wählen Sie den BF16-Checkpoint, wenn Sie ihn haben, da er Geschwindigkeit und Qualität für Verbraucher-GPUs ausbalanciert. Der CLIP-Stil-Encoder stellt sicher, dass Ihre Wortwahl die Szene und den Stil steuert. Der AE ist erforderlich, um Latents nach Beendigung des Samplings wieder in RGB zu konvertieren.
CLIP Text Encode (Positive Prompt) (#6) und CLIP Text Encode (Negative Prompt) (#7)Schreiben Sie, was Sie im positiven Prompt möchten, unter Verwendung konkreter Nomen, Stilhinweise, Kamerahints und Beleuchtung. Verwenden Sie den negativen Prompt, um häufige Artefakte wie Unschärfe oder unerwünschte Objekte zu unterdrücken. Wenn Sie ein Prompt-Präfix wie eine Anleitungsüberschrift aus einem offiziellen Beispiel sehen, können Sie es behalten, bearbeiten oder entfernen, und der Workflow wird dennoch funktionieren. Zusammen erzeugen diese Encoder die Konditionierung, die Z Image während des Samplings lenkt.
EmptySD3LatentImage (#13) und ModelSamplingAuraFlow (#11)Wählen Sie Ihre Ausgabegröße, indem Sie die latente Leinwand festlegen. Der Scheduler-Knoten schaltet das Modell auf eine AuraFlow-Stil-Sampling-Strategie um, die gut zu schritteffizienten destillierten Modellen passt. Dies hält Trajektorien bei niedrigen Schrittzahlen stabil, während feine Details erhalten bleiben. Sobald Leinwand und Zeitplan festgelegt sind, ist die Pipeline bereit zum Denoisen.
KSampler (#3)Dieser Knoten führt das eigentliche Denoising mit dem geladenen Z Image-Modell, dem ausgewählten Scheduler und Ihrer Prompt-Konditionierung durch. Passen Sie den Sampler-Typ und die Schrittzahl an, um bei Bedarf Geschwindigkeit gegen Details zu tauschen. Die Führungsskala steuert die Prompt-Stärke relativ zur vorherigen; moderate Werte bieten normalerweise die beste Balance zwischen Treue und kreativer Variation. Randomisieren Sie den Seed für die Erkundung oder fixieren Sie ihn für wiederholbare Ergebnisse.
VAEDecode (#8) und SaveImage (#9)Nach dem Sampling dekodiert der AE Latents zu einem Bild. Der Speicherknoten schreibt Dateien in Ihr Ausgabeverzeichnis, sodass Sie Iterationen vergleichen oder Ergebnisse in nachgelagerte Aufgaben einspeisen können. Wenn Sie planen, hochzuskalieren oder nachzubearbeiten, behalten Sie die Dekodierung in Ihrer gewünschten Arbeitsauflösung und exportieren Sie verlustfreie Formate für die beste Qualitätsbewahrung.
UNETLoader (#16)Lädt den Z Image Turbo-Checkpoint (z_image_turbo_bf16.safetensors). Verwenden Sie dies, um zwischen Präzisionsvarianten oder aktualisierten Gewichten zu wechseln, sobald sie verfügbar sind. Halten Sie das Modell konsistent während einer Sitzung, wenn Sie möchten, dass Seeds und Prompts vergleichbar bleiben. Das Ändern des Basismodells wird Aussehen, Farbantwort und Detailliertheit ändern.
ModelSamplingAuraFlow (#11)Setzt die Sampling-Strategie auf einen AuraFlow-Stil-Zeitplan, der für schnelle Konvergenz geeignet ist. Dies ist der Schlüssel, um Z Image bei niedrigen Schrittzahlen effizient zu machen, während Detail und Kohärenz erhalten bleiben. Wenn Sie später Zeitpläne austauschen, überprüfen Sie die Schrittzahlen und die Führung, um ähnliche Ausgabecharakteristika zu erhalten.
KSampler (#3)Steuert den Sampler-Algorithmus, Schritte, Führung und Seed. Verwenden Sie weniger Schritte für schnelle Ideenfindung und erhöhen Sie nur, wenn Sie mehr Mikrodetails oder strengere Prompt-Beachtung benötigen. Verschiedene Sampler bevorzugen unterschiedliche Looks; probieren Sie ein paar aus und halten Sie den Rest der Pipeline fixiert, wenn Sie Ergebnisse vergleichen.
CLIP Text Encode (Positive Prompt) (#6)Kodiert die kreative Absicht, die Z Image antreibt. Konzentrieren Sie sich auf Subjekt, Medium, Linse, Beleuchtung, Komposition und alle Marken- oder Designbeschränkungen. Kombinieren Sie dies mit dem negativen Prompt-Knoten, um das Bild in Richtung Ihres Ziel-Looks zu steuern und bekannte Artefakte zu filtern.
Dieser Workflow implementiert und baut auf den folgenden Arbeiten und Ressourcen auf. Wir danken Tongyi-MAI für Z-Image-Turbo für ihre Beiträge und Wartung. Für autoritative Details verweisen Sie bitte auf die originale Dokumentation und die unten verlinkten Repositories.
Hinweis: Die Verwendung der referenzierten Modelle, Datensätze und Codes unterliegt den jeweiligen Lizenzen und Bedingungen, die von ihren Autoren und Wartungsmitarbeitern bereitgestellt werden.
RunComfy ist die führende ComfyUI Plattform, die ComfyUI online Umgebung und Services bietet, zusammen mit ComfyUI Workflows mit atemberaubenden Visualisierungen. RunComfy bietet auch AI-Spielplatz, Künstlern ermöglichen, die neuesten AI-Tools zu nutzen, um unglaubliche Kunst zu schaffen.