ComfyUI>Workflows>ByteDance USO | Einheitlicher Stil- & Themen-Generator

ByteDance USO | Einheitlicher Stil- & Themen-Generator

Workflow Name: RunComfy/ByteDance-USO

Workflow ID: 0000...1286

Mit diesem Workflow können Sie nahtlose kreative Generationen erreichen, indem Sie sowohl Themen- als auch Stilkontrolle in einem einheitlichen Prozess kombinieren. Es ermöglicht Ihnen, Charaktere in verschiedene Szenen zu platzieren und dabei ihre Identität mit hoher Genauigkeit zu bewahren. Sie können auch verschiedene künstlerische Stile aus Referenzbildern anwenden, um einzigartige visuelle Effekte in Ihre Arbeit zu bringen. Das System bietet einen kombinierten Modus, der sowohl themen- als auch stilgesteuerte Führung in einem Setup vereint. Es ist darauf ausgelegt, scharfe, konsistente und flexible Ergebnisse für Kreative zu liefern, die Wert auf Präzision im Output legen. Dies macht es ideal für Designer, digitale Künstler und Inhaltsgestalter, die eine effiziente Kontrolle über ihre visuellen Inhalte suchen. Der Workflow rationalisiert Generationstasks, sodass Sie professionelle Bilderzeugung ohne komplexes Setup erreichen können.

ByteDance USO: Einheitlicher Stil- und Themen-Generierungsworkflow für ComfyUI

Dieser Workflow bringt ByteDance USO zu ComfyUI für Kreative, die identitätsgetreue Charaktere und präzisen Stiltransfer an einem Ort wünschen. Basierend auf FLUX.1-dev unterstützt es themengetriebene, stilgetriebene und kombinierte Generierung, sodass Sie einen Charakter in neue Szenen einfügen können, während die Ähnlichkeit gewahrt bleibt, Stile aus Referenzbildern anwenden oder beides gleichzeitig tun können.

Verwenden Sie ByteDance USO, wenn Sie starke Themenkohärenz mit flexibler, hochwertiger Stilkontrolle benötigen. Der Graph enthält zwei komplementäre Zweige: einen Themen+Stil-Pfad, der auf einem Identitätsbild basiert, und einen promptgesteuerten Pfad, der mit oder ohne Stilreferenzen verwendet werden kann. Beide Pfade speichern Bilder unabhängig, sodass Sie Ergebnisse schnell vergleichen können.

Schlüsselmodelle im Comfyui ByteDance USO-Workflow

FLUX.1-dev. Der Basistransformer für die Diffusion, der die Qualität und Geschwindigkeit der Generierung antreibt. Er bietet das Sampling-Rückgrat, das von ByteDance USO in diesem Workflow genutzt wird. Model card
ByteDance USO DiT LoRA v1. Ein Low-Rank-Adapter, der einheitliche Stil- und Themenfähigkeiten in FLUX.1-dev einführt, indem er Identitätsbewahrung und Stilführung in einem einheitlichen Setup ermöglicht. Dateien sind im USO 1.0 repack enthalten. Repository
USO FLUX.1 Projector v1. Ein Projektor-Patch, der CLIP-Vision-Funktionen mit dem Generierungsrückgrat verbindet, sodass Stil- und Themenhinweise das Modell effektiv lenken können. Inklusive im USO repack. Repository
SigCLIP Vision (patch14, 384). Der Vision-Encoder, der Einbettungen aus Ihren Stil- und Themenreferenzbildern extrahiert, die von den USO-Modulen für visuelle Führung verwendet werden. Repository

Wie man den Comfyui ByteDance USO-Workflow benutzt

Der Graph hat zwei Zweige, die unabhängig laufen können. Der obere Zweig verwendet ein Identitätsbild plus Stilreferenzen; der untere Zweig ist promptgesteuert und kann optional Stilreferenzen enthalten. Generieren Sie aus einem der Zweige oder beiden.

Schritt 1 – Modelle laden

Dieser Schritt initialisiert FLUX.1-dev, das ByteDance USO LoRA, den USO-Projektor und den SigCLIP-Vision-Encoder. Es bereitet das Basismodell für eine einheitliche Stil- und Themenführung vor. Beide Zweige laden dasselbe Set, sodass Sie Themen+Stil- oder Prompt-Workflows ausführen können, ohne Modelle neu zu konfigurieren. Sobald geladen, ist der Modellstrom bereit für USOs Referenzprozessoren.

Schritt 2 – Themen-/Identitätsbild

Stellen Sie ein sauberes Identitätsbild Ihres Charakters bereit. Der Workflow skaliert es auf eine geeignete Arbeitsgröße und kodiert es in ein Latent, das wichtige Gesichts- oder Charaktermerkmale bewahrt. Dieses Latent wird mit Ihrem Prompt verschmolzen, sodass ByteDance USO das Thema in neue Szenen einfügen kann und dabei die Identität bewahrt. Lassen Sie diesen Schritt aus, wenn Sie nur Stil- oder Textgenerierung wünschen.

Schritt 3 – Stilreferenz

Fügen Sie ein oder zwei Stilbilder hinzu, um Palette, Materialien und Pinselstriche zu leiten. Jedes Bild wird mit dem Vision-Modell kodiert und durch USOs Stilreferenzknoten angewendet, die Stileinflüsse auf das geladene Modell schichten. Die Reihenfolge ist wichtig, wenn Sie zwei Referenzen verwenden, da die zweite Referenz nach der ersten angewendet wird. Sie können diese Gruppe umgehen, um einen reinen themengetriebenen oder textbasierten Durchlauf zu starten.

Prompt

Schreiben Sie einen absichtsgetriebenen Prompt für Komposition, Stimmung und Details. Im Themen+Stil-Zweig wird Ihr Prompt mit dem Identitätslatent und USOs Führung kombiniert, sodass Text, Thema und Stil in die gleiche Richtung ziehen. Im promptgesteuerten Zweig lenkt der Text allein (optional mit Stilreferenzen) das Bild. Halten Sie Prompts spezifisch; vermeiden Sie Widersprüche zum gewählten Stil.

Bildgröße

Wählen Sie die Zielauflösung für die Generierung. Die gewählte Größe beeinflusst die Komposition und Detaildichte, insbesondere bei Porträts im Vergleich zu Ganzkörperaufnahmen. Wenn VRAM begrenzt ist, beginnen Sie kleiner und skalieren Sie später hoch. Beide Zweige bieten einen einfachen Bildgrößenknoten, sodass Sie Aspekt und Detailtreue an Ihren Anwendungsfall anpassen können.

Sampling und Ausgabe

Jeder Zweig sampelt mit einem Standardsampler, dekodiert zu RGB und speichert in seiner eigenen Ausgabe. Sie erhalten typischerweise zwei Bilder pro Lauf: ein gestyltes Themenresultat und ein promptgesteuertes Ergebnis. Iterieren Sie, indem Sie den Prompt anpassen oder Referenzen austauschen; resampeln Sie, um Alternativen zu erkunden oder fixieren Sie den Seed für Wiederholbarkeit.

Schlüsselnoten im Comfyui ByteDance USO-Workflow

`USOStyleReference` (#56)

Wendet ein Stilbild auf den aktuellen Modellstrom an, indem der USO-Projektor und CLIP-Vision-Funktionen verwendet werden. Verwenden Sie eine Referenz für einen starken, kohärenten Look oder verketten Sie zwei für nuancierte Mischungen; die zweite Referenz verfeinert die erste. Wenn der Stil zu stark dominiert, versuchen Sie eine einzelne, sauberere Referenz oder vereinfachen Sie deren Inhalt.

`ReferenceLatent` (#44)

Injiziert das kodierte Themenlatente in den Konditionierungspfad, sodass ByteDance USO die Identität bewahrt. Funktioniert am besten mit übersichtlichen Identitätsfotos, die das Gesicht oder die charakteristischen Merkmale der Figur klar zeigen. Wenn die Identität abgleitet, geben Sie eine vollständigere Referenz an oder reduzieren Sie widersprüchliche Stilhinweise.

`FluxKontextMultiReferenceLatentMethod` (#41)

Kombiniert mehrere Referenzsignale im FLUX-Kontextpfad. Hier werden Thema und Prompt-Kontext vor dem Sampling ausbalanciert. Wenn Ergebnisse übermäßig eingeschränkt wirken, lockern Sie die Referenzen; wenn sie abdriften, verstärken Sie die Themenbilder oder vereinfachen Sie den Prompt.

`FluxGuidance` (#35)

Steuert die Stärke der Textführung relativ zu den Referenzsignalen. Niedrigere Werte lassen Thema/Stil führen; höhere Werte erzwingen den Prompt stärker. Passen Sie an, wenn Sie entweder Promptunteranpassung (Führung erhöhen) oder Stil/Thema überschrieben sehen (Führung senken).

`ImageScaleToMaxDimension` (#109)

Bereitet das Identitätsbild für stabile Merkmalextraktion vor. Kleinere Maximalgrößen begünstigen breitere Kompositionen; größere Größen helfen, wenn die Referenz ein enges Porträt ist und Sie klarere Identitätshinweise benötigen. Passen Sie basierend darauf an, ob Ihre Themenreferenz Ganzkörper oder ein Kopfporträt ist.

`EasyCache` (#95)

Beschleunigt die Inferenz, indem Zwischenzustände bei kleinen Änderungen wiederverwendet werden. Ideal für Promptanpassungen und schnelle Iterationen, kann aber Mikrodetails leicht reduzieren. Deaktivieren Sie es für endgültige, qualitativ hochwertigste Renderings.

`KSampler` (#31)

Führt die Diffusionsschritte aus und steuert die Stochastizität über Seed und Samplerwahl. Erhöhen Sie die Schritte für mehr Details oder sperren Sie den Seed, um einen Look zu reproduzieren, während Sie Referenzen ändern. Wenn Texturen rauschig aussehen, versuchen Sie einen anderen Sampler oder weniger Schritte mit stärkerer Stilführung.

Optionale Extras

Für ByteDance USO-Identitätsarbeit bevorzugen Sie neutrale, gleichmäßig beleuchtete Themenbilder; vermeiden Sie starkes Make-up oder extreme Winkel, die mit Stilhinweisen in Konflikt geraten können.
Wenn Sie zwei Stilreferenzen stapeln, platzieren Sie die breitere Ästhetik zuerst und die Textur-/Detailreferenz als zweite, um zu verfeinern, ohne die Identität zu überlagern.
Halten Sie negatives Prompting minimal; der Graph verwendet absichtlich einen neutralen negativen Pfad, sodass USOs gelernte Prioritäten und Referenzen sauber ausgerichtet sind.
Iterieren Sie schnell bei niedrigerer Auflösung oder mit aktiviertem Caching, dann deaktivieren Sie das Caching und skalieren Sie Ihre bevorzugten Seeds für Endversionen hoch.
Verwenden Sie reproduzierbare Seeds beim Vergleich von Themen-, Stil- und Kombinationsmodi, um zu verstehen, wie ByteDance USO jedes Signal ausbalanciert.

Danksagungen

Dieser Workflow implementiert und baut auf den folgenden Arbeiten und Ressourcen auf. Wir danken ByteDance für das USO-Modell und dem ComfyUI-Team für das ByteDance USO ComfyUI Native Workflow-Tutorial für ihre Beiträge und Wartung. Für autoritative Details verweisen wir auf die originale Dokumentation und die unten verlinkten Repositories.

Ressourcen

ByteDance/USO
- GitHub: bytedance/USO
- Hugging Face: bytedance-research/USO
- arXiv: 2508.18966
- Docs / Release Notes: ByteDance USO Documentation

Hinweis: Die Nutzung der referenzierten Modelle, Datensätze und Codes unterliegt den jeweiligen Lizenzen und Bedingungen der Autoren und Verwalter.

Want More ComfyUI Workflows?

Flux Konsistente Charaktere | Eingabebild

Erstellen Sie konsistente Charaktere und stellen Sie sicher, dass sie mit Ihren Bildern einheitlich aussehen.

DreamO | Vereinheitlichtes Multi-Task Bildanpassungs-Framework

Führen Sie Identitäts-, Stil-, Anprobier- und Mehrbedingungs-Bilderzeugung aus 1–3 Referenzen durch

Flux Kontext 360 Grad LoRA

Erzeugen Sie immersive 360-Grad-Bilder mit Tiefen- und Raumkontrolle.

PuLID | Präzises Gesichts-Embedding für Text-zu-Bild

Integrieren Sie Gesichtsidentitäten nahtlos und kontrollieren Sie Stile mit PuLID und IPAdapter Plus.

ICEdit | Schnelle KI-Bildbearbeitung mit Nunchaku

ICEdit+Nunchaku: Eine Lösung für ultraschnelle, präzise KI-Bildbearbeitung.

Konstante Charaktere mit Flux

Vereinfachen Sie die Erstellung von KI-Charakteren und sorgen Sie für einheitliche Erscheinungen.

Flux Fill | Inpaint und Outpaint

Offizielle Flux Tools - Flux Fill für Inpainting und Outpainting

AnimateDiff + QR Code ControlNet | Visuelle Effekte (VFX)

Erstellen Sie fesselnde visuelle Effekte mit AnimateDiff und ControlNet (mit QRCode Monster und Lineart).

Support

Ressourcen

Rechtliches

RunComfy

RunComfy ist die führende ComfyUI Plattform, die ComfyUI online Umgebung und Services bietet, zusammen mit ComfyUI Workflows mit atemberaubenden Visualisierungen. RunComfy bietet auch AI-Spielplatz, Künstlern ermöglichen, die neuesten AI-Tools zu nutzen, um unglaubliche Kunst zu schaffen.

ByteDance USO | Einheitlicher Stil- & Themen-Generator

ByteDance USO: Einheitlicher Stil- und Themen-Generierungsworkflow für ComfyUI

Schlüsselmodelle im Comfyui ByteDance USO-Workflow

Wie man den Comfyui ByteDance USO-Workflow benutzt

Schritt 1 – Modelle laden

Schritt 2 – Themen-/Identitätsbild

Schritt 3 – Stilreferenz

Prompt

Bildgröße

Sampling und Ausgabe

Schlüsselnoten im Comfyui ByteDance USO-Workflow

USOStyleReference (#56)

ReferenceLatent (#44)

FluxKontextMultiReferenceLatentMethod (#41)

FluxGuidance (#35)

ImageScaleToMaxDimension (#109)

EasyCache (#95)

KSampler (#31)

Optionale Extras

Danksagungen

Ressourcen

Want More ComfyUI Workflows?

Flux Konsistente Charaktere | Eingabebild

DreamO | Vereinheitlichtes Multi-Task Bildanpassungs-Framework

Flux Kontext 360 Grad LoRA

PuLID | Präzises Gesichts-Embedding für Text-zu-Bild

ICEdit | Schnelle KI-Bildbearbeitung mit Nunchaku

Konstante Charaktere mit Flux

Flux Fill | Inpaint und Outpaint

AnimateDiff + QR Code ControlNet | Visuelle Effekte (VFX)

`USOStyleReference` (#56)

`ReferenceLatent` (#44)

`FluxKontextMultiReferenceLatentMethod` (#41)

`FluxGuidance` (#35)

`ImageScaleToMaxDimension` (#109)

`EasyCache` (#95)

`KSampler` (#31)