ComfyUI>Workflows>ByteDance USO | Générateur de style et de sujet unifié

ByteDance USO | Générateur de style et de sujet unifié

Workflow Name: RunComfy/ByteDance-USO

Workflow ID: 0000...1286

Avec ce flux de travail, vous pouvez réaliser une génération créative sans faille en combinant le contrôle du sujet et du style dans un processus unifié. Il vous permet de placer des personnages dans différentes scènes tout en préservant leur identité avec une grande précision. Vous pouvez également appliquer divers styles artistiques à partir d'images de référence pour apporter des effets visuels uniques à votre travail. Le système offre un mode combiné qui fusionne à la fois les directives basées sur le sujet et celles basées sur le style dans un seul paramétrage. Il est conçu pour fournir des résultats nets, cohérents et flexibles pour les créateurs qui valorisent la précision des sorties. Cela le rend idéal pour les designers, artistes numériques et créateurs de contenu cherchant un contrôle efficace sur leurs visuels. Le flux de travail rationalise les tâches de génération afin que vous puissiez obtenir des images de qualité professionnelle sans configuration complexe.

ByteDance USO : Flux de travail de génération de style et de sujet unifié pour ComfyUI

Ce flux de travail apporte ByteDance USO à ComfyUI pour les créateurs qui souhaitent des personnages fidèles à leur identité et un transfert de style précis en un seul endroit. Construit sur FLUX.1‑dev, il prend en charge la génération basée sur le sujet, le style, et combinée, afin que vous puissiez placer un personnage dans de nouvelles scènes tout en conservant sa ressemblance, appliquer des styles à partir d'images de référence, ou faire les deux à la fois.

Utilisez ByteDance USO lorsque vous avez besoin d'une forte cohérence du sujet avec un contrôle de style flexible et de haute qualité. Le graphe comprend deux branches complémentaires : un chemin sujet+style qui se conditionne sur une image d'identité, et un chemin piloté par des invites qui peuvent être utilisés avec ou sans références de style. Les deux chemins enregistrent les images indépendamment afin que vous puissiez comparer rapidement les résultats.

Modèles clés dans le flux de travail Comfyui ByteDance USO

FLUX.1‑dev. Le transformateur de diffusion de base qui alimente la qualité et la vitesse de génération. Il fournit l'épine dorsale d'échantillonnage utilisée par ByteDance USO dans ce flux de travail. Carte du modèle
ByteDance USO DiT LoRA v1. Un adaptateur de bas rang qui injecte des capacités de style et de sujet unifiés dans FLUX.1‑dev, permettant la préservation de l'identité et l'orientation de style dans un paramétrage unifié. Les fichiers sont fournis dans le repack USO 1.0. Répertoire
USO FLUX.1 Projector v1. Un patch de projecteur qui connecte les caractéristiques CLIP‑Vision à l'épine dorsale de génération afin que les indices de style et de sujet puissent orienter le modèle efficacement. Inclus avec le repack USO. Répertoire
SigCLIP Vision (patch14, 384). L'encodeur de vision qui extrait des embeddings de vos images de référence de style et de sujet, utilisé par les modules USO pour l'orientation visuelle. Répertoire

Comment utiliser le flux de travail Comfyui ByteDance USO

Le graphe a deux branches qui peuvent fonctionner indépendamment. La branche supérieure utilise une image d'identité plus des références de style; la branche inférieure est guidée par des invites et peut inclure des références de style en option. Générez à partir de l'une ou l'autre branche ou des deux.

Étape 1 – Charger les modèles

Cette étape initialise FLUX.1‑dev, le ByteDance USO LoRA, le projecteur USO, et l'encodeur de vision SigCLIP. Elle prépare le modèle de base pour l'orientation unifiée du style et du sujet. Les deux branches chargent le même ensemble afin que vous puissiez exécuter des flux de travail sujet+style ou d'invite sans reconfigurer les modèles. Une fois chargés, le flux de modèle est prêt pour les processeurs de référence de l'USO.

Étape 2 – Image de sujet/identité

Fournissez une image d'identité propre de votre personnage. Le flux de travail la redimensionne à une taille de travail appropriée et la code en un latent qui préserve les caractéristiques faciales ou de personnage clés. Ce latent est fusionné avec votre invite afin que ByteDance USO puisse placer le sujet dans de nouvelles scènes tout en conservant l'identité. Omettez cette étape si vous souhaitez une génération uniquement de style ou uniquement de texte.

Étape 3 – Référence de style

Ajoutez une ou deux images de style pour guider la palette, les matériaux, et le travail au pinceau. Chaque image est codée avec le modèle de vision et appliquée à travers les nœuds de référence de style de l'USO, qui superposent les influences de style sur le modèle chargé. L'ordre est important lors de l'utilisation de deux références, car la deuxième référence est appliquée après la première. Vous pouvez contourner ce groupe pour exécuter un passage purement piloté par le sujet ou uniquement par le texte.

Invite

Rédigez une invite axée sur l'intention pour la composition, l'ambiance, et les détails. Dans la branche sujet+style, votre invite est combinée avec le latent d'identité et l'orientation de l'USO afin que le texte, le sujet, et le style aillent dans la même direction. Dans la branche pilotée par l'invite, le texte seul (éventuellement avec des références de style) oriente l'image. Gardez les invites spécifiques; évitez de contredire le style choisi.

Taille d'image

Choisissez la résolution cible pour la génération. La taille choisie influence la compacité de la composition et la densité des détails, en particulier pour les portraits par rapport aux plans en pied. Si la VRAM est limitée, commencez plus petit et augmentez plus tard. Les deux branches exposent un nœud de taille d'image simple afin que vous puissiez adapter l'aspect et la fidélité à votre cas d'utilisation.

Échantillonnage et sortie

Chaque branche échantillonne avec un échantillonneur standard, décode en RGB, et enregistre dans sa propre sortie. Vous obtiendrez généralement deux images par exécution : un résultat de sujet stylisé et un résultat guidé par l'invite. Itérez en ajustant l'invite ou en échangeant les références; rééchantillonnez pour explorer des alternatives ou fixez la graine pour la répétabilité.

Nœuds clés dans le flux de travail Comfyui ByteDance USO

`USOStyleReference` (#56)

Applique une image de style au flux de modèle actuel en utilisant le projecteur USO et les caractéristiques CLIP‑Vision. Utilisez une référence pour un look fort et cohérent ou enchaînez-en deux pour des mélanges nuancés; la deuxième référence affine la première. Si le style domine trop, essayez une référence unique et plus propre ou simplifiez son contenu.

`ReferenceLatent` (#44)

Injecte le latent de sujet encodé dans le chemin de conditionnement afin que ByteDance USO préserve l'identité. Fonctionne mieux avec des photos d'identité non encombrées qui montrent clairement le visage du personnage ou les caractéristiques déterminantes. Si l'identité glisse, fournissez une référence plus complète ou réduisez les indices de style conflictuels.

`FluxKontextMultiReferenceLatentMethod` (#41)

Combine plusieurs signaux de référence dans le chemin contextuel FLUX. C'est là que le contexte du sujet et de l'invite est équilibré avant l'échantillonnage. Si les résultats semblent trop contraints, relâchez les références; s'ils dérivent, renforcez les images de sujet ou simplifiez l'invite.

`FluxGuidance` (#35)

Contrôle la force de l'orientation textuelle par rapport aux signaux de référence. Des valeurs plus basses laissent le sujet/style mener; des valeurs plus élevées renforcent davantage l'invite. Ajustez lorsque vous voyez soit une sous-adaptation de l'invite (augmentez l'orientation) soit un dépassement du style/sujet (réduisez l'orientation).

`ImageScaleToMaxDimension` (#109)

Prépare l'image d'identité pour l'extraction de caractéristiques stables. Les tailles maximales plus petites favorisent une composition plus large; les tailles plus grandes aident lorsque la référence est un portrait serré et que vous avez besoin d'indices d'identité plus nets. Ajustez selon que votre référence de sujet est en pied ou un portrait.

`EasyCache` (#95)

Accélère l'inférence en réutilisant les états intermédiaires lorsque les changements sont mineurs. Idéal pour les ajustements d'invite et l'itération rapide, mais cela peut légèrement réduire les micro-détails. Désactivez-le pour les rendus finaux de la plus haute qualité.

`KSampler` (#31)

Exécute les étapes de diffusion et contrôle la stochasticité via le choix de la graine et de l'échantillonneur. Augmentez les étapes pour plus de détails, ou verrouillez la graine pour reproduire un look tout en changeant les références. Si les textures semblent bruyantes, essayez un échantillonneur différent ou moins d'étapes avec une orientation de style plus forte.

Extras optionnels

Pour le travail d'identité ByteDance USO, préférez des images de sujet neutres, uniformément éclairées; évitez le maquillage lourd ou les angles extrêmes qui peuvent entrer en conflit avec les indices de style.
Lors de l'empilement de deux références de style, placez d'abord l'esthétique plus large et la référence de texture/détail ensuite pour affiner sans dominer l'identité.
Gardez le 'negative prompting' minimal; le graphe utilise intentionnellement un chemin négatif neutre afin que les priorités apprises de l'USO et les références s'alignent proprement.
Itérez rapidement à une résolution inférieure ou avec la mise en cache activée, puis désactivez la mise en cache et augmentez vos graines préférées pour les finales.
Utilisez des graines reproductibles lors de la comparaison des modes uniquement sujet, uniquement style, et combiné pour comprendre comment ByteDance USO équilibre chaque signal.

Remerciements

Ce flux de travail met en œuvre et s'appuie sur les travaux et ressources suivants. Nous remercions chaleureusement ByteDance pour le modèle USO et l'équipe ComfyUI pour le tutoriel ByteDance USO ComfyUI Native Workflow pour leurs contributions et leur maintenance. Pour des détails autorisés, veuillez consulter la documentation originale et les répertoires liés ci-dessous.

Ressources

ByteDance/USO
- GitHub: bytedance/USO
- Hugging Face: bytedance-research/USO
- arXiv: 2508.18966
- Docs / Release Notes: ByteDance USO Documentation

Note: L'utilisation des modèles, ensembles de données, et code référencés est soumise aux licences et conditions respectives fournies par leurs auteurs et mainteneurs.

Want More ComfyUI Workflows?

Flux Consistent Characters | Input Image

Créez des personnages cohérents et assurez-vous qu'ils paraissent uniformes en utilisant vos images.

DreamO | Cadre Unifié de Personnalisation d'Image Multi-Tâches

Effectuez la génération d'image d'identité, de style, d'essayage, et multi-condition à partir de 1 à 3 références

Flux Kontext 360 Degree LoRA

Générez des images immersives de style 360 avec profondeur et contrôle spatial.

CCSR | Outil de mise à l'échelle cohérente d'images/vidéos

Le modèle CCSR améliore la mise à l'échelle des images et des vidéos en se concentrant davantage sur la cohérence du contenu.

AnimateDiff + Dynamic Prompts | Texte vers Vidéo

Utilisez Dynamic Prompts (Wildcards), Animatediff et IPAdapter pour générer des animations dynamiques ou des GIF.

ToonCrafter | Interpolation Générative de Dessins Animés

ToonCrafter peut générer des interpolations de dessins animés entre deux images de dessins animés.

Segment Anything V2 (SAM2) | Segmentation Vidéo

Segmentation d'objets dans les vidéos avec une précision inégalée.

Software Soap Créatif

Combinez IPAdapter et ControlNet pour une application de texture efficace et des visuels améliorés.

Support

Ressources

Légal

RunComfy

RunComfy est la première ComfyUI plateforme, offrant des ComfyUI en ligne environnement et services, ainsi que des workflows ComfyUI proposant des visuels époustouflants. RunComfy propose également AI Playground, permettant aux artistes d'utiliser les derniers outils d'IA pour créer des œuvres d'art incroyables.

ByteDance USO | Générateur de style et de sujet unifié

ByteDance USO : Flux de travail de génération de style et de sujet unifié pour ComfyUI

Modèles clés dans le flux de travail Comfyui ByteDance USO

Comment utiliser le flux de travail Comfyui ByteDance USO

Étape 1 – Charger les modèles

Étape 2 – Image de sujet/identité

Étape 3 – Référence de style

Invite

Taille d'image

Échantillonnage et sortie

Nœuds clés dans le flux de travail Comfyui ByteDance USO

USOStyleReference (#56)

ReferenceLatent (#44)

FluxKontextMultiReferenceLatentMethod (#41)

FluxGuidance (#35)

ImageScaleToMaxDimension (#109)

EasyCache (#95)

KSampler (#31)

Extras optionnels

Remerciements

Ressources

Want More ComfyUI Workflows?

Flux Consistent Characters | Input Image

DreamO | Cadre Unifié de Personnalisation d'Image Multi-Tâches

Flux Kontext 360 Degree LoRA

CCSR | Outil de mise à l'échelle cohérente d'images/vidéos

AnimateDiff + Dynamic Prompts | Texte vers Vidéo

ToonCrafter | Interpolation Générative de Dessins Animés

Segment Anything V2 (SAM2) | Segmentation Vidéo

Software Soap Créatif

`USOStyleReference` (#56)

`ReferenceLatent` (#44)

`FluxKontextMultiReferenceLatentMethod` (#41)

`FluxGuidance` (#35)

`ImageScaleToMaxDimension` (#109)

`EasyCache` (#95)

`KSampler` (#31)