Ce flux de travail apporte la puissance de FLUX.2 Dev à ComfyUI pour une génération texte-image haute fidélité et une édition d'image multi-références. Il est conçu pour les créateurs qui ont besoin de détails photoréalistes, d'une identité cohérente et d'une forte adhérence au prompt pour les prises de produit, les rendus de personnages, les visuels publicitaires et l'art conceptuel. Vous pouvez exécuter une branche standard ou une branche FP8 plus légère, maintenir les mises en page et les matériaux cohérents, et passer à des sorties multi-mégapixels.
Flux 2 Dev mélange des prompts précis avec un contrôle basé sur les références, vous permettant de maintenir la continuité du style et de la conception à travers les variations. Le graphique inclut des emplacements de référence prêts à l'emploi, une taille d'image flexible et un chemin d'échantillonnage personnalisé qui équilibre qualité et vitesse. Il fonctionne bien pour l'idéation itérative, la cohérence au niveau de la scène et des résultats de qualité production sur les GPU grand public.
Le graphique contient deux branches parallèles. "Image_flux2" est le chemin standard; "Image_flux2_fp8" est une variante plus légère qui remplace un encodeur de texte FP8 pour économiser la mémoire. Utilisez une branche à la fois du prompt à la sauvegarde. Les deux branches partagent la même logique générale : charger les modèles, créer un prompt, ajouter éventuellement une ou plusieurs images de référence, choisir la taille de l'image, échantillonner et sauvegarder.
Le flux de travail charge automatiquement le modèle de diffusion Flux 2 Dev, un encodeur de texte compatible Flux 2 Dev, et le Flux 2 VAE. Dans la branche standard, ceux-ci sont gérés par UNETLoader (#12), CLIPLoader (#38), et VAELoader (#10). Dans la branche FP8, ils sont reflétés par UNETLoader (#86), CLIPLoader (#90), et VAELoader (#70). Vous n'avez généralement pas besoin de les toucher à moins que vous ne souhaitiez échanger des poids.
Écrivez votre description dans CLIP Text Encode (Positive Prompt) (#6) ou (#85). De bons prompts nomment le sujet, la composition, les matériaux, l'éclairage, et le style souhaité (par exemple, lumière clé studio, ombres douces, plastique brillant, grande ouverture). Flux 2 Dev réagit bien aux noms clairs et aux balises de style concises et peut préserver les instructions de mise en page et la typographie lorsqu'elles sont énoncées sans ambiguïté. Gardez le prompt simple lorsque vous souhaitez que les images de référence dominent; devenez plus descriptif lorsque vous voulez un pilotage créatif plus fort.
Le support de référence est intégré pour que vous puissiez guider l'identité, le style, ou la continuité de la conception. Déposez des images dans les nœuds LoadImage, qui sont prétraités pour la taille, encodés en latents, et fusionnés dans le conditionnement via des nœuds ReferenceLatent enchaînés. Utilisez le modèle montré pour ajouter plus de références dans la branche FP8 (la mise en page s'adapte à de nombreuses références). Pour désactiver complètement les références, contournez tous les nœuds ReferenceLatent et vous obtenez un comportement pur texte-image.
L'échantillonnage est orchestré par SamplerCustomAdvanced avec un échantillonneur sélectionnable (KSamplerSelect) et le planificateur Flux 2. Un nœud RandomNoise fournit des graines déterministes pour la reproductibilité. Le planificateur pilote la trajectoire de débruitage tandis que le guide conditionne le modèle avec votre prompt et les latents de référence. Ce chemin est ajusté pour offrir des détails nets et une structure cohérente tout en restant interactif pour une itération rapide.
Les contrôles de largeur et de hauteur alimentent à la fois le planificateur et la toile latente afin que le modèle débruite à la résolution prévue. Flux 2 Dev cible confortablement 1–4 mégapixels; commencez plus petit pour le développement de look et augmentez l'échelle lorsque vous aimez le cadrage. Gardez le ratio d'aspect aligné avec votre sujet et les images de référence pour préserver la composition et les repères d'identité.
Après l'échantillonnage, les latents sont décodés par le VAE et écrits par SaveImage. Exécutez à nouveau avec la même graine pour une continuité à travers les prises, ou changez la graine pour des variations fraîches tout en préservant le même prompt et les références.
CLIP Text Encode (Positive Prompt) (#6, #85)Encode votre texte en embeddings à l'aide de l'encodeur de texte compatible Flux 2 Dev. Les noms forts et les termes clairs de matériel et d'éclairage offrent les indications les plus fiables. Si les références sont fortement utilisées, gardez les prompts concis pour qu'ils complètent plutôt qu'ils ne combattent les références.
FluxGuidance (#26, #75)Applique la force de conditionnement spécifique à Flux qui équilibre l'influence du prompt contre les a priori du modèle et les références. Augmentez la guidance pour une adhérence plus stricte au prompt; réduisez-la lorsque les images de référence doivent dominer. Ajustez par petits pas et réexécutez quelques graines pour confirmer la stabilité à travers les sorties.
ReferenceLatent (#39, #43, #83, #84)Injecte des latents de référence encodés dans le flux de conditionnement pour préserver les repères d'identité, de style ou de mise en page. Utilisez plusieurs références en enchaînant les nœuds selon le modèle existant. Contournez les nœuds individuels pour tester A/B la contribution de chaque référence ou pour passer entre les modes texte seul et multi-référence.
Flux2Scheduler (#48, #67)Crée le calendrier sigma adapté à Flux 2 Dev et à votre résolution choisie. Plus d'étapes échangent généralement la vitesse contre le détail et la stabilité. Associez les changements de calendrier avec des changements d'échantillonneur avec parcimonie pour que vous puissiez attribuer les améliorations à une variable à la fois.
KSamplerSelect (#16, #81)Sélectionne l'algorithme d'échantillonnage utilisé par l'échantillonneur personnalisé. Euler est un bon défaut pour une large gamme de sujets. Changez d'échantillonneurs uniquement lorsque vous cherchez un look ou un comportement spécifique; gardez les autres paramètres constants lors de la comparaison.
SamplerCustomAdvanced (#13, #80)Exécute la boucle de débruitage avec l'échantillonneur, le calendrier, le guide et la toile latente. Les leviers clés que vous revisiterez ici sont les steps, sampler, et la seed provenant du nœud de bruit. Lors de l'exploration d'une scène, changez seulement l'un de ces éléments à la fois pour comprendre son effet.
EmptyFlux2LatentImage (#47, #79)Définit la toile latente utilisée pour le débruitage à votre largeur et hauteur cibles. Les toiles plus grandes augmentent le détail mais augmentent également l'utilisation de la VRAM et le temps par image. Faites correspondre le ratio d'aspect de la toile à votre sujet pour des compositions plus naturelles.
Liens vers les poids et actifs officiels :
Ce flux de travail met en œuvre et s'appuie sur les travaux et ressources suivants. Nous remercions chaleureusement Comfy Org pour le support FLUX.2 Day-0 dans ComfyUI : Frontier Visual Intelligence pour leurs contributions et leur maintenance. Pour des détails autoritaires, veuillez vous référer à la documentation originale et aux référentiels liés ci-dessous.
Remarque : L'utilisation des modèles, ensembles de données et codes référencés est soumise aux licences et conditions respectives fournies par leurs auteurs et mainteneurs.
RunComfy est la première ComfyUI plateforme, offrant des ComfyUI en ligne environnement et services, ainsi que des workflows ComfyUI proposant des visuels époustouflants. RunComfy propose également AI Playground, permettant aux artistes d'utiliser les derniers outils d'IA pour créer des œuvres d'art incroyables.