Este fluxo de trabalho traz o poder do FLUX.2 Dev para o ComfyUI para geração de texto para imagem de alta fidelidade e edição de imagem com múltiplas referências. É adaptado para criadores que precisam de detalhes fotorealistas, identidade consistente e forte aderência a prompts para fotos de produtos, renderizações de personagens, visuais de publicidade e arte conceitual. Você pode executar um branch padrão ou um branch FP8 mais leve, manter layouts e materiais consistentes e escalar para saídas de múltiplos megapixels.
Flux 2 Dev combina prompts precisos com controle orientado por referências, para que você possa manter a continuidade de estilo e design em variações. O gráfico inclui slots de referência prontos para uso, dimensionamento de imagem flexível e um caminho de amostragem personalizado que equilibra qualidade e velocidade. Funciona bem para ideação iterativa, consistência em nível de cena e resultados de qualidade de produção em GPUs de consumo.
O gráfico contém dois branches paralelos. "Image_flux2" é o caminho padrão; "Image_flux2_fp8" é uma variante mais leve que troca um codificador de texto FP8 para economizar memória. Use um branch de cada vez, do prompt ao salvamento. Ambos os branches compartilham a mesma lógica geral: carregar modelos, criar um prompt, opcionalmente adicionar uma ou mais imagens de referência, escolher o tamanho da imagem, amostrar e salvar.
O fluxo de trabalho carrega automaticamente o modelo de difusão Flux 2 Dev, um codificador de texto compatível com Flux 2 Dev e o Flux 2 VAE. No branch padrão, estes são geridos por UNETLoader (#12), CLIPLoader (#38) e VAELoader (#10). No branch FP8, eles são espelhados por UNETLoader (#86), CLIPLoader (#90) e VAELoader (#70). Você normalmente não precisa mexer neles, a menos que queira trocar pesos.
Escreva sua descrição em CLIP Text Encode (Positive Prompt) (#6 ou #85). Bons prompts nomeiam o assunto, composição, materiais, iluminação e estilo desejado (por exemplo, luz chave de estúdio, sombras suaves, plástico brilhante, abertura ampla). Flux 2 Dev responde bem a substantivos claros e tags de estilo concisas e pode preservar instruções de layout e tipografia quando declaradas de forma inequívoca. Mantenha o prompt simples quando quiser que as imagens de referência dominem; seja mais descritivo quando quiser uma direção criativa mais forte.
O suporte a referências está embutido para que você possa guiar a identidade, estilo ou continuidade de design. Solte imagens nos nós LoadImage, que são pré-processadas para tamanho, codificadas em latentes e fundidas no condicionamento através de nós ReferenceLatent encadeados. Use o padrão mostrado para adicionar mais referências no branch FP8 (o layout escala para muitas referências). Para desativar completamente as referências, ignore todos os nós ReferenceLatent e você obterá um comportamento puro de texto para imagem.
A amostragem é orquestrada por SamplerCustomAdvanced com um amostrador selecionável (KSamplerSelect) e o agendador Flux 2. Um nó RandomNoise fornece sementes determinísticas para reprodutibilidade. O agendador dirige a trajetória de remoção de ruído enquanto o guia condiciona o modelo com seu prompt e latentes de referência. Este caminho é ajustado para entregar detalhes nítidos e estrutura consistente enquanto permanece interativo para iteração rápida.
Os controles de largura e altura alimentam tanto o agendador quanto a tela latente para que o modelo remova o ruído na resolução pretendida. Flux 2 Dev tem como alvo confortavelmente de 1 a 4 megapixels; comece menor para desenvolvimento de aparência e aumente quando gostar do enquadramento. Mantenha a proporção alinhada com seu assunto e imagens de referência para preservar pistas de composição e identidade.
Após a amostragem, os latentes são decodificados pelo VAE e escritos por SaveImage. Execute novamente com a mesma semente para continuidade entre tomadas ou altere a semente para novas variações enquanto preserva o mesmo prompt e referências.
CLIP Text Encode (Positive Prompt) (#6, #85)Codifica seu texto em embeddings usando o codificador de texto compatível com Flux 2 Dev. Substantivos fortes e termos claros de material e iluminação fornecem a orientação mais confiável. Se as referências forem muito usadas, mantenha os prompts concisos para que complementem, em vez de lutar contra as referências.
FluxGuidance (#26, #75)Aplica a força de condicionamento específica do Flux que equilibra a influência do prompt contra os modelos anteriores e referências. Aumente a orientação para uma aderência mais rigorosa ao prompt; reduza-a quando as imagens de referência devem dominar. Ajuste em pequenos passos e execute algumas sementes para confirmar a estabilidade entre saídas.
ReferenceLatent (#39, #43, #83, #84)Injeta latentes de referência codificados no stream de condicionamento para preservar pistas de identidade, estilo ou layout. Use várias referências encadeando nós seguindo o padrão existente. Ignore nós individuais para testar A/B a contribuição de cada referência ou para alternar entre modos de referência única e múltipla.
Flux2Scheduler (#48, #67)Cria o agendamento de sigma adaptado para Flux 2 Dev e sua resolução escolhida. Mais etapas geralmente trocam velocidade por detalhe e estabilidade. Combine mudanças de agendamento com mudanças de amostrador com moderação para que você possa atribuir melhorias a uma variável de cada vez.
KSamplerSelect (#16, #81)Seleciona o algoritmo de amostrador usado pelo amostrador personalizado. Euler é um padrão sólido para uma ampla gama de assuntos. Mude os amostradores apenas quando estiver buscando um visual ou comportamento específico; mantenha outras configurações constantes ao comparar.
SamplerCustomAdvanced (#13, #80)Executa o loop de remoção de ruído com o amostrador, agendamento, guia e tela latente. As alavancas principais que você revisitará aqui são steps, sampler e a seed vinda do nó de ruído. Ao explorar uma cena, mude apenas uma dessas de cada vez para entender seu efeito.
EmptyFlux2LatentImage (#47, #79)Define a tela latente usada para remoção de ruído na largura e altura alvo. Telas maiores aumentam o detalhe, mas também elevam o uso de VRAM e o tempo por imagem. Combine a proporção da tela ao seu assunto para composições mais naturais.
Links para pesos e ativos oficiais:
Este fluxo de trabalho implementa e constrói sobre os seguintes trabalhos e recursos. Agradecemos Comfy Org pelo suporte FLUX.2 Day-0 no ComfyUI: Frontier Visual Intelligence por suas contribuições e manutenção. Para detalhes autoritativos, consulte a documentação original e os repositórios vinculados abaixo.
Nota: O uso dos modelos, conjuntos de dados e código referenciados está sujeito às respectivas licenças e termos fornecidos por seus autores e mantenedores.
RunComfy é a principal ComfyUI plataforma, oferecendo ComfyUI online ambiente e serviços, juntamente com fluxos de trabalho do ComfyUI apresentando visuais impressionantes. RunComfy também oferece AI Playground, permitindo que artistas utilizem as mais recentes ferramentas de AI para criar arte incrível.