FLUX é um novo modelo de geração de imagens desenvolvido por Black Forest Labs. Este modelo FLUX NF4 foi criado por lllyasviel, por favor visite este link para mais informações.
Os modelos FLUX estão pré-carregados no RunComfy, nomeados flux/flux-schnell
e flux/flux-dev
.
flux-schnell, fp8
e o clip t5_xxl_fp8
para evitar problemas de falta de memória.flux-dev, default
e um clip alto t5_xxl_fp16
.Para mais detalhes, visite: ComfyUI FLUX | A New Art Image Generation
FLUX NF4 é um checkpoint de modelo especializado projetado para a otimização de desempenho em fluxos de trabalho de Stable Diffusion. Desenvolvido pelo autor lllyasviel, este modelo utiliza quantização NF4 (Normal Float 4-bit) para melhorar significativamente a velocidade de inferência e reduzir o uso de memória em comparação com modelos tradicionais FP8 (Float 8-bit). FLUX NF4 faz parte de uma série de modelos destinados a aumentar a eficiência, particularmente em arquiteturas de GPU mais novas como a série NVIDIA RTX 3000 e 4000. O modelo inclui recursos avançados como "Distilled CFG Guidance", que refina o processo de geração de imagens com prompts mais precisos. Em uma GPU de alta gama como a RTX 4090, o modelo FLUX regular leva cerca de 50 segundos para gerar uma imagem, enquanto o FLUX NF4 leva apenas cerca de 13-14 segundos. Isso torna o FLUX NF4 acessível a uma gama mais ampla de usuários que podem não ter hardware de ponta.
Este nó carrega o modelo FLUX (flux/flux1-dev-bnb-nf4-v2.safetensors
). O modelo é responsável por orientar todo o processo de geração de imagens, fornecendo a estrutura subjacente que controla o comportamento e as características das imagens geradas.
Este nó gera um padrão de ruído aleatório, que serve como a entrada inicial para a geração de imagens. O ruído atua como o ponto de partida que será transformado em um resultado final.
O nó ModelSamplingFlux
ajusta o comportamento de amostragem do modelo com base na resolução e outros parâmetros. Ele otimiza a saída do modelo, garantindo que a qualidade da imagem seja mantida à medida que as transformações são aplicadas. Se preferir não ajustar o comportamento de amostragem, este nó pode ser ignorado.
Estes nós definem as dimensões da imagem (largura e altura), tipicamente definidas como 1024x1024. As dimensões especificadas influenciam a resolução e o nível de detalhe da imagem gerada.
Os nós CLIPTextEncode codificam prompts de texto em dados de condicionamento que orientam o processo de geração de imagens. Prompts positivos aumentam os recursos desejados, enquanto prompts negativos suprimem os indesejados, dando controle sobre o conteúdo e o estilo da saída.
O nó FluxGuidance
aplica uma escala de orientação (por exemplo, 3.5) aos dados de condicionamento. Esta escala ajusta a influência dos prompts de texto no resultado final, permitindo o ajuste fino da saída gerada.
Este nó gerencia o agendamento do processo de geração de imagens, controlando a transição do ruído para a imagem final. Os parâmetros de agendamento afetam a rapidez e a suavidade com que a imagem evolui durante a geração.
Este nó avançado de amostragem refina a imagem aplicando transformações adicionais à imagem latente. Ele integra o ruído, o orientador, o amostrador, as sigmas e os dados da imagem latente para produzir uma saída de alta qualidade.
O nó VAEDecode
decodifica a imagem latente em uma imagem visual real usando um VAE (Variational Autoencoder). Esta etapa é crucial para traduzir o espaço latente abstrato em uma imagem visível e interpretável.
O UpscaleModelLoader
carrega um modelo de ampliação (por exemplo, 4x-UltraSharp.pth
), e o nó UltimateSDUpscale
aplica este modelo para aumentar a resolução da imagem. Esta etapa garante que a imagem final seja nítida e detalhada, mesmo em resoluções mais altas.
Ver arquivos de licença:
flux/model_licenses/LICENSE-FLUX1-dev
flux/model_licenses/LICENSE-FLUX1-schnell
O Modelo FLUX.1 [dev] é licenciado pela Black Forest Labs. Inc. sob a Licença Não Comercial FLUX.1 [dev]. Direitos Autorais Black Forest Labs. Inc.
EM NENHUM CASO A BLACK FOREST LABS, INC. SERÁ RESPONSÁVEL POR QUALQUER REIVINDICAÇÃO, DANOS OU OUTRA RESPONSABILIDADE, SEJA EM UMA AÇÃO DE CONTRATO, DELITO OU DE OUTRA FORMA, DECORRENTE DE, OU EM CONEXÃO COM O USO DESTE MODELO.
RunComfy é a principal ComfyUI plataforma, oferecendo ComfyUI online ambiente e serviços, juntamente com fluxos de trabalho do ComfyUI apresentando visuais impressionantes. RunComfy também oferece AI Playground, permitindo que artistas utilizem as mais recentes ferramentas de AI para criar arte incrível.