Krea 2 style transfer ComfyUI workflow: estilo de imagem única, cenas totalmente novas#
Este fluxo de trabalho de transferência de estilo Krea 2 ComfyUI transfere a linguagem visual de uma imagem de referência para uma composição completamente nova. Mantém seu assunto e enquadramento frescos enquanto transporta textura, paleta e dicas de renderização de pôsteres, células de anime, aquarela, argila, pintura a óleo ou aparência fotográfica. É construído para RunComfy e combina Krea 2 Turbo com codificação de texto Qwen3-VL, Qwen Image VAE e um caminho de condicionamento Untwisting RoPE para captura de estilo confiável em uma única tentativa.
Os criadores obtêm um caminho eficiente para testar muitos estilos contra o mesmo prompt sem copiar e colar layouts de cena. A inversão RF do fluxo de trabalho, mais a pilha Untwisting RoPE, foca no estilo, não na estrutura, então suas imagens geradas permanecem novas em composição enquanto parecem pertencer à mesma família estética.
Modelos chave no fluxo de trabalho de transferência de estilo ComfyUI Krea 2#
- Krea 2 Turbo. O backbone de difusão usado para sintetizar a imagem alvo. Oferece geração rápida e de alta qualidade e fornece o espaço de características que a injeção de estilo modifica. Modelo card
- Codificador de texto Qwen3-VL 4B. Codifica seus prompts em vetores de condicionamento adequados para Krea 2, permitindo orientação fiel de conteúdo enquanto deixa espaço para transferência de estilo forte. Distribuído com o pacote Krea 2 Comfy. Repositório de pesos
- Qwen Image VAE. Lida com conversões de imagem para latente e de latente para imagem com fidelidade, o que é crítico ao extrair o estilo de referência e ao decodificar o resultado final. Repositório de pesos
Como usar o fluxo de trabalho de transferência de estilo ComfyUI Krea 2#
Em um nível alto, você carrega uma única referência de estilo, ajusta-a para a resolução alvo, codifica-a em latentes, extrai um sinal de estilo por meio da inversão RF, anexa esse sinal ao Krea 2 com Untwisting RoPE, e então amostra a partir de um latente fresco guiado pelo seu prompt. As seções abaixo seguem o caminho dominante desde as entradas até a visualização.
Carregar a referência de estilo (LoadImage (#612))#
Carregue uma imagem cujo visual você deseja transferir. Escolha uma moldura com estilo evidente, materiais claros, iluminação e cor para que a inversão tenha um sinal forte para aprender. Você pode reutilizar a mesma referência enquanto itera prompts para testar como o estilo se adapta a diferentes temas.
Ajustar a referência para a resolução alvo (ImageScaleToTotalPixelsX (#265))#
A referência é redimensionada usando o nó Avançado de Escala de Imagem para Total de Pixels para que as estatísticas de estilo correspondam à tela alvo. Isso ajuda a estabilizar a inversão RF e evita distorções quando o VAE codifica a referência. Se o seu alvo for quadrado ou cinematográfico, ajuste conforme necessário para que a proporção que você planeja gerar seja refletida aqui.
Codificar a referência em latentes (VAEEncode (#333))#
A referência redimensionada é codificada pelo Qwen Image VAE em uma representação latente. Manter o VAE consistente entre codificação e decodificação mantém a coerência de cor e textura. A reconstrução de alta fidelidade aqui rende dividendos na qualidade da transferência de estilo a jusante.
Codificar seus prompts (CLIPTextEncode (#607) e CLIPTextEncode (#259))#
Seu prompt alvo é codificado com o codificador de texto Qwen3-VL. O mesmo prompt pode opcionalmente ser alimentado no ramo de referência para a etapa de inversão, o que frequentemente melhora o alinhamento entre o estilo aprendido e a cena que você deseja renderizar. Se preferir, você pode dividir os prompts, mas usar o mesmo prompt alvo para ambos é uma boa prática padrão.
Extrair o sinal de estilo (RFInversion (#603))#
A inversão RF lê o latente de referência e o condicionamento do prompt para destilar um código de estilo compacto e um modelo base levemente adaptado. Isso enfatiza características de cor, material e traços, enquanto desprioriza identidade de layout e objeto. É o passo que transforma um único quadro em um descritor de estilo reutilizável.
Anexar estilo ao modelo (UntwistingRoPE (#623) com UnofficialExtensions (#632))#
Untwisting RoPE injeta o código de estilo no Krea 2 Turbo modulando a atenção através de uma faixa de blocos U-Net. O método reequilibra cuidadosamente a codificação posicional rotativa para que a transferência aja como uma sobreposição de visual em vez de um transplante de layout. O nó de extensões opcionais expõe controles extras usados pela mesma implementação. Referência: ComfyUi-Untwisting-RoPE.
Inicializar uma tela fresca (EmptyLatentImage (#634))#
Um latente em branco é criado com a largura e altura derivadas da sua referência redimensionada. Começar do ruído garante novas composições que não copiam o layout de referência. Isso preserva o espírito da transferência de estilo ao entregar uma cena original.
Amostrar a imagem (KSampler (#635) com ConditioningZeroOut (#636))#
A amostragem usa o modelo com estilo anexado e seu condicionamento positivo para desenhar uma nova imagem a partir do ruído. O condicionamento negativo é zerado por padrão para que o estilo possa dominar sem disputas sobre características de baixo nível. Amostradores no estilo SDE ou outros que adicionam ruído, como er_sde ou euler_ancestral, funcionam bem para reduzir artefatos de transferência ao longo da trajetória.
Decodificar e visualizar (VAEDecode (#262) e PreviewImage (#617))#
O latente final é decodificado pelo Qwen Image VAE de volta para RGB e exibido para revisão. Como o mesmo VAE é usado em ambos os sentidos, cores e texturas permanecem fiéis ao visual pretendido. Salve e itere mudando a semente ou o prompt para explorar o estilo em diferentes temas e enquadramentos.
Nós chave no fluxo de trabalho de transferência de estilo ComfyUI Krea 2#
RFInversion (#603)#
Função: aprende uma representação compacta do estilo da imagem de referência e retorna um modelo levemente adaptado, além de um latente de estilo. Aumente sua influência se o estilo parecer muito sutil, ou reduza se o estilo sobrecarregar a identidade do assunto. Baseado na implementação Untwisting RoPE para ComfyUI, que documenta os predefinições e comportamentos de inversão. Referência: ComfyUi-Untwisting-RoPE.
UntwistingRoPE (#623)#
Função: injeta o estilo aprendido no Krea 2 através de blocos U-Net selecionados enquanto compensa os efeitos posicionais rotatórios para que a estrutura permaneça nova. Ajuste o intervalo de blocos para ampliar ou estreitar onde o estilo se aplica, ajuste os parâmetros de escala para equilibrar aderência versus liberdade, e use o controle de normalização de instância adaptativa para elevar ou domar a transferência de paleta e material. Valores baixos de alinhamento de subespaço chave podem estabilizar detalhes finos se as bordas parecerem instáveis. Referência: ComfyUi-Untwisting-RoPE.
ImageScaleToTotalPixelsX (#265)#
Função: escala a referência de estilo para um orçamento de pixels alvo e proporção antes de codificar. Escolha um método de reamostragem como Lanczos para bordas nítidas, e forneça dimensões que correspondam ao seu tamanho de geração pretendido. Este alinhamento reduz aliasing no VAE e melhora a estabilidade do código de estilo. Referência: ComfyUi-Scale-Image-to-Total-Pixels-Advanced.
KSampler (#635)#
Função: realiza a trajetória de difusão usando o modelo com estilo anexado e seu condicionamento de prompt. Amostradores que adicionam ruído ao longo do caminho tendem a eliminar dicas de layout residual e entregar transferência de estilo mais limpa; experimente er_sde ou euler_ancestral. Passos moderados e uma escala de orientação equilibrada geralmente mantêm tanto o estilo quanto o conteúdo no caminho certo, enquanto preservam a variedade através da semente.
Extras opcionais#
- Comece com uma referência de estilo que mostre iluminação limpa, materiais fortes e pouca desordem.
- Use o mesmo prompt alvo tanto para o ramo de inversão quanto para o ramo principal para manter estilo e conteúdo em sincronia.
- Prefira amostradores SDE ou que adicionam ruído, como
er_sdeoueuler_ancestral, para reduzir artefatos de transferência. - Combine a proporção de aspecto da referência redimensionada com sua saída alvo, depois explore outras proporções uma vez que o estilo pareça certo.
- Se o resultado copiar o layout de referência, reduza a influência do estilo ou mova o estilo para um intervalo de blocos mais estreito em
UntwistingRoPE.
Recursos usados neste fluxo de trabalho de transferência de estilo Krea 2 ComfyUI:
- Cartão de modelo Krea 2 Turbo: Hugging Face
- Pacote de pesos Krea 2 Comfy, incluindo codificador de texto Qwen3-VL e Qwen Image VAE: Hugging Face
- Extensão ComfyUI Untwisting RoPE: GitHub
- Escala de Imagem para Total de Pixels Avançado: GitHub
Agradecimentos#
Este fluxo de trabalho implementa e se baseia nos seguintes trabalhos e recursos. Agradecemos krea pelo modelo Krea-2-Turbo, Comfy-Org pelos pesos do Krea-2 ComfyUI, BigStationW pelos nós personalizados do ComfyUI Untwisting RoPE e Scale Image to Total Pixels Advanced, e a comunidade r/StableDiffusion pelo primeiro lançamento e fonte do fluxo de trabalho. Para detalhes autoritativos, consulte a documentação original e os repositórios vinculados abaixo.
Recursos#
- Reddit/primeiro lançamento e fonte do fluxo de trabalho
- Docs / Notas de Lançamento: postagem no r/StableDiffusion
- krea/Krea-2-Turbo
- Hugging Face: krea/Krea-2-Turbo
- Comfy-Org/Krea-2
- Hugging Face: Comfy-Org/Krea-2
- BigStationW/ComfyUi-Untwisting-RoPE
- BigStationW/ComfyUi-Scale-Image-to-Total-Pixels-Advanced
Nota: O uso dos modelos, conjuntos de dados e código referenciados está sujeito às respectivas licenças e termos fornecidos por seus autores e mantenedores.









