O projeto In-Context LoRA (IC-LoRA), desenvolvido por Lianghua Huang, Wei Wang, Zhi-Fan Wu e seus colaboradores no Tongyi Lab, representa uma abordagem inovadora para geração de imagens independentes de tarefa usando transformadores de difusão (DiTs). Seu framework inovador aproveita as capacidades de geração em contexto dos DiTs introduzindo um ajuste mínimo e um pipeline simplificado, permitindo um ajuste específico de tarefa eficiente com pequenos conjuntos de dados. Para saber mais sobre seu trabalho e acessar seus recursos, visite o repositório oficial no .
In-Context LoRA (IC-LoRA) é um framework poderoso e flexível que permite que modelos existentes de transformadores de difusão de texto para imagem realizem uma ampla variedade de tarefas de geração de imagens com treinamento adicional mínimo. A ideia principal por trás do In-Context LoRA é aproveitar as capacidades inerentes de aprendizado em contexto desses modelos fornecendo-lhes dados de treinamento cuidadosamente selecionados e usando uma abordagem de ajuste fino simples, mas eficaz.
Aqui está como o In-Context LoRA funciona em poucas palavras:
A beleza do In-Context LoRA é que é um framework independente de tarefa. A mesma abordagem pode ser aplicada a uma ampla gama de tarefas, como geração de storyboard, design de fontes, design de produtos, efeitos visuais e muito mais. Ao fornecer dados de treinamento específicos da tarefa, o IC-LoRA pode se adaptar a cada tarefa sem exigir qualquer alteração na arquitetura do modelo em si.
Tarefa | Modelo | Configurações Recomendadas | Exemplo de Prompt |
---|---|---|---|
1. Design de Perfil de Casal | couple-profile.safetensors | largura: 2048, altura: 1024 | Esta imagem de duas partes retrata um casal de gatos de desenho animado em trajes de detetive; [ESQUERDA] um gato preto em um sobretudo e chapéu fedora segura uma lupa e olha para a direita, enquanto [DIREITA] um gato branco com gravata borboleta e chapéu correspondente levanta uma sobrancelha em curiosidade, criando uma cena divertida inspirada em noir contra um fundo mal iluminado. |
2. Storyboard de Filme | film-storyboard.safetensors | largura: 1024, altura: 1536 | [CENAS-DE-FILME] Em um festival vibrante, [CENA-1] encontramos <Leo>, um garoto tímido, parado na borda de um carnaval movimentado, olhos arregalados com admiração para os brinquedos coloridos e risos, [CENA-2] ele relutantemente tenta um jogo ousado, seus amigos o incentivando, [CENA-3] culminando em um momento triunfante quando ele ganha um urso de pelúcia gigante, seu rosto irradiando orgulho enquanto o levanta para todos verem. |
3. Design de Fonte | font-design.safetensors | largura: 1792, altura: 1216 | A imagem de quatro painéis apresenta uma fonte de bolhas divertida em um estilo vibrante de arte pop. [SUPERIOR-ESQUERDA] exibe "Pop Candy" em rosa brilhante com um fundo de bolinhas; [SUPERIOR-DIREITA] mostra "Sweet Treat" em roxo, cercado por ilustrações de doces; [INFERIOR-ESQUERDA] tem "Yum!" em uma mistura de cores vibrantes; [INFERIOR-DIREITA] mostra "Delicious" contra um fundo listrado, perfeito para produtos divertidos e voltados para crianças. |
4. Decoração de Casa | home-decoration.safetensors | largura: 1344, altura: 1728 | Esta imagem de quatro painéis apresenta uma sala de estar rústica com tons de madeira quente e elementos de decoração aconchegantes; [SUPERIOR-ESQUERDA] apresenta uma grande lareira de pedra com prateleiras de madeira cheias de livros e velas; [SUPERIOR-DIREITA] mostra um sofá de couro vintage coberto por mantas xadrez, complementado por uma mistura de almofadas texturizadas; [INFERIOR-ESQUERDA] exibe um canto com uma poltrona de madeira ao lado de uma mesa lateral segurando uma caneca fumegante e um livro clássico; [INFERIOR-DIREITA] captura um canto de leitura aconchegante com um assento de janela, uma manta de pele macia e toras decorativas empilhadas ordenadamente. |
5. Ilustração de Retrato | portrait-illustration.safetensors | largura: 1152, altura: 1088 | Esta imagem de dois painéis apresenta uma transformação de um retrato realista para uma ilustração divertida, capturando tanto detalhes quanto um toque artístico; [ESQUERDA] a fotografia mostra uma mulher em um mercado movimentado, usando um chapéu de aba larga, um vestido boêmio fluido e uma bolsa de couro transversal; [DIREITA] o painel de ilustração exagera seus acessórios e características, com o vestido boêmio retratado em padrões vibrantes e cores ousadas, enquanto o fundo é simplificado em barracas de mercado abstratas, dando à cena um ar animado e vibrante. |
6. Fotografia de Retrato | portrait-photography.safetensors | largura: 1344, altura: 1728 | Esta imagem [QUATRO-PAINÉIS] ilustra o processo criativo de uma jovem artista em um estúdio brilhante e inspirador; [SUPERIOR-ESQUERDA] ela está diante de uma grande tela, pincel na mão, adicionando cores vibrantes a uma pintura parcialmente concluída, [SUPERIOR-DIREITA] ela se senta em uma mesa de madeira desordenada, esboçando ideias em um caderno com vários materiais de arte espalhados ao redor, [INFERIOR-ESQUERDA] ela dá um passo para trás para observar seu trabalho, ajustando seus óculos pensativamente, e [INFERIOR-DIREITA] ela experimenta diferentes texturas misturando tintas diretamente na paleta, sua expressão focada mostrando sua dedicação ao seu ofício. |
7. Modelo de PPT | ppt-templates.safetensors | largura: 1984, altura: 1152 | Esta imagem de quatro painéis apresenta um modelo de PowerPoint com tema rústico para um workshop culinário; [SUPERIOR-ESQUERDA] introduz "Cozinha da Fazenda à Mesa" em tons quentes e terrosos; [SUPERIOR-DIREITA] organiza seções do workshop como "Ingredientes", "Preparação" e "Serviço"; [INFERIOR-ESQUERDA] exibe listas de ingredientes para produtos sazonais; [INFERIOR-DIREITA] inclui perfis de chefs com pequenas biografias. |
8. Efeito Visual de Tempestade de Areia | sandstorm-visual-effect.safetensors | largura: 1408, altura: 1600 | [PSA-TEMPESTADE-DE-AREIA] Esta imagem de duas partes exibe a transformação de um ciclista através de um efeito visual de tempestade de areia; [SUPERIOR] o painel superior apresenta um ciclista em roupas vibrantes pedalando firmemente em uma estrada aberta e clara com um céu sereno ao fundo, destacando foco e determinação, [INFERIOR] o painel inferior transforma a cena à medida que o ciclista é envolvido em uma tempestade de areia feroz, com partículas de areia girando intensamente ao redor da bicicleta e do ciclista contra um fundo tempestuoso e escurecido, enfatizando caos e poder. |
9. Efeito Visual de Faíscas | sparklers-visual-effect.safetensors | largura: 960, altura: 1088 | [SOBREPOSIÇÕES-REAIS-DE-FAÍSCAS] A imagem de duas partes ilustra vividamente uma proposta no bosque transformada por sobreposições de faíscas; [SUPERIOR] o primeiro painel retrata um homem ajoelhado com um anel de noivado diante de seu parceiro em uma clareira da floresta ao anoitecer, com iluminação quente e natural, [INFERIOR] enquanto o segundo painel introduz faíscas brilhantes que formam um coração ao redor do casal, amplificando o romance e a alegria do momento. |
10. Design de Identidade Visual | visual-identity-design.safetensors | largura: 1472, altura: 1024 | A imagem de dois painéis apresenta a identidade alegre de uma marca de produtos, com o painel esquerdo mostrando um abacaxi sorridente como gráfico e o nome da marca "Fresh Tropic" em uma fonte divertida e casual em um fundo aqua claro; [ESQUERDA] enquanto o painel direito traduz o design em uma sacola de compras reutilizável com o logotipo do abacaxi em preto, segurada por uma pessoa em um ambiente de mercado, enfatizando o apelo acessível e ecológico da marca. |
Este fluxo de trabalho Flux e In-Context LoRA utiliza a poderosa combinação do modelo Flux e do In-Context LoRA para gerar um conjunto de imagens relacionadas com base em um prompt de texto. Vamos detalhar como funciona passo a passo.
Nossa plataforma já possui o modelo Flux e 10 modelos In-Context LoRA prontos para você usar. Isso facilita seu fluxo de trabalho e economiza tempo. Basta escolher o grupo que deseja e começar a criar.
A parte mais importante deste fluxo de trabalho é a descrição de texto que captura a ideia principal que você deseja criar. Já escrevemos prompts para cada modelo In-Context LoRA na lista mencionada anteriormente. Ao escrever seu próprio prompt, use esses exemplos como guia.
Para criar visuais que atendam perfeitamente às suas necessidades, altere as configurações de largura e altura para corresponder ao tamanho desejado. Também fornecemos tamanhos recomendados de cada modelo In-Context LoRA para você usar como ponto de partida.
O nó Amostrador Flux gerencia o processo de amostragem Flux e otimiza os parâmetros de geração para melhores resultados. Os principais parâmetros incluem:
A combinação de Flux e In-Context LoRA abre um mundo de possibilidades para criar conteúdo visual interessante. Experimente esses novos modelos e libere sua criatividade como nunca antes.
Visualizar arquivos de licença:
O Modelo FLUX.1 [dev] é licenciado pela Black Forest Labs. Inc. sob a Licença Não-Comercial FLUX.1 [dev]. Copyright Black Forest Labs. Inc.
EM NENHUMA HIPÓTESE A BLACK FOREST LABS, INC. SERÁ RESPONSÁVEL POR QUALQUER REIVINDICAÇÃO, DANOS OU OUTRA RESPONSABILIDADE, SEJA EM UMA AÇÃO DE CONTRATO, DELITO OU DE OUTRA FORMA, DECORRENTE DE, FORA OU EM CONEXÃO COM O USO DESTE MODELO.
RunComfy é a principal ComfyUI plataforma, oferecendo ComfyUI online ambiente e serviços, juntamente com fluxos de trabalho do ComfyUI apresentando visuais impressionantes. RunComfy também oferece AI Playground, permitindo que artistas utilizem as mais recentes ferramentas de AI para criar arte incrível.