Nova série do Stable Diffusion promete imagens de IA com mais diversidade

Por Luciano Rodrigues
Imagem: Dall-E

A Stability AI anunciou o lançamento da série Stable Diffusion 3.5, sua nova família de modelos de geração de imagens, com foco em personalização e desempenho aprimorado, com a promessa de serem mais versáteis e capacidade de gerar imagens mais diversas, sem a necessidade de prompts complexos.

A série inclui três versões: Stable Diffusion 3.5 Large, Stable Diffusion 3.5 Large Turbo e Stable Diffusion 3.5 Medium, cada uma adaptada a diferentes necessidades e capacidades tecnológicas.

CONTINUA APÓS A PUBLICIDADE

Stable Diffusion 3.5 Large, o modelo mais poderoso, conta com 8 bilhões de parâmetros e pode gerar imagens de até 1 megapixel.

Já o Stable Diffusion 3.5 Large Turbo oferece maior velocidade, com uma leve perda de qualidade.

Por fim, o modelo Stable Diffusion 3.5 Medium, voltado para dispositivos móveis, será lançado em 29 de outubro e permitirá a geração de imagens em resoluções que variam de 0,25 a 2 megapixels.

Nova geração do Stable Diffusion promete mais diversidade

Uma das principais inovações da nova série, segundo a Satability AI, é a capacidade de gerar imagens que retratam pessoas com diferentes características e tons de pele de forma mais natural, sem depender de descrições extensas nos prompts.

Segundo a empresa, o treinamento dos modelos envolveu a utilização de múltiplas versões de prompts para cada imagem, priorizando descrições curtas, o que contribui para uma maior diversidade de conceitos visuais e estilos.

CONTINUA APÓS A PUBLICIDADE

Apesar das melhorias, a Stability alerta que os modelos da série Stable Diffusion 3.5 ainda podem apresentar problemas de aderência aos prompts, o que pode gerar incerteza na saída das imagens em alguns casos.

A empresa reconhece que variações nas saídas podem ocorrer mesmo com o mesmo prompt, dependendo das sementes utilizadas, mas afirma que isso faz parte da estratégia de manter uma base de conhecimento mais ampla.

Embora tenha havido avanços significativos, a Stability AI enfrenta desafios em relação à proteção de direitos autorais e ao uso de dados públicos.

A empresa treina seus modelos em dados coletados da web, o que levanta preocupações sobre o uso de conteúdos protegidos por direitos autorais.

CONTINUA APÓS A PUBLICIDADE

A Stability permite que os proprietários de dados solicitem a remoção de suas informações dos conjuntos de dados, mas a responsabilidade de defesa em casos de reivindicações legais fica com os clientes.

Os modelos Stable Diffusion 3.5 estão disponíveis gratuitamente para uso não comercial e para empresas com receita anual inferior a R$ 5,7 milhões (US$ 1 milhão), enquanto que organizações com faturamento maior devem adquirir uma licença empresarial.

A Stability reforça que os criadores que utilizarem seus modelos devem exibir o selo “Powered by Stability AI” em suas criações.

Além disso, a empresa planeja lançar o ControlNet para os novos modelos, permitindo ajustes mais precisos, e há planos de incorporar suporte para plataformas como Roblox e Minecraft, expandindo as possibilidades de criação.

CONTINUA APÓS A PUBLICIDADE
Compartilhe:
Siga:
Jornalista, assessor de comunicação, escritor e comunicador, com MBA em jornalismo digital e 12 anos de experiência, tendo passado também por alguns veículos no setor tech.
Sair da versão mobile