A Stability AI anunciou o lançamento da série Stable Diffusion 3.5, sua nova família de modelos de geração de imagens, com foco em personalização e desempenho aprimorado, com a promessa de serem mais versáteis e capacidade de gerar imagens mais diversas, sem a necessidade de prompts complexos.
A série inclui três versões: Stable Diffusion 3.5 Large, Stable Diffusion 3.5 Large Turbo e Stable Diffusion 3.5 Medium, cada uma adaptada a diferentes necessidades e capacidades tecnológicas.
Stable Diffusion 3.5 Large, o modelo mais poderoso, conta com 8 bilhões de parâmetros e pode gerar imagens de até 1 megapixel.
Já o Stable Diffusion 3.5 Large Turbo oferece maior velocidade, com uma leve perda de qualidade.
Por fim, o modelo Stable Diffusion 3.5 Medium, voltado para dispositivos móveis, será lançado em 29 de outubro e permitirá a geração de imagens em resoluções que variam de 0,25 a 2 megapixels.
Nova geração do Stable Diffusion promete mais diversidade
Uma das principais inovações da nova série, segundo a Satability AI, é a capacidade de gerar imagens que retratam pessoas com diferentes características e tons de pele de forma mais natural, sem depender de descrições extensas nos prompts.
Segundo a empresa, o treinamento dos modelos envolveu a utilização de múltiplas versões de prompts para cada imagem, priorizando descrições curtas, o que contribui para uma maior diversidade de conceitos visuais e estilos.
Apesar das melhorias, a Stability alerta que os modelos da série Stable Diffusion 3.5 ainda podem apresentar problemas de aderência aos prompts, o que pode gerar incerteza na saída das imagens em alguns casos.
A empresa reconhece que variações nas saídas podem ocorrer mesmo com o mesmo prompt, dependendo das sementes utilizadas, mas afirma que isso faz parte da estratégia de manter uma base de conhecimento mais ampla.
Embora tenha havido avanços significativos, a Stability AI enfrenta desafios em relação à proteção de direitos autorais e ao uso de dados públicos.
A empresa treina seus modelos em dados coletados da web, o que levanta preocupações sobre o uso de conteúdos protegidos por direitos autorais.
A Stability permite que os proprietários de dados solicitem a remoção de suas informações dos conjuntos de dados, mas a responsabilidade de defesa em casos de reivindicações legais fica com os clientes.
Os modelos Stable Diffusion 3.5 estão disponíveis gratuitamente para uso não comercial e para empresas com receita anual inferior a R$ 5,7 milhões (US$ 1 milhão), enquanto que organizações com faturamento maior devem adquirir uma licença empresarial.
A Stability reforça que os criadores que utilizarem seus modelos devem exibir o selo “Powered by Stability AI” em suas criações.
Além disso, a empresa planeja lançar o ControlNet para os novos modelos, permitindo ajustes mais precisos, e há planos de incorporar suporte para plataformas como Roblox e Minecraft, expandindo as possibilidades de criação.