O Google anunciou que está reintroduzindo a capacidade de gerar imagens de pessoas por meio de seu chatbot Gemini AI, após ter retirado o recurso no início deste ano devido a problemas com a precisão histórica das imagens geradas, incluindo a criação de figuras nazistas com diversidade racial.
A nova atualização será inicialmente disponibilizada para usuários dos planos Gemini Advanced, Business e Enterprise, todos em inglês, nos próximos dias.
Essa atualização é alimentada pelo Imagen 3, a versão mais recente do gerador de texto para imagem de IA do Google.
O Imagen 3, lançado discretamente no início deste mês por meio da AI Test Kitchen, agora estará disponível para todos os usuários do Gemini.
Esta ferramenta aprimorada é capaz de gerar uma vasta gama de imagens, desde paisagens fotorrealistas até pinturas a óleo, tudo a partir de descrições textuais simples.
Novas restrições e proteções no Gemini AI
A decisão de reativar a geração de imagens de pessoas vem acompanhada de novas proteções integradas no modelo Imagen 3.
Segundo Dave Citron, diretor sênior de gerenciamento de produtos do Google para Gemini, a atualização foi projetada para evitar os erros que levaram à suspensão anterior do recurso.
O modelo agora possui medidas específicas para garantir que as imagens geradas sejam historicamente precisas e respeitem as normas éticas estabelecidas pela empresa.
Entre as restrições, o Gemini AI não permitirá a criação de imagens fotorrealistas de figuras públicas, conteúdo que envolva menores ou cenas de natureza sangrenta, violenta ou sexual.
Essas medidas são uma resposta direta às preocupações levantadas anteriormente sobre o potencial de abuso da tecnologia de IA para criar conteúdos prejudiciais ou inapropriados.
Citron reconheceu que, embora o sistema tenha sido aprimorado, ele ainda não é infalível.
Segundo ele, o Google está comprometido em continuar refinando o modelo com base no feedback dos usuários do Gemini Advanced durante este período de acesso antecipado.
Além disso, a empresa planeja expandir a capacidade de criar imagens geradas por IA para uma base maior de usuários e em mais idiomas no futuro próximo.