Google relança geração de imagens de pessoas no Gemini com novas medidas de segurança

Por Luciano Rodrigues
Google relança geração de imagens de pessoas no Gemini com novas medidas de segurança - Imagem: Dall-E

O Google anunciou que está reintroduzindo a capacidade de gerar imagens de pessoas por meio de seu chatbot Gemini AI, após ter retirado o recurso no início deste ano devido a problemas com a precisão histórica das imagens geradas, incluindo a criação de figuras nazistas com diversidade racial.

A nova atualização será inicialmente disponibilizada para usuários dos planos Gemini Advanced, Business e Enterprise, todos em inglês, nos próximos dias.

Essa atualização é alimentada pelo Imagen 3, a versão mais recente do gerador de texto para imagem de IA do Google.

O Imagen 3, lançado discretamente no início deste mês por meio da AI Test Kitchen, agora estará disponível para todos os usuários do Gemini.

Esta ferramenta aprimorada é capaz de gerar uma vasta gama de imagens, desde paisagens fotorrealistas até pinturas a óleo, tudo a partir de descrições textuais simples.

Novas restrições e proteções no Gemini AI

A decisão de reativar a geração de imagens de pessoas vem acompanhada de novas proteções integradas no modelo Imagen 3.

Segundo Dave Citron, diretor sênior de gerenciamento de produtos do Google para Gemini, a atualização foi projetada para evitar os erros que levaram à suspensão anterior do recurso.

O modelo agora possui medidas específicas para garantir que as imagens geradas sejam historicamente precisas e respeitem as normas éticas estabelecidas pela empresa.

Entre as restrições, o Gemini AI não permitirá a criação de imagens fotorrealistas de figuras públicas, conteúdo que envolva menores ou cenas de natureza sangrenta, violenta ou sexual.

Essas medidas são uma resposta direta às preocupações levantadas anteriormente sobre o potencial de abuso da tecnologia de IA para criar conteúdos prejudiciais ou inapropriados.

Citron reconheceu que, embora o sistema tenha sido aprimorado, ele ainda não é infalível.

Segundo ele, o Google está comprometido em continuar refinando o modelo com base no feedback dos usuários do Gemini Advanced durante este período de acesso antecipado.

Além disso, a empresa planeja expandir a capacidade de criar imagens geradas por IA para uma base maior de usuários e em mais idiomas no futuro próximo.

Compartilhe:
Siga:
Jornalista, assessor de comunicação, escritor e comunicador, com MBA em jornalismo digital e 12 anos de experiência, tendo passado também por alguns veículos no setor tech.
Sair da versão mobile