Google relança geração de imagens de pessoas no Gemini com novas medidas de segurança

Google relança geração de imagens de pessoas no Gemini com novas medidas de segurança - Imagem: Dall-E

O Google anunciou que está reintroduzindo a capacidade de gerar imagens de pessoas por meio de seu chatbot Gemini AI, após ter retirado o recurso no início deste ano devido a problemas com a precisão histórica das imagens geradas, incluindo a criação de figuras nazistas com diversidade racial.

A nova atualização será inicialmente disponibilizada para usuários dos planos Gemini Advanced, Business e Enterprise, todos em inglês, nos próximos dias.

Essa atualização é alimentada pelo Imagen 3, a versão mais recente do gerador de texto para imagem de IA do Google.

O Imagen 3, lançado discretamente no início deste mês por meio da AI Test Kitchen, agora estará disponível para todos os usuários do Gemini.

Esta ferramenta aprimorada é capaz de gerar uma vasta gama de imagens, desde paisagens fotorrealistas até pinturas a óleo, tudo a partir de descrições textuais simples.

CONTINUA APÓS A PUBLICIDADE

Novas restrições e proteções no Gemini AI

A decisão de reativar a geração de imagens de pessoas vem acompanhada de novas proteções integradas no modelo Imagen 3.

Segundo Dave Citron, diretor sênior de gerenciamento de produtos do Google para Gemini, a atualização foi projetada para evitar os erros que levaram à suspensão anterior do recurso.

O modelo agora possui medidas específicas para garantir que as imagens geradas sejam historicamente precisas e respeitem as normas éticas estabelecidas pela empresa.

Entre as restrições, o Gemini AI não permitirá a criação de imagens fotorrealistas de figuras públicas, conteúdo que envolva menores ou cenas de natureza sangrenta, violenta ou sexual.

Essas medidas são uma resposta direta às preocupações levantadas anteriormente sobre o potencial de abuso da tecnologia de IA para criar conteúdos prejudiciais ou inapropriados.

Citron reconheceu que, embora o sistema tenha sido aprimorado, ele ainda não é infalível.

CONTINUA APÓS A PUBLICIDADE

Segundo ele, o Google está comprometido em continuar refinando o modelo com base no feedback dos usuários do Gemini Advanced durante este período de acesso antecipado.

Além disso, a empresa planeja expandir a capacidade de criar imagens geradas por IA para uma base maior de usuários e em mais idiomas no futuro próximo.

Compartilhe:
Jornalista, assessor de comunicação, escritor e comunicador, com MBA em jornalismo digital e 12 anos de experiência, tendo passado também por alguns veículos no setor tech.
Sair da versão mobile