A OpenAI iniciou o lançamento do novo modo de voz avançado para um grupo seleto de assinantes do ChatGPT Plus. O recurso, que foi apresentado durante o evento de lançamento do GPT-4o em maio, tem recebido atenção por suas capacidades avançadas e por gerar vozes que lembram a de Scarlett Johansson.
Inicialmente previsto para junho, o lançamento foi adiado para garantir maior segurança e desempenho.
Durante o evento da OpenAI, a nova funcionalidade de voz mostrou-se significativamente mais avançada do que o modo de voz atual do ChatGPT.
Os funcionários da OpenAI demonstraram como o chatbot pode contar histórias de maneiras diferentes, ajustando-se às interrupções de forma natural.
O modo avançado estava programado para entrar em fase alfa no final de junho, mas foi postergado por um mês.
Segundo a porta-voz da OpenAI, Taya Christianson, a empresa utilizou esse tempo adicional para aprimorar a capacidade do modelo em detectar e recusar certos tipos de conteúdo.
Segurança e performance são prioridades no do modo de voz do ChatGPT
Christianson revelou que a OpenAI testou as funcionalidades do modo de voz com mais de 100 “red teamers” externos, especialistas que procuram vulnerabilidades em tecnologias.
Além disso, novos filtros foram adicionados para reconhecer e bloquear solicitações que poderiam gerar música ou outros áudios protegidos por direitos autorais.
A empresa enfrentou recentemente um escrutínio rigoroso sobre suas políticas de segurança, o que justificou a pausa para ajustes.
Uma das principais críticas ao novo modo de voz durante o evento foi a semelhança da voz “Sky” com a de Scarlett Johansson, famosa por interpretar uma IA no filme “Her”.
Embora a voz estivesse no ChatGPT antes da demonstração, foi removida após Johansson questionar a OpenAI sobre como a voz foi criada.
Christianson esclareceu que o novo modo de voz usará apenas quatro vozes predefinidas criadas com dubladores.
“Fizemos com que o ChatGPT não possa imitar vozes de outras pessoas, sejam indivíduos ou figuras públicas, e bloquearemos saídas que diferem dessas vozes predefinidas”, acrescentou.
A OpenAI pretende disponibilizar o novo modo de voz para todos os usuários do ChatGPT Plus entre setembro e novembro.
Esse desenvolvimento marca um avanço significativo nas capacidades do ChatGPT, oferecendo uma experiência mais interativa e realista para os usuários, ao mesmo tempo em que reforça as medidas de segurança e respeito aos direitos autorais.