OpenAI começa a liberar a Sky, novo modo de voz avançado para ChatGPT

Por Luciano Rodrigues
OpenAI começa a liberar a Sky, novo modo de voz avançado para ChatGPT - Imagem: Dall-E

A OpenAI iniciou o lançamento do novo modo de voz avançado para um grupo seleto de assinantes do ChatGPT Plus. O recurso, que foi apresentado durante o evento de lançamento do GPT-4o em maio, tem recebido atenção por suas capacidades avançadas e por gerar vozes que lembram a de Scarlett Johansson.

Inicialmente previsto para junho, o lançamento foi adiado para garantir maior segurança e desempenho.

Durante o evento da OpenAI, a nova funcionalidade de voz mostrou-se significativamente mais avançada do que o modo de voz atual do ChatGPT.

Os funcionários da OpenAI demonstraram como o chatbot pode contar histórias de maneiras diferentes, ajustando-se às interrupções de forma natural.

O modo avançado estava programado para entrar em fase alfa no final de junho, mas foi postergado por um mês.

Segundo a porta-voz da OpenAI, Taya Christianson, a empresa utilizou esse tempo adicional para aprimorar a capacidade do modelo em detectar e recusar certos tipos de conteúdo.

Segurança e performance são prioridades no do modo de voz do ChatGPT

Christianson revelou que a OpenAI testou as funcionalidades do modo de voz com mais de 100 “red teamers” externos, especialistas que procuram vulnerabilidades em tecnologias.

Além disso, novos filtros foram adicionados para reconhecer e bloquear solicitações que poderiam gerar música ou outros áudios protegidos por direitos autorais.

A empresa enfrentou recentemente um escrutínio rigoroso sobre suas políticas de segurança, o que justificou a pausa para ajustes.

Uma das principais críticas ao novo modo de voz durante o evento foi a semelhança da voz “Sky” com a de Scarlett Johansson, famosa por interpretar uma IA no filme “Her”.

Embora a voz estivesse no ChatGPT antes da demonstração, foi removida após Johansson questionar a OpenAI sobre como a voz foi criada.

Christianson esclareceu que o novo modo de voz usará apenas quatro vozes predefinidas criadas com dubladores.

“Fizemos com que o ChatGPT não possa imitar vozes de outras pessoas, sejam indivíduos ou figuras públicas, e bloquearemos saídas que diferem dessas vozes predefinidas”, acrescentou.

A OpenAI pretende disponibilizar o novo modo de voz para todos os usuários do ChatGPT Plus entre setembro e novembro.

Esse desenvolvimento marca um avanço significativo nas capacidades do ChatGPT, oferecendo uma experiência mais interativa e realista para os usuários, ao mesmo tempo em que reforça as medidas de segurança e respeito aos direitos autorais.

Compartilhe:
Siga:
Jornalista, assessor de comunicação, escritor e comunicador, com MBA em jornalismo digital e 12 anos de experiência, tendo passado também por alguns veículos no setor tech.
Sair da versão mobile