Sesame lança novo modelo Maya, que cria vozes realistas

Por Luciano Rodrigues
Imagem: Dall-E
  • Maya da Sesame gera vozes realistas com IA avançada.
  • Modelo CSM-1B oferece vozes naturais, mas com riscos.
  • Clonagem de voz da Sesame levanta preocupações sobre uso indevido.

A Sesame, empresa especializada em inteligência artificial, apresentou recentemente o modelo CSM-1B, que alimenta o assistente de voz Maya. A princípio, o grande diferencial do modelo é a capacidade de gerar vozes realistas, aproximando-se do nível humano na forma de interação.

O modelo CSM-1B possui 1 bilhão de parâmetros e foi lançado sob licença Apache 2.0, permitindo seu uso comercial com poucas restrições. Ele se destaca por gerar áudio a partir de entradas de texto e som, oferecendo uma experiência mais natural e envolvente aos usuários.

O CSM-1B utiliza uma técnica chamada quantização vetorial residual (RVQ), que codifica o áudio em tokens discretos, conhecidos como códigos. Essa técnica já é empregada em outras tecnologias de áudio de IA, como o SoundStream do Google e o Encodec da Meta.

Além disso, o modelo usa o backbone Llama da Meta e adiciona um decodificador de áudio, o que permite criar vozes realistas para diversas aplicações.

Sesame não tem salvaguardas para clonagem de voz

Apesar das capacidades impressionantes, a Sesame não ajustou o modelo CSM-1B para vozes específicas, o que limita sua personalização. A empresa também não revelou quais dados usou para treinar o modelo, o que levanta questões sobre a qualidade e precisão das vozes geradas em diferentes contextos.

CONTINUA APÓS A PUBLICIDADE

Além disso, a tecnologia não possui salvaguardas reais para prevenir abusos, como a criação de conteúdo enganoso.

A Sesame pede que os desenvolvedores e usuários não imitem vozes sem consentimento ou usem o modelo para atividades prejudiciais. Apesar disso, em testes realizados, foi possível clonar uma voz em menos de um minuto e gerar discursos sobre temas polêmicos, como eleições e propaganda russa, evidenciando o risco de uso indevido.

A Sesame, cofundada por Brendan Iribe, cocriador do Oculus, se destaca no mercado de assistentes de voz realistas. Além disso, está desenvolvendo óculos de IA, projetados para uso contínuo, com seus modelos personalizados, o que pode expandir ainda mais o impacto da tecnologia em várias áreas.

Compartilhe:
Siga:
Jornalista, assessor de comunicação, escritor e comunicador, com MBA em jornalismo digital e 12 anos de experiência, tendo passado também por alguns veículos no setor tech.
Sair da versão mobile