Conheça a nova Sonic: A nova geração de voz de IA da Amazon

Por Michael Henrique
Imagem: Dall-e

Desconto imperdíveis no canal oficial de Ofertas no Whatsapp

  • Nova Sonic impressiona com voz natural e resposta quase instantânea.
  • IA da Amazon supera OpenAI em precisão e velocidade.
  • Alexa+ ganha potência com integração do modelo Nova Sonic.

Na última terça-feira, a Amazon apresentou ao público o Nova Sonic, seu novo modelo de inteligência artificial voltado para voz. A novidade chega com a promessa de entregar uma experiência de conversação mais fluida, natural e rápida.

A empresa afirma que a nova Sonic supera concorrentes como Google e OpenAI em benchmarks que avaliam velocidade, reconhecimento de fala e qualidade da conversação.

Tecnologia mais natural e eficiente

A nova Sonic representa uma evolução marcante em comparação aos modelos antigos da Amazon, como os que deram vida à Alexa. Enquanto os assistentes virtuais anteriores pareciam mecânicos, o novo modelo entende pausas, interrupções e até resmungos, sem comprometer a precisão.

Segundo a empresa, o modelo alcançou uma taxa de erro de apenas 4,2% em testes com cinco idiomas diferentes, superando os padrões de mercado. Em interações complexas, como conversas barulhentas com múltiplos participantes, a nova Sonic também se saiu melhor que o GPT-4o-transcribe, da OpenAI, com 46,7% mais precisão.

Além disso, o tempo de resposta caiu para 1,09 segundo, superando a latência média da OpenAI, que chega a 1,18 segundo, conforme dados da Artificial Analysis.

CONTINUA APÓS A PUBLICIDADE

Foco em desenvolvedores e integração com Alexa+

A Amazon disponibilizou a nova Sonic por meio da plataforma Bedrock, voltada a desenvolvedores que constroem soluções de IA para empresas. Porém, a API de streaming bidirecional permite integrar o modelo a diferentes aplicações, desde assistentes virtuais até softwares corporativos.

Ainda mais, componentes da nova Sonic já operam no Alexa+, a nova versão do assistente digital da empresa. Rohit Prasad, cientista chefe da divisão de AGI da Amazon, explica que o modelo se baseia em um sistema robusto de orquestração técnica que otimiza o uso de múltiplas APIs. Essa estrutura permite que o Sonic escolha a melhor ferramenta em tempo real para responder a uma solicitação.

Durante as interações, o modelo transcreve o que o usuário diz e ajusta sua resposta ao momento certo para falar. Isso cria uma troca mais humana, ideal para ambientes dinâmicos.

Porém, a Prasad afirma que a nova Sonic faz parte da estratégia da Amazon para desenvolver AGI inteligência artificial geral capaz de operar como um ser humano em ambientes digitais. A empresa já trabalha em modelos multimodais que compreendem imagem, vídeo, voz e outros tipos de dados sensoriais.

Ainda mais, a divisão AGI tem ampliado sua presença nas decisões de produto da Amazon. Na semana passada, a empresa lançou o Nova Act, um modelo que opera com navegador e reforça recursos como o Alexa+ e o Buy for Me. Com a nova Sonic, a Amazon quer acelerar esse movimento e entregar ferramentas de IA mais acessíveis e poderosas para o mercado.

Se o futuro da voz na IA parecia distante, a Amazon acaba de encurtar esse caminho com o Nova Sonic.

CONTINUA APÓS A PUBLICIDADE
Compartilhe:
Siga:
Sou apaixonado por tecnologia, especialmente por consoles, começando minha jornada com um Nintendo 64. Gosto de explorar novos gadgets e sempre busco as melhores ofertas para economizar em minhas compras.
Sair da versão mobile