- Nova Sonic impressiona com voz natural e resposta quase instantânea.
- IA da Amazon supera OpenAI em precisão e velocidade.
- Alexa+ ganha potência com integração do modelo Nova Sonic.
Na última terça-feira, a Amazon apresentou ao público o Nova Sonic, seu novo modelo de inteligência artificial voltado para voz. A novidade chega com a promessa de entregar uma experiência de conversação mais fluida, natural e rápida.
A empresa afirma que a nova Sonic supera concorrentes como Google e OpenAI em benchmarks que avaliam velocidade, reconhecimento de fala e qualidade da conversação.
Tecnologia mais natural e eficiente
A nova Sonic representa uma evolução marcante em comparação aos modelos antigos da Amazon, como os que deram vida à Alexa. Enquanto os assistentes virtuais anteriores pareciam mecânicos, o novo modelo entende pausas, interrupções e até resmungos, sem comprometer a precisão.
Segundo a empresa, o modelo alcançou uma taxa de erro de apenas 4,2% em testes com cinco idiomas diferentes, superando os padrões de mercado. Em interações complexas, como conversas barulhentas com múltiplos participantes, a nova Sonic também se saiu melhor que o GPT-4o-transcribe, da OpenAI, com 46,7% mais precisão.
Além disso, o tempo de resposta caiu para 1,09 segundo, superando a latência média da OpenAI, que chega a 1,18 segundo, conforme dados da Artificial Analysis.
Foco em desenvolvedores e integração com Alexa+
A Amazon disponibilizou a nova Sonic por meio da plataforma Bedrock, voltada a desenvolvedores que constroem soluções de IA para empresas. Porém, a API de streaming bidirecional permite integrar o modelo a diferentes aplicações, desde assistentes virtuais até softwares corporativos.
Ainda mais, componentes da nova Sonic já operam no Alexa+, a nova versão do assistente digital da empresa. Rohit Prasad, cientista chefe da divisão de AGI da Amazon, explica que o modelo se baseia em um sistema robusto de orquestração técnica que otimiza o uso de múltiplas APIs. Essa estrutura permite que o Sonic escolha a melhor ferramenta em tempo real para responder a uma solicitação.
Durante as interações, o modelo transcreve o que o usuário diz e ajusta sua resposta ao momento certo para falar. Isso cria uma troca mais humana, ideal para ambientes dinâmicos.
Porém, a Prasad afirma que a nova Sonic faz parte da estratégia da Amazon para desenvolver AGI inteligência artificial geral capaz de operar como um ser humano em ambientes digitais. A empresa já trabalha em modelos multimodais que compreendem imagem, vídeo, voz e outros tipos de dados sensoriais.
Ainda mais, a divisão AGI tem ampliado sua presença nas decisões de produto da Amazon. Na semana passada, a empresa lançou o Nova Act, um modelo que opera com navegador e reforça recursos como o Alexa+ e o Buy for Me. Com a nova Sonic, a Amazon quer acelerar esse movimento e entregar ferramentas de IA mais acessíveis e poderosas para o mercado.
Se o futuro da voz na IA parecia distante, a Amazon acaba de encurtar esse caminho com o Nova Sonic.