- Voxtral pode transcrever até 30 minutos de áudio.
- Funciona com múltiplos idiomas e comandos de voz.
- Custa menos da metade de soluções concorrentes.
A Mistral, startup francesa reconhecida por sua atuação no campo da inteligência artificial de código aberto, acaba de entrar na corrida da voz com o lançamento do Voxtral, sua primeira família de modelos de compreensão de fala. O anúncio ocorreu na terça-feira (15), com a promessa de democratizar o acesso a ferramentas de transcrição e interpretação de áudio baseadas em IA.
A empresa descreveu o Voxtral como “o primeiro modelo aberto pronto para produção”. Assim, ela pretende eliminar a necessidade de escolher entre soluções baratas e imprecisas ou sistemas fechados e caros, oferecendo uma alternativa com qualidade e flexibilidade.
A versão Voxtral Small, com 24 bilhões de parâmetros, mira implantações em larga escala e rivaliza com ferramentas de empresas como ElevenLabs, OpenAI e Google.
Já o Voxtral Mini, com 3 bilhões de parâmetros, atende cenários locais e aplicações de borda. De acordo com a empresa, também está disponível a Voxtral Mini Transcribe, versão simplificada para transcrição pura, com preço inferior ao Whisper da OpenAI.
Voxtral traz transcrição e compreensão com suporte multilíngue
O Voxtral utiliza como base o modelo Mistral Small 3.1, uma LLM que possibilita compreensão contextual de até 40 minutos de áudio. Assim, desenvolvedores podem integrar o modelo a aplicativos que respondem perguntas, geram resumos e executam comandos em tempo real, como chamar APIs.
A IA também entende e transcreve inglês, espanhol, francês, português, hindi, alemão, holandês e italiano. A Mistral afirma que o custo da API começa em R$ 0,0056 (US$ 0,001) por minuto, e o modelo já pode ser testado gratuitamente via Hugging Face ou no chatbot Le Chat da empresa.
No comunicado, a Mistral reforça:
Apresentamos uma alternativa aberta, eficiente e economicamente acessível que coloca o controle nas mãos dos desenvolvedores.
O lançamento do Voxtral acontece logo após a divulgação do Magistral, modelo de raciocínio da empresa. A Mistral também negocia uma nova rodada de investimentos, que pode atingir até R$ 5,56 bilhões (US$ 1 bilhão), com o fundo MGX de Abu Dhabi entre os interessados.
