- IA multimodal poderosa que roda direto no seu smartphone.
- Qwen Omni impressiona com leveza, velocidade e código aberto.
- Respostas em tempo real com desempenho acima do esperado.
A Alibaba acaba de lançar o Qwen Omni, um modelo de inteligência artificial multimodal capaz de interpretar texto, imagem, áudio e vídeo em tempo real.
Com apenas sete bilhões de parâmetros, ele funciona direto em smartphones e laptops, sem depender de servidores robustos ou infraestrutura pesada.
A proposta do Qwen Omni mira desenvolvedores que buscam criar agentes de IA econômicos e eficientes. Ainda mais, aplicativos de voz inteligente, assistentes pessoais e bots de atendimento ganham novas possibilidades.
Com o modelo, é possível, por exemplo, orientar usuários em tempo real durante uma receita culinária, analisando ingredientes com a câmera. Ele também pode turbinar o atendimento ao cliente por vídeo, com respostas imediatas.
A Alibaba desenvolveu a Talker Architecture, que separa a geração de texto da síntese de fala. Isso evita ruídos entre as modalidades e entrega respostas mais rápidas e precisas.
Graças à sua leveza, o modelo roda em dispositivos simples. Além disso, os desenvolvedores agora podem usar IA multimodal avançada sem precisar de máquinas caras ou serviços em nuvem.
Modelo aberto e pronto para testes
A empresa disponibilizou o Qwen Omni em código aberto no Hugging Face, GitHub, Qwen Chat e na plataforma ModelScope. Além disso, a comunidade já começou a adaptar o modelo para soluções práticas e comerciais.
Nos testes do OmniBench, o Qwen Omni alcançou 56,1 pontos, superando o Gemini 1.5 Pro do Google, que marcou 42,5. Além disso, isso mostra sua força mesmo com uma arquitetura mais leve.
O lançamento agitou o setor, no mesmo dia, o Google apresentou o Gemini 2.5 Pro, que estreou com destaque no LMArena, uma plataforma de benchmarking colaborativo.
Dias antes, a Alibaba também atualizou seus modelos Qwen2.5-VL e revelou o QwQ-32B, que rivaliza com modelos como DeepSeek R1, OpenAI o3-mini e o1.
Com desempenho competitivo e fácil acesso, o Qwen Omni redefine o padrão de IA portátil. Agora, soluções multimodais de alta qualidade cabem na palma da mão — literalmente.