Novo modelo do Alibaba Qwen Omni que processa vídeos e imagens no smartphone

Por Michael Henrique
Imagem: Dall-e
  • IA multimodal poderosa que roda direto no seu smartphone.
  • Qwen Omni impressiona com leveza, velocidade e código aberto.
  • Respostas em tempo real com desempenho acima do esperado.

A Alibaba acaba de lançar o Qwen Omni, um modelo de inteligência artificial multimodal capaz de interpretar texto, imagem, áudio e vídeo em tempo real.

Com apenas sete bilhões de parâmetros, ele funciona direto em smartphones e laptops, sem depender de servidores robustos ou infraestrutura pesada.

IA acessível e funcional para todos os bolsos com Alibaba

A proposta do Qwen Omni mira desenvolvedores que buscam criar agentes de IA econômicos e eficientes. Ainda mais, aplicativos de voz inteligente, assistentes pessoais e bots de atendimento ganham novas possibilidades.

Com o modelo, é possível, por exemplo, orientar usuários em tempo real durante uma receita culinária, analisando ingredientes com a câmera. Ele também pode turbinar o atendimento ao cliente por vídeo, com respostas imediatas.

A Alibaba desenvolveu a Talker Architecture, que separa a geração de texto da síntese de fala. Isso evita ruídos entre as modalidades e entrega respostas mais rápidas e precisas.

CONTINUA APÓS A PUBLICIDADE

Graças à sua leveza, o modelo roda em dispositivos simples. Além disso, os desenvolvedores agora podem usar IA multimodal avançada sem precisar de máquinas caras ou serviços em nuvem.

Modelo aberto e pronto para testes

A empresa disponibilizou o Qwen Omni em código aberto no Hugging Face, GitHub, Qwen Chat e na plataforma ModelScope. Além disso, a comunidade já começou a adaptar o modelo para soluções práticas e comerciais.

Nos testes do OmniBench, o Qwen Omni alcançou 56,1 pontos, superando o Gemini 1.5 Pro do Google, que marcou 42,5. Além disso, isso mostra sua força mesmo com uma arquitetura mais leve.

O lançamento agitou o setor, no mesmo dia, o Google apresentou o Gemini 2.5 Pro, que estreou com destaque no LMArena, uma plataforma de benchmarking colaborativo.

Dias antes, a Alibaba também atualizou seus modelos Qwen2.5-VL e revelou o QwQ-32B, que rivaliza com modelos como DeepSeek R1, OpenAI o3-mini e o1.

Com desempenho competitivo e fácil acesso, o Qwen Omni redefine o padrão de IA portátil. Agora, soluções multimodais de alta qualidade cabem na palma da mão — literalmente.

CONTINUA APÓS A PUBLICIDADE
Compartilhe:
Siga:
Sou apaixonado por tecnologia, especialmente por consoles, começando minha jornada com um Nintendo 64. Gosto de explorar novos gadgets e sempre busco as melhores ofertas para economizar em minhas compras.
Sair da versão mobile