- Novos modelos Qwen3 prometem desempenho superior em vários benchmarks.
- Alibaba aposta em IA aberta para competir com gigantes americanos.
- Qwen3 já está disponível no Hugging Face, GitHub e provedores de nuvem.
O Alibaba anunciou nessa segunda-feira (28) o lançamento do Qwen3, uma nova família de modelos de inteligência artificial. A empresa chinesa afirma que, em muitos casos, os novos modelos rivalizam e até superam os sistemas de gigantes como o Google e a OpenAI.
A princípio, os modelos variam de 0,6 bilhão a 235 bilhões de parâmetros, demonstrando grande diversidade em capacidade e desempenho. Modelos com mais parâmetros geralmente solucionam problemas com mais eficiência, o que pode significar uma vantagem importante em aplicações complexas.
Alibaba vai oferecer modelos abertos e compatíveis com múltiplas tarefas
O Alibaba disponibilizou ou disponibilizará em breve a maioria dos modelos Qwen3 para download nas plataformas Hugging Face e GitHub sob uma licença aberta. Essa estratégia visa popularizar a tecnologia e tornar o Alibaba um nome forte no segmento de IA aberta.
De acordo com a empresa, os modelos Qwen3 são híbridos. Eles podem “raciocinar” sobre problemas complexos ou responder de maneira mais rápida a tarefas simples, com um sistema que permite controlar o orçamento de pensamento. A equipe da Qwen escreveu em seu blog:
Integramos perfeitamente os modos de pensar e não pensar, oferecendo aos usuários a flexibilidade de controlar o orçamento de pensamento.
Além disso, alguns modelos Qwen3 utilizam uma arquitetura chamada Mixture of Experts (MoE). Essa abordagem delega partes das tarefas a pequenos modelos especializados, aumentando a eficiência computacional.
Os novos modelos suportam 119 idiomas e foram treinados em um gigantesco conjunto de dados de quase 36 trilhões de tokens. Tokens representam pedaços de dados que o modelo processa, e 1 milhão de tokens equivalem a aproximadamente 750 mil palavras, por exemplo.
No comparativo interno divulgado pelo Alibaba, o maior modelo da série, o Qwen-3-235B-A22B, superou concorrentes de peso. No Codeforces, uma plataforma de competições de programação, ele ficou à frente do o3-mini da OpenAI e do Gemini 2.5 Pro do Google. Também obteve desempenho superior em benchmarks matemáticos desafiadores como o AIME e o BFCL.
Apesar desses resultados impressionantes, o Qwen-3-235B-A22B ainda não está disponível para o público. Já o maior modelo acessível, o Qwen3-32B, manteve forte competitividade, superando modelos como o o1 da OpenAI em testes como o LiveCodeBench.
O Alibaba também destaca que o Qwen3 se sobressai em chamadas de ferramentas, interpretação de instruções e reprodução de formatos de dados específicos. Além dos downloads diretos, usuários podem acessar os modelos em provedores de nuvem como Fireworks AI e Hyperbolic.
Ao TechCrunch, Tuhin Srivastava, CEO da Baseten, comentou:
Os EUA estão redobrando as restrições à venda e à compra de chips para a China, mas modelos como o Qwen 3, que são de última geração e abertos… sem dúvida serão usados internamente (…) Isso reflete a realidade de que as empresas estão tanto desenvolvendo suas próprias ferramentas quanto comprando produtos prontos por meio de empresas de modelo fechado como a Anthropic e a OpenAI.