- OpenAI reduz preços em até 50% com o Flex
- Verificação de identidade vira exigência para uso avançado
- Flex entra na disputa com modelos econômicos do Google
A OpenAI acaba de apresentar o Flex, um novo formato de processamento de IA que reduz custos em troca de menor desempenho. O serviço chega para usuários que priorizam economia em tarefas não urgentes.
Com essa estratégia, a empresa de Sam Altman tenta bater de frente com rivais como o Google, que lançou recentemente seu modelo econômico Gemini 2.5 Flash.
Flex oferece IA mais acessível e econômica
O Flex já está disponível em fase beta para os modelos O3 e O4-mini. Esses modelos funcionam com uma lógica de “uso flexível”, ou seja, com possíveis delays e indisponibilidades pontuais. A proposta atende quem precisa de IA para funções como testes, enriquecimento de dados e automações assíncronas.
A mudança no preço é significativa. O custo do O3 caiu de R$ 10 para R$ 5 por milhão de tokens de entrada, e de R$ 40 para R$ 20 por milhão de tokens de saída. O O4-mini, por sua vez, agora cobra R$ 0,55 por milhão de tokens de entrada e R$ 2,20 por milhão de tokens de saída, exatamente metade do valor anterior.
Com esses novos preços, a OpenAI mira principalmente empresas que precisam de grande volume de processamento com baixo custo. O anúncio sinaliza que a empresa pretende ganhar mercado entre os desenvolvedores mais sensíveis ao preço.
Verificação de identidade se torna obrigatória
O novo formato Flex não vem sozinho. A OpenAI aproveitou o anúncio para avisar que usuários dos níveis 1 a 3 da plataforma terão que passar por verificação de identidade. O processo já se tornou exigência para o uso de funcionalidades como resumos de raciocínio e API de streaming dos modelos mais avançados.
A empresa justificou a nova exigência como uma forma de impedir abusos na plataforma, como o uso de IA para atividades proibidas. A OpenAI reforçou que o objetivo é proteger o sistema e oferecer mais segurança ao ecossistema de desenvolvedores.
Porém, a disputa por preço e flexibilidade se intensificou. Enquanto o Flex oferece um custo reduzido com sacrifício de performance, o Google responde com modelos como o Gemini 2.5 Flash, que foca em tarefas rápidas e eficientes.
Ainda mais, com o Flex, a OpenAI tenta mostrar que é possível pagar menos para usar IA, desde que a pressa não seja prioridade.