- Ferramenta da OpenAI realiza tarefas como gerar slides e navegar em apps.
- Agente acessa Gmail, GitHub e terminal com comandos via IA.
- OpenAI aplicou novos sistemas de segurança em tempo real.
A OpenAI anunciou, nesta quinta-feira (18), o lançamento do agente ChatGPT, uma ferramenta de inteligência artificial que pode realizar tarefas computacionais completas em nome do usuário. Disponível para assinantes dos planos Pro, Plus e Team, o novo agente permite executar código, gerar apresentações, planejar eventos e navegar por sites.
A OpenAI explica que o agente representa um avanço significativo na transformação do ChatGPT em uma plataforma que executa ações práticas, não apenas respostas. A empresa afirma que o agente “pode analisar sites, planejar ações e usar ferramentas” para entregar resultados mais complexos e úteis.
Os usuários ativam o recurso escolhendo o “modo agente” no menu de ferramentas do ChatGPT. A partir disso, é possível interagir com o agente usando linguagem natural, sem comandos técnicos.
Além disso, o novo modelo tem acesso a conectores com apps como Gmail e GitHub. Isso permite buscar informações diretamente nessas plataformas para responder com base em dados reais. Ele também pode acessar um terminal para executar scripts e usar APIs externas.
Novo modelo da OpenAI supera benchmarks e reforça medidas de segurança
De acordo com a OpenAI, o agente ChatGPT oferece desempenho de ponta. No benchmark Último Exame da Humanidade, atingiu 41,6% (pass@1), quase o dobro das versões anteriores. No FrontierMath, obteve 27,4% com ferramentas, contra 6,3% do o4-mini.
Porém, a empresa também reconhece os riscos. Em seu relatório, designou o agente como modelo de “alta capacidade” para domínios como armas biológicas e químicas.
A OpenAI afirma que não encontrou evidências de uso indevido, mas adotou uma abordagem preventiva. Entre as novas salvaguardas, destaca-se um sistema de monitoramento em tempo real, que analisa cada requisição e resposta para identificar conteúdos sensíveis.
Além disso, o modo memória foi desativado para evitar possíveis ataques por injeção de prompt e vazamento de dados.
A OpenAI reconhece que a tecnologia de agentes ainda apresenta limitações no mundo real. No entanto, aposta que este lançamento representa um passo mais concreto na direção de agentes funcionais e responsáveis.
