A Microsoft lançou um desafio instigante para hackers e entusiastas de tecnologia. A empresa, em parceria com o Institute of Science and Technology Australia e a ETH Zurich, está promovendo o LLMail-Inject, uma competição que visa testar a segurança de um serviço de e-mail simulado integrado a um modelo de linguagem de última geração.
Os participantes mais habilidosos poderão ganhar até R$ 60 mil (aproximadamente US$ 10 mil).
O objetivo do desafio é simples, mas desafiador: os hackers devem explorar vulnerabilidades do serviço simulado, que utiliza inteligência artificial para processar solicitações e gerar respostas automáticas.
Esse serviço não é real, mas foi projetado para se comportar como se fosse, permitindo que os participantes tentem induzir ações não autorizadas por meio de ataques criativos de injeção de prompt.
Os hackers terão que ser engenhosos, já que o sistema conta com várias camadas de proteção. Entre as ferramentas de defesa estão o PromptShield, que identifica comandos maliciosos, e o TaskTracker, que monitora mudanças no estado interno do modelo para detectar desvios de comportamento.
Além disso, o serviço também utiliza “destaques” para marcar dados fornecidos ao modelo, dificultando o sucesso de ataques.
Microsoft
A competição funciona da seguinte forma: o participante assume o papel de um invasor que envia e-mails fictícios a um usuário. O sistema responde automaticamente, mas o atacante não pode ver as saídas diretamente. O objetivo é fazer o modelo executar ações que não estavam previstas, como vazamento de dados simulados ou envio de comandos inesperados.
O desafio, que começou em 9 de dezembro e vai até 20 de janeiro, oferece prêmios que serão divididos entre as quatro melhores equipes. O primeiro lugar ganhará US$ 4.000, enquanto as demais equipes receberão valores escalonados até US$ 1.000.
Para participar, basta acessar o site oficial do LLMail-Inject, criar uma conta no GitHub e formar uma equipe com até cinco membros. Além dos prêmios em dinheiro, o evento promete um placar ao vivo e análises detalhadas das estratégias vencedoras.