Tech2 News Logo Dark Tech2 News Logo Light
Grupo de Ofertas
  • Notícias
  • Apps
  • Auto
  • Inteligência Artificial
  • Ciência
  • Celular
  • Games
  • Software
    • VPN
  • Apostas
Você está lendo: Claude supera Gemini e ChatGPT em teste de IA com Super Mario
Compartilhe
Font ResizerAa
Tech2Tech2
Pesquisar
  • Últimas Notícias
  • Apostas
  • Apps
  • Auto
  • Celular
  • Ciência
  • Computador
  • Curiosidades
  • Inteligência Artificial
  • Internet
  • Games
  • Software
    • VPN
  • Universo
Tech2 > Inteligência Artificial > Claude supera Gemini e ChatGPT em teste de IA com Super Mario
Inteligência Artificial

Claude supera Gemini e ChatGPT em teste de IA com Super Mario

Por Luciano Rodrigues
Última Atualização: 04/03/2025
Compartilhe
Claude supera Gemini e ChatGPT em teste de IA com Super Mario
Imagem: Dall-E
Compartilhe
  • Claude 3.7 lidera testes de IA no Super Mario Bros.
  • Modelos de raciocínio lento falham em jogos de tempo real.
  • Pesquisadores questionam se jogos são bons benchmarks para IA.

Um grupo de pesquisadores do Hao AI Lab, da Universidade da Califórnia em San Diego, colocou a inteligência artificial para testar suas habilidades em Super Mario Bros. e descobriu que o jogo representa um desafio maior do que outros benchmarks, como Pokémon.

O experimento avaliou o desempenho de diferentes modelos de IA e revelou que até mesmo os mais avançados enfrentam dificuldades para jogar Mario de forma eficiente.

O teste utilizou um emulador integrado ao GamingAgent, um framework desenvolvido pelo laboratório para permitir que as IAs controlassem Mario. O GamingAgent forneceu instruções básicas, como, por exemplo, mover-se ou pular para evitar um obstáculo ou inimigo, além de capturas de tela do jogo. Com base nesses dados, a IA gerava comandos em código Python para controlar o personagem.

Os resultados apontaram que o Claude 3.7 da Anthropic teve o melhor desempenho, seguido pelo Claude 3.5. Já o Gemini 1.5 Pro, do Google, e o GPT-4o, da OpenAI, demonstraram dificuldades para lidar com a jogabilidade.

IA x Mario: desafio em tempo real

Diferente de benchmarks tradicionais, Super Mario Bros. exige tempo de resposta imediato e habilidades de planejamento de movimentos complexos.

CONTINUA APÓS A PUBLICIDADE

Assim, os pesquisadores notaram que os modelos de raciocínio passo a passo, como o GPT-4o da OpenAI, se saíram pior do que modelos que operam sem esse tipo de estratégia. A demora na tomada de decisões prejudicou o desempenho, já que frações de segundo podem determinar o sucesso ou fracasso de um salto no jogo.

Apesar de os jogos serem usados há décadas para avaliar a evolução da IA, especialistas questionam se eles são indicadores confiáveis do avanço tecnológico.

O cientista e membro fundador da OpenAI, Andrej Karpathy, classificou esse tipo de teste como parte de uma “crise de avaliação”, argumentando que ainda não há métricas claras para determinar a real capacidade dos modelos de IA atuais.

Por outro lado, parece que a IA está tentando emular os humanos até jogando o querido Super Mario Bros.

Leia Também

Nova atualização do Gemini traz IA em tempo real e função surpreendente
Manus revoluciona com novo plano pago para equipes de IA
SAG-AFTRA processa Epic Games por uso de IA na voz de Darth Vader
Alation compra Numbers Station e aposta alto em agentes de IA
Google revoluciona a educação com novo app de IA para estudos
Sobre:ChatGPTClaudeGeminiIAinteligência artificialSuper Mario
Compartilhe:
Facebook Whatsapp Whatsapp Telegram Copiar Link
Luciano Rodrigues
PorLuciano Rodrigues
Siga:
Jornalista, assessor de comunicação, escritor e comunicador, com MBA em jornalismo digital e 12 anos de experiência, tendo passado também por alguns veículos no setor tech.
Grupo com as melhores ofertas, descontos e promoções!

Estamos constantemente buscando as melhores ofertas e descontos para compartilhar com você em nosso grupo.

Whatsapp

Mais Lidas

Flamengo x LDU Quito: prognóstico, onde assistir, escalações e odds para apostas

Futebol
Meta adia lançamento da IA Behemoth, sua tecnologia mais avançada

Meta adia lançamento da IA Behemoth, sua tecnologia mais avançada

IA da DeepMind supera humanos Um gênio em matemática e ciências

IA da DeepMind supera humanos: Um gênio em matemática e ciências

poker online

Brasileiros invadem torneio de poker online com premiação de R$300 mil

iPhone controlado pela mente Apple investe em tecnologia cerebral

iPhone controlado pela mente? Apple investe em tecnologia cerebral

  • Quem Somos
  • Política Editorial
  • Política de Privacidade
  • Sitemap
  • Contato

Redes: 

© 2024 Tech2. Todos os direitos reservado

Welcome Back!

Sign in to your account

Username or Email Address
Password

Lost your password?