Pular para o conteúdo

Um pouco de ajuda e o Gemini da Google venceu o Pokémon Blue

Banner Aleatório

O modelo de IA mais caro do Google parece ter superado um marco importante: vencer um jogo de 29 anos.

Banner Aleatório

Ontem à noite, o CEO do Google, Sundar Pichai, postou triunfante no X: “Que final! O Gemini 2.5 Pro acabou de completar Pokémon Blue!”

Para esclarecer, a transmissão ao vivo do Gemini jogando Pokémon foi criada por (em suas próprias palavras) “um engenheiro de software de 30 anos não afiliado ao Google”, que se identifica como Joel Z. No entanto, executivos do Google têm celebrado o feito.

Por exemplo, Logan Kilpatrick, líder de produto do Google AI Studio, postou no mês passado que o Gemini estava “fazendo progresso significativo ao completar Pokémon” e “ganhou sua 5ª insígnia (o segundo melhor modelo tinha apenas 3, usando um sistema diferente)”. Isso levou Pichai a brincar: “Estamos trabalhando na API, IA de Pokémon :)”

Por que Pokémon? Em fevereiro, a Anthropic destacou que seus modelos de IA Claude estavam jogando “Pokémon Red”, citando que o treinamento de “pensamento e ação” do Claude oferecia um grande impulso em tarefas inesperadas, como jogar um clássico. (“Pokémon Red” e “Blue” são versões diferentes de um jogo de Game Boy lançado em 1996, ligado à franquia Pokémon.) Há até um canal da Twitch onde Claude joga Pokémon, citado por Joel Z como inspiração.

Apesar do progresso, o Claude ainda não derrotou “Pokémon Red”. Isso significa que o Gemini é objetivamente melhor? Na página da Twitch, Joel Z pediu: “Não considere isso um benchmark para o desempenho de um modelo de linguagem em Pokémon. Não é possível comparar diretamente – Gemini e Claude usam ferramentas diferentes e recebem dados distintos.”

Ambos os modelos de IA precisam de ajuda para jogar – é aí que o agente mencionado entra, fornecendo capturas de tela do jogo com informações adicionais, permitindo que o modelo decida como responder (incluindo chamadas a agentes especializados) e pressione os botões correspondentes às instruções da IA.

Joel Z admitiu que houve “intervenções de desenvolvimento” para ajudar o Gemini a completar o jogo, mas afirmou que não houve trapaça.

“Minhas intervenções melhoram as habilidades gerais de tomada de decisão e raciocínio do Gemini”, disse. “Não dou dicas específicas – não há instruções diretas para desafios como o Monte.”

Ele acrescentou: “O Gemini Plays Pokémon ainda está em desenvolvimento ativo, e a estrutura continua a evoluir.”

Source link

Join the conversation

O seu endereço de e-mail não será publicado. Campos obrigatórios são marcados com *