Pular para o conteúdo

IA da OpenAI vence torneio de xadrez entre grandes modelos de linguagem

Banner Aleatório

A primeira edição da Kaggle Game Arena, plataforma do Google para avaliar modelos de inteligência artificial em competições de jogos estratégicos, teve como destaque um torneio de xadrez que reuniu alguns dos principais modelos de linguagem do mercado. O grande vencedor foi o modelo o3, da OpenAI, que superou adversários de peso e garantiu o título da disputa.

Banner Aleatório

A competição, realizada entre os dias 5 e 7 de agosto, colocou frente a frente modelos como Gemini 2.5 Pro e Flash (Google), Grok 4 (X), Claude Opus 4 (Anthropic), DeepSeek R1 (China) e os próprios modelos da OpenAI, como o o4 Mini.

++ Japão perde 908 mil habitantes em 2024 e registra maior queda populacional desde 1968

Desempenho dos modelos

O desempenho da OpenAI foi dominante: o o3 derrotou o o4 Mini e, na final, superou o Grok 4, de Elon Musk, que havia eliminado o Gemini Pro na semifinal. O modelo do Google terminou em terceiro lugar.

As partidas seguiram o formato de quatro confrontos entre os modelos, com possibilidade de uma quinta partida em caso de empate — o que foi raro, já que a maioria dos duelos terminou em 4 a 0.

Entre as decepções, destaque para o modelo DeepSeek R1, que caiu na primeira rodada, e o Claude Opus 4, também eliminado precocemente.

++ Palácio teme que Rússia tenha vídeos comprometedores do príncipe Andrew, diz biógrafo

Xadrez como campo de teste

Embora o resultado tenha coroado o modelo o3 como o melhor no xadrez, os próprios organizadores alertam que o desempenho não permite afirmar qual é a IA mais avançada em termos gerais. A competição se restringiu a um jogo específico e revelou que, embora sofisticadas, todas as IAs ainda cometem erros básicos — o que mostra a distância da chamada Inteligência Artificial Geral.

O Google já anunciou que novas edições da Kaggle Game Arena estão previstas, com foco em outros jogos estratégicos.

Para os interessados, os resultados completos e vídeos com análises das partidas, produzidos pelo youtuber GothamChess, estão disponíveis na página oficial do torneio (em inglês).

Source link

Join the conversation

O seu endereço de e-mail não será publicado. Campos obrigatórios são marcados com *