Pular para o conteúdo

OpenAI desafia limites da IA e ganha medalha de ouro em matemática; o problema é que não veremos esse modelo no ChatGPT

Banner Aleatório

A OpenAI atingiu um novo marco em sua busca pelo desenvolvimento da “IA Geral”. No que já é considerado histórico, um modelo experimental, ainda sem nome, de linguagem e raciocínio da empresa ganhou uma medalha de ouro na Olimpíada Internacional de Matemática (IMO) de 2025, realizada em Sunshine Coast, Austrália.

Banner Aleatório

O modelo da OpenAI resolveu cinco dos seis problemas do exame oficial, obtendo 35 dos 42 pontos possíveis — o suficiente para conquistar a cobiçada medalha de ouro. De fato, apenas 10% dos 630 participantes humanos alcançaram essa distinção.

1200 800 bc2c
(Imagem: Marcos Merino/Genbeta)

Condições de competição humana, sem atalhos

A inteligência artificial também foi avaliada sob as mesmas condições que os participantes humanos: duas sessões de 4 a 5 horas, sem acesso à internet ou ferramentas externas, e as soluções foram escritas em linguagem natural. As soluções do modelo (disponíveis no GitHub) foram avaliadas anonimamente por ex-medalhistas da IMO. Nas palavras de Sebastien Bubeck, pesquisador da OpenAI:

Generalidade, não especialização: a chave para o progresso

O mais surpreendente não é apenas o resultado, mas como ele foi obtido. Ao contrário de modelos anteriores, como o AlphaGeometry da DeepMind (projetado especificamente para resolver problemas de geometria), o modelo da OpenAI é um sistema de linguagem de uso geral que nunca havia sido treinado especificamente para a Olímpiada Internacional de Matemática.

De acordo com o líder do projeto, Alexander Wei, seu desempenho foi alcançado por meio de novas técnicas de aprendizado por reforço e escalonamento de computação em tempo de teste, sem a necessidade de ajuste especializado. “Este modelo pensa por horas. Não é rápido, mas é bem feito”, explicou Noam Brown, outro membro da equipe. A chave parece estar na combinação de raciocínio prolongado, estrutura lógica e habilidades de síntese narrativa.

Tudo isso contrasta com outros modelos de linguagem, incluindo o próprio GPT-4 e concorrentes como Gemini 2.5 Pro, DeepSeek-R1 ou Grok-4, que não conseguiram nem atingir a pontuação mínima para uma medalha de bronze em testes semelhantes, de acordo com dados da plataforma MathArena.

Uma prévia de como será a IA em geral?

O CEO da OpenAI, Sam Altman, logo chamou isso de “um indicador significativo do progresso da IA na última década”, relata o portal parceiro Genbeta. Para a OpenAI, esse feito representa não apenas um avanço no domínio da matemática, mas um avanço crucial em direção à inteligência artificial geral (IAG).

Por isso, a empresa deixou claro nas redes sociais que esta versão do modelo não será lançada ao público tão cedo, embora tenha confirmado a chegada iminente do GPT-5 — que ainda não incluirá esse recurso avançado. A empresa enfatiza que se trata de um experimento de pesquisa e que levará meses até que uma versão comercial do modelo com esses recursos seja considerada. Ainda assim, eles dizem que o resultado foi tão surpreendente que nem mesmo a OpenAI esperava um nível tão alto de desempenho tão rápido.

A competição nunca dorme

Ao contrário da OpenAI, a DeepMind adotou um caminho mais especializado, combinando IA com algoritmos de busca clássicos para enfrentar desafios matemáticos. No entanto, o generalista Gemini 2.5 Pro obteve apenas 13 pontos nos mesmos testes, e suas respostas estavam repletas de erros de lógica e argumentos incompletos.

Até mesmo críticos renomados do otimismo em relação à IA, como o cientista Gary Marcus, consideraram a conquista do modelo da OpenAI “genuinamente impressionante”. No entanto, ele também levantou algumas questões importantes: qual foi o custo computacional por problema? Quão reprodutível é esse feito? E, talvez o mais importante, qual é o propósito disso, além de uma demonstração espetacular? Ainda assim, ele reconheceu que “não podemos ignorar isso”.


Inscreva-se no canal do IGN Brasil no YouTube e visite as nossas páginas no TikTok, Facebook, Threads, Instagram, Bluesky, X e Twitch!



Source link

Join the conversation

O seu endereço de e-mail não será publicado. Campos obrigatórios são marcados com *