
A OpenAI anunciou nesta quinta-feira (11) o GPT-5.2, nova família de modelos que passa a equipar o ChatGPT e mira diretamente a pressão do Gemini 3 Pro, do Google.
A atualização chega em tempo recorde, menos de um mês após o GPT-5.1, e foca em trabalho profissional, com avanços em planilhas, apresentações, código, agentes de longa duração e análises com contexto extenso. As versões começam a ser liberadas primeiro para quem assina planos pagos do serviço.
O que é o ChatGPT 5.2 e quando ele chega
No anúncio oficial, a empresa descreve o GPT-5.2 como seu modelo de fronteira mais avançado para trabalho baseado em conhecimento, voltado a empresas e profissionais que usam IA no dia a dia. A família estreia em três variantes principais dentro do ChatGPT:
- ChatGPT-5.2 Instant: versão rápida, pensada para uso cotidiano, busca de informação, tutoriais, traduções e respostas diretas.
- ChatGPT-5.2 Thinking: modo focado em tarefas complexas, com raciocínio mais profundo, melhor desempenho em programação, matemática, decisões estruturadas e uso intensivo de arquivos e documentos.
- ChatGPT-5.2 Pro: opção “top de linha”, com mais camadas de raciocínio e qualidade para perguntas difíceis, pesquisas técnicas e fluxos de trabalho sensíveis.
As três variantes começam a ser distribuídas gradualmente para usuários pagantes dos planos Go, Plus, Pro, Business e Enterprise, tanto no site quanto nos aplicativos do ChatGPT.
Na API, os modelos gpt-5.2, gpt-5.2-chat-latest e gpt-5.2-pro já aparecem para desenvolvedores.
Para quem usa a versão gratuita, a OpenAI ainda não definiu quando o GPT-5.2 será liberado, mantendo modelos anteriores como padrão.
GPT-5.2 chega após “código vermelho” e pressão do Gemini 3
O timing da atualização não é casual. Poucos dias depois do lançamento do GPT-5.1, o Gemini 3 Pro apareceu com forte desempenho em benchmarks de raciocínio, código e visão, assumindo o topo de rankings como o LMArena, onde usuários comparam respostas de diferentes IAs em “testes às cegas”.
Segundo reportagens, Sam Altman, CEO da OpenAI, teria acionado um “código vermelho” interno, exigindo aceleração no desenvolvimento para responder ao avanço do Google.
O resultado é o GPT-5.2 chegando apenas 29 dias após o GPT-5.1, um intervalo inusitadamente curto para um modelo de fronteira.
Além disso, o anúncio do GPT-5.2 foi feito no mesmo dia em que a empresa revelou um acordo multibilionário com a Disney para uso de personagens de franquias como Star Wars, Marvel e Pixar no gerador de vídeo Sora, movimento que reforça a estratégia de manter a OpenAI no centro das discussões sobre IA generativa.
Variantes Instant, Thinking e Pro: o que muda na prática
Na prática, o ChatGPT 5.2 reorganiza o uso dos modelos dentro do produto em três “sabores” principais, com funções menos nebulosas para o usuário comum e para empresas:
- Instant
- Respostas mais rápidas.
- Melhorias em busca de informação, tutoriais passo a passo, redação técnica e tradução.
- Conversa com tom mais natural, continuidade de contexto e explicações mais claras logo no início das respostas.
- Thinking
- Projetado para tarefas profundas: planejamento, raciocínio lógico, matemática avançada, análise de documentos longos e programação com múltiplos arquivos.
- Usa mais “esforço de raciocínio” por padrão, o que significa cadeias de pensamento mais extensas e estruturadas.
- É a variante que concentra os ganhos mais expressivos em benchmarks e em contexto longo.
- Pro
- Voltado para cenários em que a qualidade máxima é mais importante do que a velocidade.
- Libera um nível adicional de esforço de raciocínio (xhigh) para pesquisas complexas, matemática de fronteira e investigações científicas.
Para o usuário final, a mensagem é simples: Instant para uso diário, Thinking para trabalho exigente e Pro quando cada detalhe da resposta importa.


Benchmarks aproximam GPT-5.2 do Gemini 3 Pro
Nos testes internos e públicos, a OpenAI mostra o GPT-5.2 empatado ou à frente do Gemini 3 Pro em vários cenários. Em alguns deles, o modelo da empresa assume a liderança com folga.
Entre os números mais citados estão:
- SWE-bench Pro (engenharia de software em cenários reais):
- GPT-5.2 Thinking marca 55,6%, acima dos 50,8% do GPT-5.1 Thinking.
- SWE-bench Verified (engenharia em Python):
- GPT-5.2 Thinking chega a 80%, superando a geração anterior.
- ARC-AGI-2 (raciocínio abstrato de alta dificuldade):
- GPT-5.2 Thinking atinge 52,9%, enquanto o Gemini 3 Pro aparece em torno de 31,1% nessa mesma avaliação, segundo análises independentes.
- GPQA Diamond (perguntas científicas em nível de pós-graduação):
- GPT-5.2 Pro registra 93,2%, com o GPT-5.2 Thinking logo atrás, em 92,4%.
Em tarefas de trabalho profissional, o novo modelo também se destaca no GDPval, uma bateria que mede entregas reais em 44 ocupações, de apresentações de vendas a modelos financeiros.
No cenário sem empates, o GPT-5.2 Thinking vence profissionais humanos em 61% das comparações analisadas por avaliadores especialistas.
Um salto empolgante e perceptível na qualidade do resultado
Planilhas, apresentações e código viram foco central
Um dos recados mais claros desta geração é o foco em tarefas de escritório que consomem tempo e exigem atenção a detalhes. A OpenAI destaca que o GPT-5.2 Thinking está melhor em:
- Criar planilhas complexas, com fórmulas, referências cruzadas, projeções e formatação;
- Montar apresentações com narrativas estruturadas e slides mais organizados;
- Construir modelos financeiros, como projeções de fluxo de caixa, modelos de três demonstrativos e simulações de aquisições alavancadas;
- Programar com agentes, analisando bases de código extensas, propondo alterações e sugerindo correções com menos intervenção manual.
Nos testes internos com tarefas típicas de analistas juniores de investment banking, a pontuação média do GPT-5.2 Thinking cresceu 9,3 pontos percentuais em relação ao GPT-5.1, passando de 59,1% para 68,4%.


Em engenharia de software, empresas como Windsurf, Warp, JetBrains e outras relatam ganhos em design de interface, depuração de front-end e uso de agentes para programação interativa.
Menos alucinações, contexto maior e visão mais precisa
Outro ponto sensível para quem usa IA em decisões de negócio é a factualidade. Segundo a OpenAI, o GPT-5.2 Thinking reduz em cerca de 38% a frequência de respostas com erro factual em consultas reais do ChatGPT quando a ferramenta de busca está ativada, em comparação com o GPT-5.1 Thinking. Mesmo sem busca, a taxa de respostas corretas também sobe alguns pontos.


No campo do contexto longo, o GPT-5.2 Thinking se aproxima de 100% de acerto em cenários do benchmark interno MRCR v2 com múltiplas “agulhas” espalhadas por até 256 mil tokens de texto, o que equivale a centenas de páginas de conteúdo.
Isso facilita usos como:
- leitura e síntese de grandes relatórios corporativos,
- análise de contratos extensos,
- cruzamento de informações entre diversos documentos em um único fluxo de trabalho.
Na parte de visão, o GPT-5.2 Thinking reduz quase pela metade os erros em tarefas como interpretação de gráficos, leitura de interfaces de software e identificação de componentes em imagens técnicas.
Em benchmarks como CharXiv Reasoning e ScreenSpot Pro, o modelo apresenta ganhos significativos sobre o GPT-5.1.
Uso de ferramentas e agentes fica mais confiável
A OpenAI também enfatiza os avanços em chamada de ferramentas, área crítica para quem usa IA como “orquestradora” de fluxos de trabalho.
No benchmark τ2-bench, que simula tarefas de suporte ao cliente em setores reais, o GPT-5.2 Thinking chega a 98,7% no conjunto de telecom, acima do GPT-5.1 Thinking.
Na prática, esse tipo de melhoria permite que o modelo:
- coordene vários agentes para resolver uma demanda complexa,
- chame diversas APIs em sequência,
- mantenha o contexto de cada etapa com mais consistência,
- entregue respostas finais com menos “quebras” entre um passo e outro.
Para quem precisa de latência menor, a OpenAI afirma que o GPT-5.2 Thinking também se comporta melhor com esforço de raciocínio reduzido, superando o GPT-5.1 em cenários mais rápidos.
Segurança, saúde mental e proteções adicionais
No campo da segurança, o GPT-5.2 incorpora aprimoramentos da linha GPT-5 em safe completion, técnica usada para orientar o modelo a responder da forma mais útil possível dentro de limites definidos de uso.


Os destaques incluem:
- respostas mais adequadas em conversas sobre saúde mental,
- detecção mais cuidadosa de sinais de autoagressão ou dependência emocional da IA,
- redução de saídas problemáticas nesses contextos, tanto no Instant quanto no Thinking.
A empresa também iniciou a aplicação de um sistema de previsão de idade, que permite ajustar proteções de conteúdo para usuários menores de 18 anos, restringindo temas sensíveis.
A OpenAI diz que o GPT-5.2 ainda está longe de ser perfeito e recomenda verificação humana em qualquer uso crítico, mas apresenta os números como mais um passo incremental na direção de modelos mais responsáveis.


Preços, disponibilidade e o futuro dos modelos legados
Na API, o GPT-5.2 chega com precificação acima do GPT-5.1, mas ainda abaixo de outros modelos de fronteira. Os valores públicos são:
- gpt-5.2 / gpt-5.2-chat-latest
- Entrada: US$ 1,75 por 1 milhão de tokens
- Entrada em cache: US$ 0,18 por 1 milhão de tokens
- Saída: US$ 14 por 1 milhão de tokens
- gpt-5.2-pro
- Entrada: US$ 21 por 1 milhão de tokens
- Saída: US$ 168 por 1 milhão de tokens
Para comparação, o gpt-5.1 custa US$ 1,25 por 1 milhão de tokens de entrada e US$ 10 por 1 milhão de tokens de saída. A OpenAI argumenta que, apesar do valor por token maior, o custo total de muitas aplicações cai porque o GPT-5.2 usa menos tokens para atingir o mesmo nível de qualidade, principalmente em cenários com agentes.


No ChatGPT, os preços de assinatura permanecem os mesmos, e o GPT-5.2 passa a ser o padrão nos planos pagos. O GPT-5.1 continuará disponível como modelo legado por três meses, o que dá tempo para empresas compararem saídas, ajustarem fluxos de trabalho e migrarem com menos pressão.
Leia também:
Como o ChatGPT 5.2 recoloca a OpenAI na corrida da IA
Com o ChatGPT 5.2, a OpenAI tenta recuperar terreno em uma disputa que deixou de ser apenas técnica para se tornar estratégica. De um lado, o Gemini 3 Pro consolidou o Google em benchmarks de raciocínio visual e atuação como agente.
Do outro, o GPT-5.2 responde com números fortes em código, matemática, ciência, contexto longo e uso de ferramentas, reforçando o foco em tarefas economicamente valiosas e no dia a dia de empresas que precisam ganhar tempo em trabalhos de conhecimento.
O movimento chega acompanhado de uma infraestrutura cada vez mais robusta, em parceria com Microsoft e NVIDIA, e de acordos como o fechado com a Disney para o Sora, que apontam para um ecossistema em que texto, imagem, vídeo e agentes inteligentes convergem no mesmo ambiente.
Para quem trabalha com IA, a atualização abre um panorama em que modelos de fronteira começam a disputar diretamente tarefas de especialistas humanos em escala, com ganhos de velocidade e custo por entrega.
A questão que fica para os próximos meses é menos “quem tem o benchmark mais alto” e mais como empresas, desenvolvedores e criadores vão redesenhar processos em um contexto no qual o ChatGPT 5.2 e o Gemini 3 Pro já atuam como colaboradores quase permanentes em planilhas, códigos, reuniões e decisões estratégicas.
Fonte: OpenAI
