Atualização da OpenAI acelera a geração visual, reduz erros em edições sucessivas e cria um espaço dedicado a imagens dentro da ferramenta
A OpenAI anunciou nesta terça-feira, 16, uma ampla atualização nas ferramentas de edição e geração de imagens integradas ao ChatGPT. A novidade traz um novo modelo visual, descrito pela empresa como o mais avançado já lançado, com foco em maior precisão nas instruções, edições mais detalhadas e um ganho significativo de desempenho.
Segundo a companhia, a geração de imagens passa a ser até quatro vezes mais rápida, o que reduz o tempo entre ajustes sucessivos e torna o uso mais viável em tarefas cotidianas. A proposta é aproximar o recurso de um ambiente de criação prática, e não apenas de experimentação visual.
Um dos principais avanços está na edição de imagens enviadas pelo usuário. O novo modelo passa a alterar apenas os elementos explicitamente solicitados, preservando características como iluminação, enquadramento, cores e aparência de pessoas retratadas, mesmo após múltiplas modificações consecutivas – um problema persistente dos modelos anteriores.
A OpenAI afirma que essa melhoria amplia a confiabilidade do sistema em usos como retoques fotográficos, testes de roupas e penteados, aplicação de filtros visuais e transformações conceituais, sem comprometer a identidade da imagem original.
O modelo também apresenta avanços em diferentes tipos de edição, como adicionar ou remover objetos, combinar imagens, mesclar elementos e reorganizar composições. A intenção é permitir intervenções mais complexas sem perda de consistência visual.
Outro ponto destacado é a melhoria no seguimento de instruções. O sistema passa a interpretar comandos com mais fidelidade, o que facilita tanto edições pontuais quanto a criação de composições originais mais elaboradas, respeitando relações espaciais e visuais definidas pelo usuário.
A renderização de texto dentro das imagens também evoluiu. De acordo com a OpenAI, o modelo agora consegue lidar melhor com textos menores, mais densos e com orientações detalhadas, um desafio recorrente em sistemas de geração visual.
Além do modelo em si, o ChatGPT ganha uma área dedicada exclusivamente à criação de imagens. Esse novo espaço reúne estilos predefinidos, filtros e ideias populares, atualizadas periodicamente, reduzindo a necessidade de escrever prompts detalhados para explorar a geração de imagems.
No ambiente corporativo, a empresa acredita que as melhorias podem agilizar fluxos de trabalho em áreas como marketing, design, comércio eletrônico e comunicação interna, ao permitir edições rápidas e consistentes em materiais visuais ao longo de várias iterações.
Apesar dos avanços, a OpenAI reconhece limitações. O sistema ainda apresenta dificuldades com pedidos pouco específicos, infográficos complexos e conteúdos em idiomas que não o inglês, além de uma tendência a exagerar o realismo em alguns estilos visuais.
O novo modelo de imagens passa a estar disponível a partir desta terça para todos os usuários do ChatGPT e também para desenvolvedores via API, sob o nome GPT Image 1.5. A versão anterior continuará acessível como um modelo personalizado dentro da plataforma.

