A OpenAI está tornando mais fácil editar imagens no ChatGPT e a criação de recursos visuais para o trabalho que incluam textos longos, o que pode expandir o apelo do chatbot para empresas e usuários comuns.
Durante um evento transmitido ao vivo nesta terça-feira, a empresa com sede em São Francisco mostrou como os usuários do ChatGPT poderão refinar imagens por meio de uma série de conversas com o chatbot. Um usuário poderia, por exemplo, solicitar uma imagem de um caracol em uma cidade, e depois pedir para mudar parte do cenário e adicionar um chapéu.
O ChatGPT também será capaz de criar imagens com texto coerente, de acordo com a empresa, tornando-o mais apto a gerar diagramas, infográficos e logotipos para usos profissionais. Uma pessoa poderia pedir ao chatbot para gerar uma imagem fotorrealista de um cardápio personalizado, por exemplo, ou de um mapa.
Ele também será capaz de executar instruções mais complicadas dos usuários sobre a composição de uma imagem, disse a empresa.
A OpenAI tem tentado cada vez mais posicionar o ChatGPT como uma espécie de aplicativo completo, que oferece um motor de busca, assistente de voz e gerador de vídeos. Com as melhorias mais recentes, a OpenAI está tentando incorporar recursos de imagem mais avançados, que poderiam ser aplicáveis em uma combinação de usos pessoais e profissionais.
O jogo dos seis erros da inteligência artificial
/i.s3.glbimg.com/v1/AUTH_da025474c0c44edd99332dddb09cabe8/internal_photos/bs/2024/O/g/0AfkXETSefvFzCYpVhBw/106073085-ec-credito-imagem-gerada-por-ia-midjourney-prompt-the-hyperrealistic-image-depicts-the-ma.jpg)
/i.s3.glbimg.com/v1/AUTH_da025474c0c44edd99332dddb09cabe8/internal_photos/bs/2024/O/g/0AfkXETSefvFzCYpVhBw/106073085-ec-credito-imagem-gerada-por-ia-midjourney-prompt-the-hyperrealistic-image-depicts-the-ma.jpg)
O que foi informado ao sistema: imagem hiper-realista retrata um homem tirando uma selfie com os amigos em um cinema lotado. As pessoas assistem a uma comédia e riem muito — Foto: Imagem gerada por Midjourney
/i.s3.glbimg.com/v1/AUTH_da025474c0c44edd99332dddb09cabe8/internal_photos/bs/2024/Q/3/YOLFuJTWuG2HaoaVE25g/106073085-ec-credito-imagem-gerada-por-ia-midjourney-prompt-the-hyperrealistic-image-depicts-the-ma-1-.jpg)
/i.s3.glbimg.com/v1/AUTH_da025474c0c44edd99332dddb09cabe8/internal_photos/bs/2024/Q/3/YOLFuJTWuG2HaoaVE25g/106073085-ec-credito-imagem-gerada-por-ia-midjourney-prompt-the-hyperrealistic-image-depicts-the-ma-1-.jpg)
No cinema. A figura que segura o celular tem as mãos deformadas — Foto: Imagem gerada por IA/Midjourney
Publicidade
/i.s3.glbimg.com/v1/AUTH_da025474c0c44edd99332dddb09cabe8/internal_photos/bs/2024/w/w/WbJWvdQH6rEcsxxhBhzQ/106073097-ec-credito-imagem-gerada-por-ia-midjourney-prompt-a-conductor-leads-an-orchestra-conducts.jpg)
/i.s3.glbimg.com/v1/AUTH_da025474c0c44edd99332dddb09cabe8/internal_photos/bs/2024/w/w/WbJWvdQH6rEcsxxhBhzQ/106073097-ec-credito-imagem-gerada-por-ia-midjourney-prompt-a-conductor-leads-an-orchestra-conducts.jpg)
Harmonia: Um maestro conduz uma orquestra, rege com energia, a câmera está de costas para o maestro, os músicos estão de frente para a câmera, ele toca a Nona Sinfonia de Beethoven – Foto: imagem gerada por IA/Midjourney
/i.s3.glbimg.com/v1/AUTH_da025474c0c44edd99332dddb09cabe8/internal_photos/bs/2024/6/L/arZQ3aSguk4I4UnjeBBg/106073097-ec-credito-imagem-gerada-por-ia-midjourney-prompt-a-conductor-leads-an-orchestra-conducts.jpg)
Regência. A imagem exibe mão direita do maestro com dedo alongado. E a batuta se assemelha a um arco de violino — Foto: Imagem gerada por IA/Midjourney
Publicidade
/i.s3.glbimg.com/v1/AUTH_da025474c0c44edd99332dddb09cabe8/internal_photos/bs/2024/P/q/XLsEZlQeOQQSVhw7lcwA/106073077-ec-credito-imagem-gerada-por-ia-midjourney.-prompt-with-arms-crosse.jpg)
O que foi informado ao sistema de inteligência artificial: imagem exibe uma pessoa com os braços cruzados, não foi solicitado que aparecesse o rosto – foto: imagem criada por IA/Midjourney
/i.s3.glbimg.com/v1/AUTH_da025474c0c44edd99332dddb09cabe8/internal_photos/bs/2024/R/E/2Rz8DUTJA8EZNPyQCoEQ/106073077-ec-credito-imagem-gerada-por-ia-midjourney.-prompt-with-arms-crosse.jpg)
Em excesso. Imagem gerada por inteligência artificial mostra uma pessoa com mais um braço — Foto: Imagem gerada por IA/Midjourney
Publicidade
/i.s3.glbimg.com/v1/AUTH_da025474c0c44edd99332dddb09cabe8/internal_photos/bs/2024/B/8/8rXBM7S5K4mld8A9KYiA/106073063-ec-dente1jpg-credito-imagem-gerada-por-ia-midjourney-prompt-a-child-smiles-immensely-happ.jpg)
Alegria: Uma criança sorri imensamente feliz e até grita de boca aberta de tanta felicidade quando recebe um presente. Esta imagem serve como uma prova do poder da felicidade — Foto: Imagem gerada por IA/Midjourney
/i.s3.glbimg.com/v1/AUTH_da025474c0c44edd99332dddb09cabe8/internal_photos/bs/2024/d/t/0mbdcPQcK2iBCko4ATCA/106073063-ec-dente1jpg-credito-imagem-gerada-por-ia-midjourney-prompt-a-child-smiles-immensely-happ-1-.jpg)
Sorriso assustador. O dente da criança que recebe o presente se confunde com a gengiva — Foto: Imagem gerada por IA/Midjourney
Publicidade
/i.s3.glbimg.com/v1/AUTH_da025474c0c44edd99332dddb09cabe8/internal_photos/bs/2024/i/m/sdP1QyQlCy3MhKLcoJ0g/106073079-ec-credito-imagem-gerada-por-ia-midjourney.-prompt-production-still-of-a-brazilian-singe-1-.jpg)
Dueto inusitado: Produção exibe a cantora brasileira Anitta cantando com o líder do Coldplay, Crhis Martin, dançando e cantando no palco, com luz de neon — Foto: Imagem gerada por IA/Midjourney
/i.s3.glbimg.com/v1/AUTH_da025474c0c44edd99332dddb09cabe8/internal_photos/bs/2024/n/c/WGBKgDQw67slQEjTU0NQ/106073079-ec-credito-imagem-gerada-por-ia-midjourney.-prompt-production-still-of-a-brazilian-singe.jpg)
Atenção ao vocalista. A mão direita do cantor Chris Martin aparece com seis dedos — Foto: Imagem gerada por IA/Midjourney
Publicidade
/i.s3.glbimg.com/v1/AUTH_da025474c0c44edd99332dddb09cabe8/internal_photos/bs/2024/B/O/bp8KovREqBQ5Pvb5AGjg/106086327-production-still-a-hundred-capybara-the-city-of-rio-de-janeiro-in-the-background-rain-driz.jpg)
Apreciando a vista. Um grupo de capivaras com a cidade do Rio de Janeiro ao fundo, em um dia de garoa, imagem no estilo de publicações voltadas para a vida animal — Foto: Imagem gerada por IA/Midjourney
/i.s3.glbimg.com/v1/AUTH_da025474c0c44edd99332dddb09cabe8/internal_photos/bs/2024/k/H/QAJqWJRlyhC5cEASVPCA/106086327-production-still-a-hundred-capybara-the-city-of-rio-de-janeiro-in-the-background-rain-driz-2-.jpg)
É esse animal mesmo? Capivara aparece de rabo e mais parece um rato — Foto: Imagem gerada por IA/Midjourney
Publicidade
Os erros da IA
Isso também pode ajudar o ChatGPT a se manter à frente dos chatbots de concorrentes, como o xAI de Elon Musk, que também adicionaram geradores de imagem.
Como ocorre com outros usos de IA, no entanto, o ChatGPT pode inventar coisas ao gerar imagens, como incluir texto com nomes de países fictícios em uma imagem. Em uma postagem no blog, a empresa disse que esses erros podem acontecer com solicitações menos detalhadas dos usuários.
A OpenAI também afirmou que sua IA pode ter dificuldades em criar textos pequenos e textos em alfabetos não latinos, entre outros problemas.
Também pode levar até um minuto para produzir imagens com o recurso atualizado, de acordo com uma postagem no blog da empresa. Durante a transmissão ao vivo, o CEO da OpenAI, Sam Altman, disse que isso acontece porque as imagens são mais detalhadas.
Os novos recursos estarão disponíveis a partir desta terça-feira por meio do modelo GPT-4o da OpenAI, que é aberto a usuários gratuitos e pagos. A empresa disse que lançará os novos recursos nas próximas semanas para os desenvolvedores de software que usam sua interface de programação de aplicativos.