A Google disponibiliza, a partir de hoje, novas funcionalidades mostradas durante a Google I/O. O rollout do novo modelo de geração de imagens, Imagen 3 vai passar a estar disponível no Gemini, Gemini Advanced, Business e Enterprise.
Exemplo das imagens geradas utilizando prompts – os resultados podem variar.
– Uma imagem animada de um pequeno dragão a sair de um ovo, num prado iluminado pelo sol, rodeado por borboletas brilhantes curiosas. Cores vibrantes, escalas detalhadas.
– Uma imagem fotorrealista de uma vista de montanha deslumbrante com picos irregulares e cumes cobertos de neve, banhada pelo brilho quente do pôr do sol. Nuvens dramáticas, pintadas em tons vibrantes de laranja, rosa e roxo, cruzam o céu, projetando sombras longas na paisagem acidentada.
– Imagem de um vestido de baile feito de guardanapos de papel num showroom elegante.
– Uma pintura abstrata vibrante com as palavras “Dream Big” espalhadas na tela e em cores fortes.
O Imagen 3 estabelece um novo padrão na qualidade de imagem, gerando imagens com apenas algumas palavras. Pode até pedir ao Gemini para criar imagens em vários estilos – como paisagens fotorrealistas, pinturas a óleo com textura ou cenas animadas (whimsical claymation).
Legenda: Imagen 2 vs. Imagen 3
O Imagen 3 traz funcionalidades avançadas de geração de imagens que vêm com proteções integradas e em consonância com os princípios de design de produto. Numa vasta gama de benchmarks, o Imagen 3 tem um desempenho favorável em comparação com outros modelos de geração de imagens disponíveis. E tal como acontece com o Imagen 2, utilizamos o SynthID, a ferramenta digital da Google para assinalar com marcas de água as imagens geradas por IA.
Os princípios de design são claros: do início ao fim, o utilizador mantém o controlo do processo criativo. Se a imagem inicial obtida não corresponder às expectativas, basta pedir ao Gemini o que gostaria de mudar e será gerada uma nova imagem.
Ao longo dos próximos dias, a o sistema Gemini da Google irá também disponibilizar a geração de imagens de pessoas, com uma versão de acesso prévio para os utilizadores Gemini Advanced, Business e Enterprise, a começar com o inglês. Trabalhámos para fazer melhorias técnicas no produto, bem como com conjuntos de avaliação melhorados, exercícios de red teaming e princípios de produto claros.
A google diz não apoiar a geração de imagens fotorrealistas de indivíduos identificáveis, representações de menores ou cenas excessivamente sangrentas, violentas ou sexuais.
“É claro que nem todas as imagens que o Gemini cria serão perfeitas, mas iremos continuar a ouvir o feedback dos utilizadores com acesso prévio no Gemini Advanced à medida que continuamos a melhorar. Iremos implementá-lo gradualmente, com o objetivo de o levar a mais utilizadores e idiomas em breve”, refere a multinacional americana.
Para estar entre os primeiros a experimentar estas novas funcionalidades, experimente hoje mesmo o Gemini Advanced ou inscreva-se no Gemini for Workspace.