A Google oferece novas funcionalidades `Imagen 3`no Gemini, Gemini Advanced, Business e Enterprise


A Google disponibiliza, a partir de hoje, novas funcionalidades mostradas durante a Google I/O. O rollout do novo modelo de geração de imagens, Imagen 3 vai passar a estar disponível no Gemini, Gemini Advanced, Business e Enterprise. 


A Google atualizou as capacidades criativas de geração de imagens e, ao longo dos próximos dias, irá levar o modelo de geração de imagens mais recente, o Imagen 3, às Aplicações Gemini e expandir a sua disponibilidade para utilizadores em todos os idiomas.

Exemplo das imagens geradas utilizando prompts – os resultados podem variar.


 – Uma imagem animada de um pequeno dragão a sair de um ovo, num prado iluminado pelo sol, rodeado por borboletas brilhantes curiosas. Cores vibrantes, escalas detalhadas.


– Uma imagem fotorrealista de uma vista de montanha deslumbrante com picos irregulares e cumes cobertos de neve, banhada pelo brilho quente do pôr do sol. Nuvens dramáticas, pintadas em tons vibrantes de laranja, rosa e roxo, cruzam o céu, projetando sombras longas na paisagem acidentada.


 – Imagem de um vestido de baile feito de guardanapos de papel num showroom elegante.



 – Uma pintura abstrata vibrante com as palavras “Dream Big” espalhadas na tela e em cores fortes.




O Imagen 3 estabelece um novo padrão na qualidade de imagem, gerando imagens com apenas algumas palavras. Pode até pedir ao Gemini para criar imagens em vários estilos – como paisagens fotorrealistas, pinturas a óleo com textura ou cenas animadas (whimsical claymation).


Legenda: Imagen 2 vs. Imagen 3




O Imagen 3 traz funcionalidades avançadas de geração de imagens que vêm com proteções integradas e em consonância com os princípios de design de produto. Numa vasta gama de benchmarks, o Imagen 3 tem um desempenho favorável em comparação com outros modelos de geração de imagens disponíveis. E tal como acontece com o Imagen 2, utilizamos o SynthID, a ferramenta digital da Google para assinalar com marcas de água as imagens geradas por IA.

Os princípios de design são claros: do início ao fim, o utilizador mantém o controlo do processo criativo. Se a imagem inicial obtida não corresponder às expectativas, basta pedir ao Gemini o que gostaria de mudar e será gerada uma nova imagem.

Ao longo dos próximos dias, a o sistema Gemini da Google  irá também disponibilizar a geração de imagens de pessoas, com uma versão de acesso prévio para os utilizadores Gemini Advanced, Business e Enterprise, a começar com o inglês. Trabalhámos para fazer melhorias técnicas no produto, bem como com conjuntos de avaliação melhorados, exercícios de red teaming e princípios de produto claros.


A google diz não apoiar  a geração de imagens fotorrealistas de indivíduos identificáveis, representações de menores ou cenas excessivamente sangrentas, violentas ou sexuais. 



“É claro que nem todas as imagens que o Gemini cria serão perfeitas, mas iremos continuar a ouvir o feedback dos utilizadores com acesso prévio no Gemini Advanced à medida que continuamos a melhorar. Iremos implementá-lo gradualmente, com o objetivo de o levar a mais utilizadores e idiomas em breve”, refere a multinacional americana.




Para estar entre os primeiros a experimentar estas novas funcionalidades, experimente hoje mesmo o Gemini Advanced ou inscreva-se no Gemini for Workspace.

Source link

Deixe um comentário

O seu endereço de e-mail não será publicado. Campos obrigatórios são marcados com *

Rolar para cima