Pular para o conteúdo

Google lança Gemma 3, sua IA de código aberto para desenvolvedores

O Google anunciou recentemente o lançamento do Gemma 3, uma nova geração de seu modelo de linguagem de código aberto, projetado especificamente para desenvolvedores. Este modelo, conhecido como LLM (Large Language Model), é multimodal e otimizado para funcionar com GPUs da Nvidia, além de estar integrado ao catálogo de API da Nvidia e ao ROCm da AMD. Com suporte para 140 idiomas, o Gemma 3 traz avanços significativos na identificação de texto e imagens, incluindo a análise de vídeos curtos.

O anúncio foi feito no dia (12), destacando que o Gemma 3 não requer o pagamento de API para ser utilizado, tornando-o uma ferramenta acessível para desenvolvedores. Baseado no Gemini 2, utilizado na inteligência artificial generativa comercial do Google, o Gemma 3 promete ser uma solução robusta e versátil para diversas aplicações.

Quais são as novidades?

O Gemma 3 será disponibilizado em quatro tamanhos de parâmetros: 1 bilhão (1B), 4 bilhões (4B), 12 bilhões (12B) e 27 bilhões (27B). Esses parâmetros são cruciais para o desempenho e os requisitos de hardware da inteligência artificial. Modelos com maior número de parâmetros requerem mais processamento, mas também oferecem maior capacidade de aprendizado e análise.

De acordo com Gus Martins, gerente de produtos do Gemma, a variedade de tamanhos atende às diferentes necessidades dos desenvolvedores. Para aplicativos móveis mais simples, os modelos de 1B ou 4B são suficientes e podem até ser executados em dispositivos móveis. Já para tarefas mais complexas, as versões de 12B e 27B são mais adequadas.

Está otimizado para desenvolvedores?

O Google otimizou para GPUs da Nvidia, integrando-o ao catálogo de API da empresa, o que facilita a prototipagem de aplicações. Além disso, o modelo está integrado ao ROCm da AMD, uma plataforma para programação de GPUs. As TPUs em nuvem do Google também foram ajustadas para suportar o Gemma 3, garantindo flexibilidade e eficiência para os desenvolvedores.

O modelo é capaz de analisar vídeos curtos, uma funcionalidade que não está disponível na versão de 1B. Essa capacidade de análise multimodal é um dos destaques do Gemma 3, ampliando as possibilidades de uso em diferentes contextos e aplicações.

Como começar a usar?

Desenvolvedores interessados em explorar o potencial podem acessá-lo através do Google AI Studio. Esta plataforma oferece um ambiente integrado para experimentar e implementar soluções baseadas no LLM de código aberto do Google.

Com o suporte para 140 idiomas e melhorias significativas na identificação de texto e imagens, o Gemma 3 se posiciona como uma ferramenta poderosa para desenvolvedores que buscam inovação e eficiência em seus projetos.

Source link

Join the conversation

O seu endereço de e-mail não será publicado. Campos obrigatórios são marcados com *