O Google está hospedando uma versão de sua conferência Cloud Subsequent em Tóquio esta semana, e está colocando o foco diretamente em ajustar seus bancos de dados para cargas de trabalho de IA (porque neste ponto em 2024, IA é a única coisa sobre a qual essas grandes empresas de tecnologia querem falar). Isso inclui atualizações em seu banco de dados Spanner SQL, que agora apresenta suporte a pesquisa de gráficos e vetores, bem como recursos estendidos de pesquisa de texto completo.
Este não seria um anúncio do Google sem alguns recursos do Gemini. Eles incluem o Gemini no BigQuery e o Looker para ajudar os usuários com engenharia e análise de dados, bem como tarefas de governança e segurança.
O Google argumenta que, embora a grande maioria das empresas acredite que a IA generativa será essencial para o sucesso de seus negócios, elas também sabem que muitos de seus dados permanecem sem gerenciamento, ficando fora do escopo de suas iniciativas de análise e IA.
“Eles realmente precisam sair de todos os seus silos e ilhas de dados existentes e chegar a uma plataforma de dados multimodal consolidada, abrangendo dados estruturados e não estruturados — [because] O GenAI é ótimo em analisar dados não estruturados — e combinar dados em repouso com sua movimentação de dados, portanto, processamento de dados em tempo actual e dados em repouso”, explicou Gerrit Kazmaier, VP e GM do Google para banco de dados, Information Analytics e Looker. Ativar esse fluxo de dados corporativos, ele argumentou, é o que muitos desses novos recursos são.
O Spanner obtém recursos de gráficos e vetores
O Spanner alimenta a maioria dos produtos próprios do Google, como Search, Gmail e YouTube, e sua lista de clientes inclui empresas como Residence Depot, Uber, Walmart e outras. E embora o Spanner possa lidar com um quantity massivo de dados, bancos de dados vetoriais e gráficos são uma necessidade para trazer dados empresariais para aplicativos GenAI e enriquecer modelos de base existentes.
“O que estamos pensando é o que realmente seria necessário para que pegássemos a disponibilidade, a escala e o modelo relacional do Spanner e realmente expandíssemos isso para ser a melhor plataforma de dados para aplicativos operacionais GenAI”, disse Andi Gutmans, vice-presidente e gerente geral do Google para bancos de dados. Como tantos fornecedores de banco de dados, o primeiro passo aqui para o Google é adicionar recursos de gráfico ao Spanner, usando o padrão GraphQL emergente. As empresas podem então usar esse gráfico para aumentar seus aplicativos GenAI — e os modelos de base que os alimentam — usando geração aumentada de recuperação (RAG), que atualmente é o padrão de fato para esse caso de uso.
Também são novidades no Spanner a busca de texto completo e a busca vetorial, com os recursos de busca vetorial apoiados pelo algoritmo ScaNN do Google. “Com o Spanner Graph, a busca de texto completo e a busca vetorial, evoluímos o Spanner de … ser o banco de dados mais disponível, globalmente consistente e escalável, para um banco de dados multimodelo com recursos inteligentes que interoperam perfeitamente para permitir que você entregue uma nova classe de aplicativos habilitados para IA”, diz o Google.
Além dessas atualizações centradas em IA, o Spanner está recebendo uma nova estrutura de preços opcional. Chamada de “edições Spanner”, a ideia aqui é oferecer um modelo de preços baseado em níveis que ofereça mais flexibilidade. Atualmente, os clientes do Google Cloud tinham que escolher entre uma oferta de região única e uma versão multirregional, que também oferecia um pacote de recursos adicionais, como replicação.
Bigtable adota SQL
O Google também anunciou na quinta-feira uma grande atualização para o Bigtable, o banco de dados NoSQL do Google para dados não estruturados e cargas de trabalho sensíveis à latência. O Bigtable agora oferece suporte a SQL (ou mais precisamente, suporte ao GoogleSQL, o dialeto SQL da empresa), tornando significativamente mais fácil para praticamente qualquer desenvolvedor usar o serviço.
Anteriormente, os desenvolvedores tinham que usar a API do Bigtable para consultar seus bancos de dados. Atualmente, o Bigtable suporta aproximadamente 100 funções SQL.
Oracle no Google Cloud
Para os fãs do banco de dados Oracle por aí, o Google agora permitirá que eles hospedem seus serviços de banco de dados Oracle Exadata e Autonomous diretamente nos knowledge facilities do Google Cloud — e eles podem vincular seus aplicativos entre o Google Cloud e o Oracle Cloud. Para o Google, isso significa mais cargas de trabalho em sua nuvem e, para a Oracle, pelo menos, significa que esses usuários ainda estão pagando suas taxas de licenciamento, mesmo que não estejam usando a nuvem Oracle.
Outra novidade no Google Cloud é o suporte ao Apache Spark e ao Kafka de código aberto para streaming e processamento de dados, bem como streaming em tempo actual do Analytics Hub (serviço do Google para compartilhamento seguro de dados entre organizações).