A OpenAI, dona do ChatGPT, e a Cerebras assinaram um acordo plurianual para implantar 750 megawatts de sistemas da americana Cerebras de modo a atender clientes da OpenAI. Segundo comunicado em conjunto das companhias, essa implantação ocorrerá em várias etapas a partir de 2026, tornando-se a maior implementação de inferência de inteligência artificial (IA) de alta velocidade do mundo. Embora os termos não tenham sido divulgados, pessoas ouvidas pela agência “Bloomberg” estimam que o valor do acordo ultrapasse US$ 10 bilhões.
A Cerebras constrói sistemas de alta velocidade para IA. Seja executando agentes de código ou chat por voz, grandes modelos de linguagem na Cerebras oferecem respostas até 15 vezes mais rápidas do que sistemas baseados em GPU, diz a empresa. “Para os consumidores, isso se traduz em maior engajamento e aplicações inovadoras. Para a economia em geral, onde se espera que agentes de IA sejam um motor-chave de crescimento na próxima década, a velocidade impulsiona diretamente o crescimento da produtividade”, afirma a Cerebras.
Em comunicado, a OpenAI afirmou que integrar a Cerebras ao seu conjunto de soluções de computação “tem tudo a ver” com fazer a IA responder muito mais rápido. A empresa explica que, quando você faz uma pergunta difícil, gera código, cria uma imagem ou executa um agente de IA, há um ciclo acontecendo nos bastidores: você envia uma solicitação, o modelo processa e envia algo de volta. Quando a IA responde em tempo real, os usuários fazem mais com ela, permanecem por mais tempo e executam cargas de trabalho de maior valor.
“A estratégia de computação da OpenAI é construir um portfólio resiliente que combine os sistemas certos com as cargas de trabalho certas. A Cerebras adiciona uma solução dedicada de inferência de baixa latência à nossa plataforma. Isso significa respostas mais rápidas, interações mais naturais e uma base mais sólida para escalar IA em tempo real para muito mais pessoas”, disse Sachin Katti, da OpenAI, em comunicado.
“Estamos muito satisfeitos em fazer parceria com a OpenAI, trazendo os principais modelos de IA do mundo para o processador de IA mais rápido do mundo. Assim como a banda larga transformou a internet, a inferência em tempo real transformará a IA, permitindo maneiras totalmente novas de construir e interagir com modelos de IA”, acrescentou Andrew Feldman, co-fundador e diretor-presidente da Cerebras, também em carta aos acionistas.
A capacidade será disponibilizada em várias etapas até 2028.
/i.s3.glbimg.com/v1/AUTH_63b422c2caee4269b8b34177e8876b93/internal_photos/bs/2025/B/c/QKCQN8Q6SEAwNtJwYC4A/photo-1676299081847-824916de030a.avif)

