Resumo rápido!
Na CES 2026, a NVIDIA anunciou modelos abertos de IA física, o chip Jetson T4000 com arquitetura Blackwell e parcerias globais com Boston Dynamics, Caterpillar e LG Electronics para transformar indústrias de manufatura e logística avaliadas em US$ 50 trilhões, usando robôs generalistas capazes de aprender múltiplas tarefas com raciocínio visual e simulação fotorrealística.
The next era of physical AI is here.
At #CES2026, NVIDIA introduces new open models, open-source frameworks, and AI infrastructure to speed up the robotics development lifecycle.
Global industry leaders are already bringing NVIDIA’s robotics stack into the real world.
Read… pic.twitter.com/NQPb0uM7wT
— NVIDIA Newsroom (@nvidianewsroom) January 5, 2026
A NVIDIA oficializou o que Jensen Huang chamou de “momento ChatGPT da robótica” durante a abertura da CES em Las Vegas. A empresa liberou um ecossistema completo de modelos de fundação abertos, frameworks de simulação e hardware de borda para criar robôs que entendem o mundo físico com capacidades de raciocínio similares às humanas
Cosmos Reason 2: o cérebro dos robôs
O Cosmos Reason 2 é o novo modelo de linguagem visual com raciocínio (VLM) que permite máquinas “verem, entenderem e agirem no mundo físico como humanos”. Diferente de sistemas anteriores que exigiam programação para cada tarefa específica, este modelo aberto lidera benchmarks de precisão e funciona como base para os robôs generalistas/especialistas anunciados pela NVIDIA. A abordagem elimina a necessidade de pré-treinamento intensivo em recursos, permitindo que desenvolvedores se concentrem diretamente na criação de aplicações reais.
NVIDIA Cosmos Reason 2 is here. 🥳
An open, highly accurate reasoning vision language model for physical AI, featuring:
✅ Improved spatio-temporal understanding and timestamp precision
✅ Flexible deployment with 2B and 8B model sizes
✅ Long-context reasoning with up to 256K… pic.twitter.com/LVmNbSnTRt— NVIDIA AI Developer (@NVIDIAAIDev) January 5, 2026
O modelo trabalha integrado ao Isaac GR00T N1.6, uma VLA (Vision Language Action) construída especificamente para humanoides, oferecendo controle de corpo inteiro com compreensão contextual avançada. Ambos foram disponibilizados no Hugging Face e GitHub como parte da estratégia da NVIDIA de democratizar a IA física.
Jetson T4000: 4x mais eficiência energética
O módulo Jetson T4000 com arquitetura Blackwell agora está disponível comercialmente, oferecendo 1.200 TFLOPS (FP4 sparse), 64GB de memória e eficiência energética 4x superior ao Jetson Orin. O preço é US$ 1.999 para volumes de 1.000 unidades, posicionando-o como alternativa acessível ao modelo topo de linha T5000 (US$ 2.999) que entrega 2.070 TFLOPS.
A linha Thor marca a primeira plataforma de IA com co-design extremo de seis chips da NVIDIA, agora em produção completa. O T4000 utiliza GPU Blackwell com 1.536 cores, 64 Tensor Cores de quinta geração e suporte a Multi-Instance GPU (MIG) com 6 TPCs. Para aplicações de ponta, o kit de desenvolvimento AGX Thor (US$ 3.499) inclui o módulo T5000, placa carrier, fonte 140W, Wi-Fi 6E e SSD NVMe de 1TB.
OSMO: orquestração de nuvem a edge
A NVIDIA lançou o OSMO como framework de código aberto no GitHub para unificar o desenvolvimento robótico em um centro de comando único. O sistema permite definir e executar workflows de geração de dados sintéticos, treinamento de modelos e testes software-in-the-loop através de ambientes de computação heterogêneos — de workstations a instâncias de cloud mistas
A fragmentação de pipelines complexos era o gargalo anterior: benchmarking manual, difícil escalabilidade e orquestração complicada entre recursos computacionais distintos. O OSMO resolve essa dor oferecendo interface cloud-native que acelera ciclos de desenvolvimento ao sincronizar desde simulação até deploy em produção
Cosmos Transfer e Predict: mundos sintéticos fotorrealísticos
Os modelos Cosmos Transfer 2.5 e Cosmos Predict 2.5 são world foundation models (WFMs) totalmente customizáveis que geram dados sintéticos fisicamente precisos e avaliam políticas de robôs em simulação. Esses modelos permitem criar ambientes virtuais em larga escala através de vídeos sintéticos para treinar robôs em condições diversas antes de testá-los no mundo real
A NVIDIA disponibilizou 500.000 trajetórias robóticas como parte de uma coleção sem precedentes de dados multimodais abertos: 10 trilhões de tokens de linguagem, 455.000 estruturas de proteínas e 100 terabytes de dados de sensores veiculares. Essa escala visa eliminar a barreira de capital necessária para construir modelos de fundação, permitindo que empresas pulem o pré-treinamento intensivo e foquem em aplicações especializadas.
Parceiros globais: de humanoides a tratores autônomos
Boston Dynamics, Caterpillar, Franka Robotics, Humanoid, LG Electronics e NEURA Robotics estão usando a stack completa da NVIDIA para desenvolver robôs de nova geração. A Caterpillar está expandindo colaboração com a NVIDIA para trazer IA avançada e autonomia a equipamentos de construção e mineração, com detalhes anunciados pelo CEO Joe Creed ao lado do VP de Robótica da NVIDIA, Deepu Talla, durante keynote na CES em 7 de janeiro.
$NVDA frames physical AI around three computers: one to train models, one to run real-time inference & one to simulate outcomes before actions are taken.
As Jensen Huang put it “the ChatGPT moment for physical AI is right around the corner. pic.twitter.com/irKVYjVkNb
— Shay Boloor (@StockSavvyShay) January 5, 2026
A integração com Hugging Face através do framework LeRobot acelera a comunidade open-source de robótica ao incorporar modelos Isaac e bibliotecas da NVIDIA diretamente na plataforma. A parceria ampliada com Siemens demonstra como a stack da NVIDIA se integra com software industrial, habilitando IA física desde design e simulação até produção — criando fábricas que Huang descreveu como “essencialmente robôs gigantes”




