O DeepSeek, modelo de Inteligência Artificial (IA) desenvolvido na China, tem gerado debates sobre propriedade intelectual, mas seu impacto vai muito além dessas discussões. A equipe responsável não apenas treinou um novo modelo, como também aplicou técnicas avançadas de compressão e aprimoramento de raciocínio, tornando-o altamente eficiente e competitivo no cenário global.
Modelos amplos de linguagem (LLMs), como o GPT (OpenAI) e o Gemini (Google), são estruturas complexas que demandam grande poder computacional para operar. O DeepSeek, por outro lado, conseguiu reduzir significativamente essa demanda utilizando técnicas que, de forma simplificada, lembram a compressão de imagens: o “arquivo” do modelo é reduzido, mas a qualidade das respostas permanece quase inalterada.
O modelo atinge essa eficiência ao reduzir a precisão dos cálculos em áreas menos críticas, tornando-se mais leve e rápido sem comprometer significativamente a qualidade das respostas. Além disso, o DeepSeek utiliza técnicas de destilação em que um modelo maior “ensina” um modelo menor a realizar tarefas. Isso permitiu que o DeepSeek atingisse alto desempenho sem a necessidade de supercomputadores, tornando a IA mais acessível.
Contudo, ao afirmar que a qualidade é “quase” a mesma, é importante destacar que, nos testes realizados, as respostas do DeepSeek, embora excelentes, apresentam um nível de detalhamento e robustez perceptivelmente inferior a modelos mais robustos. Enquanto o DeepSeek fornece respostas objetivas e diretas, outros modelos, como o GPT, entregam conteúdos mais elaborados e ricos em detalhes.
Outros pontos importantes do DeepSeek são: sua capacidade de raciocínio entregando maior coerência em suas respostas e o reforço por feedbacks humanos, aprimorando sua qualidade com o tempo. O DeepSeek não é apenas mais um modelo de IA. Ele combina eficiência computacional com raciocínio estruturado, demonstrando que a China tem um lugar de destaque entre a competição das IA’s.
A pergunta que fica é: o Ocidente está preparado para enfrentar essa nova concorrência?
Thiago Bluhm é engenheiro de IA do Grupo Portfolio