Pular para o conteúdo

A verdadeira razão por detrás da excitação à volta do DeepSeek

Banner Aleatório

O DeepSeek virou o mundo da tecnologia de cabeça para baixo em janeiro – e por boas razões, de acordo com especialistas em inteligência artificial, que dizem que provavelmente estamos apenas a ver o início da influência da startup chinesa de tecnologia no campo da IA.

Banner Aleatório

O DeepSeek fez manchetes em todo o lado com seu modelo R1 AI, que a empresa diz que pode corresponder aproximadamente ao desempenho do modelo o1 da Open AI por uma fração do custo. As ações das tecnológicas caíram quando o DeepSeek ultrapassou brevemente o ChatGPT para se tornar a principal aplicação na App Store da Apple.

O feito levou os gigantes tecnológicos dos EUA a questionar a posição da América na corrida da IA contra a China – e os milhares de milhões de dólares por detrás desses esforços. Embora o vice-presidente JD Vance não tenha mencionado o DeepSeek ou a China pelo nome nos seus comentários na Cimeira de Ação em Inteligência Artificial em Paris em fevereiro, enfatizou o quão é prioritário para os Estados Unidos liderar o setor.

“Os Estados Unidos da América são o líder em IA e a nossa administração planeia mantê-lo assim”, disse, embora tenha acrescentado que “a América quer fazer parcerias” com outros países.

Mas não se trata apenas da eficiência e do poder do DeepSeek. A forma como o DeepSeek R1 pode raciocinar e “pensar” nas respostas para fornecer resultados de qualidade, juntamente com a decisão da empresa de disponibilizar publicamente partes importantes da sua tecnologia, também fará avançar a área, dizem os especialistas.

Embora a IA seja utilizada há muito tempo em produtos tecnológicos, atingiu um ponto crítico nos últimos dois anos graças ao surgimento do ChatGPT e de outros serviços de IA generativa que remodelaram a forma como as pessoas trabalham, comunicam e encontram informação. Tornou empresas como a Nvidia, fabricante de chips, em queridinhas de Wall Street e alterou a trajetória de gigantes de Silicon Valley. Por isso, qualquer desenvolvimento que possa ajudar a construir modelos mais capazes e eficientes será certamente observado com atenção.

“Não se trata, definitivamente, de um exagero”, afirma Oren Etzioni, antigo diretor executivo do Allen Institute for Artificial Intelligence. “Mas este é um mundo que evolui muito rapidamente.”

O momento TikTok da IA

Os líderes tecnológicos responderam rapidamente à ascensão do DeepSeek. O CEO do Google DeepMind, Demis Hassabis, considerou a excitação em torno do DeepSeek de “exagerada”, mas também disse que o seu modelo é “provavelmente o melhor trabalho que já viu sair da China”, de acordo com a CNBC.

O CEO da Microsoft, Satya Nadella, afirmou na videoconferência de resultados trimestrais da empresa, em janeiro, que o DeepSeek tem algumas “inovações reais”, enquanto o CEO da Apple, Tim Cook, disse na videoconferência de resultados do fabricante do iPhone que “a inovação que impulsiona a eficiência é uma coisa boa”.

Mas a atenção não tem sido toda positiva. O investigador de semicondutores SemiAnalysis lançou dúvidas sobre as alegações do DeepSeek de que custou apenas 5,6 milhões de dólares para treinar. A OpenAI disse ao The Financial Times que encontrou provas de que a empresa criadora do DeepSeek utilizou os modelos da concorrente norte-americana para treinar o seu chatbot.

“Estamos cientes e a analisar as indicações de que a DeepSeek pode ter destilado os nossos modelos de forma inadequada e partilharemos informações à medida que soubermos mais”, revelou um porta-voz da OpenAI num comentário à CNN. A CNN não conseguiu contactar a startup chinesa para comentar o assunto.

E dois legisladores americanos já pediram que o aplicativo fosse banido dos dispositivos governamentais depois que investigadores de segurança apontarem possíveis ligações ao executivo chinês, como relataram a Associated Press e a ABC News. Foram levantadas preocupações semelhantes em relação à popular aplicação de redes sociais TikTok.

“O DeepSeek é o TikTok dos (grandes modelos linguísticos)”, comparou Etzioni.

A profunda impressão do DeepSeek no mundo da tecnologia

Os gigantes da tecnologia já estão a pensar na forma como a tecnologia do DeepSeek pode influenciar os seus produtos e serviços.

“O que o DeepSeek nos deu foi essencialmente a receita na forma de um relatório técnico, mas não nos deu as partes extra que faltavam”, considerou Lewis Tunstall, cientista de investigação sénior da Hugging Face, uma plataforma de IA que oferece ferramentas para programadores.

Tunstall está a liderar um esforço na Hugging Face para abrir totalmente o modelo R1 do DeepSeek; embora o DeepSeek tenha fornecido um artigo de investigação e os parâmetros do modelo, não revelou o código ou os dados de treino.

Nadella disse na videoconferência de resultados da Microsoft que os PC Windows Copilot +, ou PC construídos com uma determinada especificação para suportar modelos de IA, serão capazes de executar modelos de IA destilados do DeepSeek R1 localmente. O fabricante de chips móveis Qualcomm acrescentou que os modelos destilados do DeepSeek R1 estavam a funcionar em smartphones e PC equipados com os seus chips no espaço de uma semana.

Investigadores, académicos e criadores de IA ainda estão a explorar o que o DeepSeek significa para o avanço da Inteligência Artificial.

O modelo do DeepSeek não é o único de código aberto, nem é o primeiro a ser capaz de raciocinar sobre as respostas antes de responder; o modelo o1 da OpenAI do ano passado também consegue fazê-lo.

O que torna o DeepSeek significativo é a forma como pode raciocinar e aprender com outros modelos, juntamente com o facto de a comunidade de IA poder ver o que está a acontecer nos bastidores. Aqueles que utilizam o modelo R1 na aplicação do DeepSeek também podem ver o seu processo de “pensamento” enquanto responde às perguntas.

“É possível ver as rodas a girar dentro da máquina”, observou Durga Malladi, vice-presidente sénior e gerente geral de planeamento de tecnologia e soluções de ponta da Qualcomm, à CNN.

Tunstall acredita que podemos ver uma onda de novos modelos que podem raciocinar como o DeepSeek num futuro não muito distante. Isso pode ser crítico à medida que os gigantes da tecnologia correm para construir agentes de IA, que Silicon Valley geralmente acredita ser a próxima evolução do chatbot e como os consumidores irão interagir com os dispositivos – embora essa mudança ainda não tenha acontecido.

O Grok 3, a próxima iteração do chatbot na plataforma de redes sociais X, terá “capacidades de raciocínio muito poderosas”, garantiu o seu proprietário, Elon Musk, durante uma aparição em vídeo durante a Cimeira Mundial dos Governos no Dubai.

Por enquanto, a comunidade de IA vai continuar a mexer no que o DeepSeek tem para oferecer. Isto é, até surgir a próxima descoberta.

“Prevejo que, nos próximos 12 meses, será suplantado por outra coisa”, antecipou Etzioni. “Mas é um avanço muito real.”

Source link

Join the conversation

O seu endereço de e-mail não será publicado. Campos obrigatórios são marcados com *