Pular para o conteúdo

A startup coreana afirma que seu “cientista de IA” supera o Gemini 2.5 Pro e o Claude Opus 4

Banner Aleatório

Na corrida para criar um verdadeiro “cientista de IA”, uma startup coreana anunciou um novo modelo que, segundo ela, atinge um desempenho superior com apenas um décimo do custo computacional de seus concorrentes. O Scinapse AI da Pluto Labs desafia a noção de que o sucesso em IA avançada requer um poder de computação maciço e de força bruta.

Banner Aleatório

A Pluto Labs afirma que sua arquitetura de “Eficiência Estratégica” é a chave para seu sucesso – a Scinapse AI delega tarefas com uso intensivo de dados, como revisões de literatura, à sua plataforma de pesquisa acadêmica existente. Esse design permite que a IA central se concentre exclusivamente no raciocínio criativo e na geração de ideias novas e testáveis.

Com base em um teste cego autodeclarado, a empresa se vangloria de que sua IA ficou consistentemente em primeiro lugar em “Plausibilidade” e “Testabilidade” em comparação com os principais modelos do Google e da Anthropic em 61 tópicos científicos diferentes. A Pluto Labs afirma que isso prova que sua IA oferece “pesquisa científica acionável” em vez de “ficção plausível”. Para combater a alucinação da IA, diz-se que o sistema é estritamente fundamentado em um banco de dados de 260 milhões de artigos acadêmicos. Os testes cegos foram avaliados por três modelos de IA concorrentes: Gemini 2.5 Pro, Clause Opus 4 e OpenAI o3.

O fato de uma pequena startup coreana ter se mostrado superior ao Google em um benchmark objetivo é mais do que apenas uma conquista técnica – é um evento simbólico de liderança inovadora. – Simon Kim, CEO da Hashed.

A Pluto Labs planeja um lançamento global para a Scinapse AI neste trimestre. A comunidade de tecnologia estará observando atentamente os benchmarks independentes para validar as afirmações ousadas da empresa.

Source link

Join the conversation

O seu endereço de e-mail não será publicado. Campos obrigatórios são marcados com *