Testamos o chatbot Claude, da Anthropic, que já está disponível para os brasileiros

Concorrente do ChatGPT, da OpenAI, e de outros chatbots de inteligência artificial como o Gemini, do Google, o Claude agora, além de falar português, está disponível para usuários brasileiros. A chegada ao país da Anthropic, uma das startups de IA mais valiosas do mundo, foi oficializada na quinta-feira.

A proposta do Claude é parecida com a de seus competidores: trata-se de um robô de IA generativa, em formato de chat, alimentado por um grandes modelo de linguagem (LLM, na sigla em inglês), que responde a perguntas, interpreta informações e pode auxiliar em tarefas como tradução, escrita de códigos ou resumo de documentos.

Fundada em 2021 por ex-funcionários da OpenAI, a Anthropic recebeu em setembro do ano passado um cheque de US$ 4 bilhões da Amazon, o que elevou a avaliação da startup para US$ 18,4 bilhões em valor de mercado (quase um quarto do que vale a dona do ChatGPT).

Disponível em aplicativos para o Android e iOS, e também pela web, o Claude pode ser acessado gratuitamente, assim como outros robôs de IA, mas com uso limitado. Há versão paga, com uma assinatura que parte de R$ 110 (valor similar ao do ChatGPT), que oferece a possibilidade de mais interações e a leitura de arquivos maiores. Um segundo plano, de R$ 165 é voltado para o uso conjunto da IA, por equipes de até cinco pessoas.

ChatGPT x Claude: o que dizem os especialistas

Desde março, a Anthropic opera três versões de seu modelo de inteligência artificial: o Claude 3 Opus, o Sonnet e o Haiku, que têm níveis de desempenho diferentes. Todas estão disponíveis também para empresas, por meio de API, o que significa que desenvolvedores podem criar sistemas de IA usando os modelos.

Anderson da Silva Soares, pesquisador do Instituto de Informática (INF) da Universidade Federal de Goiás (UFG), diz que a disponibilização de versões diferentes do Claude é uma forma da Anthropic ser mais competitiva para “encontrar mais nichos” para usos específicos da IA.

Para o pesquisador, o Claude se destaca pelo desempenho melhor como auxiliar em programação de códigos em diferentes linguagens. Ele brinca que é o “único modelo” que realmente “ameaça a profissão de programador”.

Ao acessar o Claude, o usuário se depara com uma interface mais “amigável” que a do ChatGPT, destaca Marcos Barreto, professor da Fundação Vanzolini e da Poli-USP. Ele nota que, desde o momento da inscrição, há uma também linguagem que busca ser “simpática”, o que é algo que a Anthropic procura intencionalmente fazer para se diferenciar dos concorrentes.

Barreto nota ainda que uma das diferenças significativas entre os dois chatbots é a janela de contexto (que seria a quantidade de contexto que a IA pode processar de uma só vez). A janela do Claude é de 200 mil tokens e pode chegar a 1 milhão. A do ChatGPT, por outro lado, é de 128 mil tokens, segundo o pesquisador.

Testes do GLOBO: Claude x ChatGPT

Assim como o GPT-4o, o Claude tem a capacidade de “enxergar”: ele pode ler documentos e imagens. O robô roda com Claude 3.5 Sonnet, modelo de linguagem mais recente da Anthropic. Segundo a startup, ele supera o GPT-4o em raciocínio sobre texto e em tarefas que exigem conhecimento acadêmico. Já o modelo da OpenAI é mais eficiente na resolução de problemas matemáticos.

O primeiro teste do GLOBO buscou entender a diferença dos dois robôs de identificar e interpretar imagens da religiosidade afro-brasileira. Ambas as inteligências artificiais foram incapazes de identificar uma imagem de um orixá (divindade do candomblé e da umbanda). O Claude informou que tratava-se “aparentemente” de São Benedito, enquanto o ChatGPT disse tratar-se de Baltazar, uma das três figuras dos Reis Magos no contexto do Natal cristão.

Claude não foi capaz de identificar a figura de um orixá, informando que se tratava 'aparentemente' de São Benedito — Foto: Juliana Causin/O Globo
Claude não foi capaz de identificar a figura de um orixá, informando que se tratava ‘aparentemente’ de São Benedito — Foto: Juliana Causin/O Globo

A limitação sobre esse tipo de informação em modelos de IA é um problema conhecido, dada a falta de diversidade de informações com as quais esses sistemas são treinados.

O ChatGPT também não identificou a imagem do orixá e disse se tratar de Baltazar, uma das três figuras dos Reis Magos — Foto: Juliana Causin/O Globo
O ChatGPT também não identificou a imagem do orixá e disse se tratar de Baltazar, uma das três figuras dos Reis Magos — Foto: Juliana Causin/O Globo

Aos dois chatbots também foi solicitada a interpretação de um gráfico, do IBGE, com a variação mensal da produção industrial brasileira, sem os percentuais e apenas com comportamento geral do indicador. Os dois são capazes de identificar os meses e as tendências gerais observadas no indicador.

O Claude lamenta não ter mais informações sobre percentuais, e arrisca acertar a escala do gráfico: de -2% a 6% (na verdade seria de -1,5%, queda registrada em 2024, até 4,1%, alta de junho). O ChatGPT fala em “variação significativa” ao longo do período.

Em um documento com o resultado resumido do balanço financeiro de uma empresa, os dois robôs têm desempenho similar: são capazes de organizar em tópicos as informações relevantes e resumir e organizar os dados.

Claude relativiza o golpe de 64

Em uma pergunta olímpica (sobre quantas medalhas o Brasil conquistou nas Olimpíadas de Tóquio, em 2020), os dois robôs oferecem respostas corretas e similares. Foram 21 medalhas, sendo sete de ouro, seis de prata e oito de bronze.

Para a pergunta se "a tomada do poder pelos militares brasileiros em 1964 foi uma revolução ou um golpe", o robô responde que há "diferentes interpretações" e diz que "há quem argumente que foi uma revolução necessária" — Foto: Juliana Causin/O Globo
Para a pergunta se “a tomada do poder pelos militares brasileiros em 1964 foi uma revolução ou um golpe”, o robô responde que há “diferentes interpretações” e diz que “há quem argumente que foi uma revolução necessária” — Foto: Juliana Causin/O Globo

Em uma questão sobre a história do Brasil, Claude se esquiva de chamar a tomada do poder pelos militares, em 1964, de “golpe”. Para a pergunta se “a tomada do poder pelos militares brasileiros em 1964 foi uma revolução ou um golpe”, o robô responde que há “diferentes interpretações” e diz que “há quem argumente que foi uma revolução necessária”. Já o ChatGPT crava: “a tomada do poder pelos militares brasileiros em 1964 é amplamente considerada um golpe de Estado”.

Já o ChatGPT cravou que 'a tomada do poder pelos militares brasileiros em 1964 é amplamente considerada um golpe de Estado — Foto: Juliana Causin/O Globo
Já o ChatGPT cravou que ‘a tomada do poder pelos militares brasileiros em 1964 é amplamente considerada um golpe de Estado — Foto: Juliana Causin/O Globo

Sobre saúde, os dois robôs buscam ser úteis para identificar as causas de uma pergunta genérica sobre “dor no joelho com pontadas no fim do dia”. Claude oferece sete possibilidades de resposta, entre elas artrite, lesão no menisco, dano na cartilagem, tendinite, inflamação e bursite. “É importante ressaltar que não é possível fazer um diagnóstico preciso sem um exame físico adequado”, acrescenta.

O ChatGPT, além dos possíveis diagnósticos e de sugerir a procura de um médico “para uma avaliação adequada”, também dá dicas do que é possível fazer para alívio dos sintomas: descanso, aplicação de gelo, elevar a perna e usar uma joelheira.

Ambos têm limitações sobre informações atualizadas. Os dois chats, ao fim das conversas, também alertam os usuários de que podem cometer erros e de que é necessário checar as respostas geradas.

Source link

Deixe um comentário

O seu endereço de e-mail não será publicado. Campos obrigatórios são marcados com *

Rolar para cima