Testamos O Chatbot Claude, Da Anthropic, Que Já Está Disponível Para Os Brasileiros

Concorrente do ChatGPT, da OpenAI, e de outros chatbots de inteligência artificial como o Gemini, do Google, o Claude agora, além de falar português, está disponível para usuários brasileiros. A chegada ao país da Anthropic, uma das startups de IA mais valiosas do mundo, foi oficializada na quinta-feira.

Instagram lançará AI Studio: influenciadores terão chatbot personalizado para IA responder seguidores
Quebra de acordo: Governo dos EUA processa TikTok por violar privacidade e coletar dados de menores de 13 anos

A proposta do Claude é parecida com a de seus competidores: trata-se de um robô de IA generativa, em formato de chat, alimentado por um grandes modelo de linguagem (LLM, na sigla em inglês), que responde a perguntas, interpreta informações e pode auxiliar em tarefas como tradução, escrita de códigos ou resumo de documentos.

Fundada em 2021 por ex-funcionários da OpenAI, a Anthropic recebeu em setembro do ano passado um cheque de US$ 4 bilhões da Amazon, o que elevou a avaliação da startup para US$ 18,4 bilhões em valor de mercado (quase um quarto do que vale a dona do ChatGPT).

Entenda: Quando o robô é treinado por robôs, a inteligência artificial entra em colapso

Disponível em aplicativos para o Android e iOS, e também pela web, o Claude pode ser acessado gratuitamente, assim como outros robôs de IA, mas com uso limitado. Há versão paga, com uma assinatura que parte de R$ 110 (valor similar ao do ChatGPT), que oferece a possibilidade de mais interações e a leitura de arquivos maiores. Um segundo plano, de R$ 165 é voltado para o uso conjunto da IA, por equipes de até cinco pessoas.

Table of Contents

ChatGPT x Claude: o que dizem os especialistas

Desde março, a Anthropic opera três versões de seu modelo de inteligência artificial: o Claude 3 Opus, o Sonnet e o Haiku, que têm níveis de desempenho diferentes. Todas estão disponíveis também para empresas, por meio de API, o que significa que desenvolvedores podem criar sistemas de IA usando os modelos.

O jogo dos seis erros da inteligência artificial

O que foi informado ao sistema: imagem hiper-realista retrata um homem tirando uma selfie com os amigos em um cinema lotado. As pessoas assistem a uma comédia e riem muito — Foto: Imagem gerada por Midjourney

No cinema. A figura que segura o celular tem as mãos deformadas — Foto: Imagem gerada por IA/Midjourney

Harmonia: Um maestro conduz uma orquestra, rege com energia, a câmera está de costas para o maestro, os músicos estão de frente para a câmera, ele toca a Nona Sinfonia de Beethoven - Foto: imagem gerada por IA/Midjourney

4 de 12
Regência. A imagem exibe mão direita do maestro com dedo alongado. E a batuta se assemelha a um arco de violino — Foto: Imagem gerada por IA/Midjourney

O que foi informado ao sistema de inteligência artificial: imagem exibe uma pessoa com os braços cruzados, não foi solicitado que aparecesse o rosto - foto: imagem criada por IA/Midjourney — 5 de 12
O que foi informado ao sistema de inteligência artificial: imagem exibe uma pessoa com os braços cruzados, não foi solicitado que aparecesse o rosto – foto: imagem criada por IA/Midjourney

6 de 12
Em excesso. Imagem gerada por inteligência artificial mostra uma pessoa com mais um braço — Foto: Imagem gerada por IA/Midjourney

7 de 12
Alegria: Uma criança sorri imensamente feliz e até grita de boca aberta de tanta felicidade quando recebe um presente. Esta imagem serve como uma prova do poder da felicidade — Foto: Imagem gerada por IA/Midjourney

8 de 12
Sorriso assustador. O dente da criança que recebe o presente se confunde com a gengiva — Foto: Imagem gerada por IA/Midjourney

9 de 12
Dueto inusitado: Produção exibe a cantora brasileira Anitta cantando com o líder do Coldplay, Crhis Martin, dançando e cantando no palco, com luz de neon — Foto: Imagem gerada por IA/Midjourney

10 de 12
Atenção ao vocalista. A mão direita do cantor Chris Martin aparece com seis dedos — Foto: Imagem gerada por IA/Midjourney

11 de 12
Apreciando a vista. Um grupo de capivaras com a cidade do Rio de Janeiro ao fundo, em um dia de garoa, imagem no estilo de publicações voltadas para a vida animal — Foto: Imagem gerada por IA/Midjourney

12 de 12
É esse animal mesmo? Capivara aparece de rabo e mais parece um rato — Foto: Imagem gerada por IA/Midjourney

Os erros da IA

Anderson da Silva Soares, pesquisador do Instituto de Informática (INF) da Universidade Federal de Goiás (UFG), diz que a disponibilização de versões diferentes do Claude é uma forma da Anthropic ser mais competitiva para “encontrar mais nichos” para usos específicos da IA.

Para o pesquisador, o Claude se destaca pelo desempenho melhor como auxiliar em programação de códigos em diferentes linguagens. Ele brinca que é o “único modelo” que realmente “ameaça a profissão de programador”.

Delírio robótico: Cientistas criam método para detectar ‘alucinação’ de inteligência artificial

Ao acessar o Claude, o usuário se depara com uma interface mais “amigável” que a do ChatGPT, destaca Marcos Barreto, professor da Fundação Vanzolini e da Poli-USP. Ele nota que, desde o momento da inscrição, há uma também linguagem que busca ser “simpática”, o que é algo que a Anthropic procura intencionalmente fazer para se diferenciar dos concorrentes.

Barreto nota ainda que uma das diferenças significativas entre os dois chatbots é a janela de contexto (que seria a quantidade de contexto que a IA pode processar de uma só vez). A janela do Claude é de 200 mil tokens e pode chegar a 1 milhão. A do ChatGPT, por outro lado, é de 128 mil tokens, segundo o pesquisador.

Testes do GLOBO: Claude x ChatGPT

Assim como o GPT-4o, o Claude tem a capacidade de “enxergar”: ele pode ler documentos e imagens. O robô roda com Claude 3.5 Sonnet, modelo de linguagem mais recente da Anthropic. Segundo a startup, ele supera o GPT-4o em raciocínio sobre texto e em tarefas que exigem conhecimento acadêmico. Já o modelo da OpenAI é mais eficiente na resolução de problemas matemáticos.

Salário de R$ 80 mil: saiba quais os empregos remotos mais bem pagos de 2024

O primeiro teste do GLOBO buscou entender a diferença dos dois robôs de identificar e interpretar imagens da religiosidade afro-brasileira. Ambas as inteligências artificiais foram incapazes de identificar uma imagem de um orixá (divindade do candomblé e da umbanda). O Claude informou que tratava-se “aparentemente” de São Benedito, enquanto o ChatGPT disse tratar-se de Baltazar, uma das três figuras dos Reis Magos no contexto do Natal cristão.

Claude não foi capaz de identificar a figura de um orixá, informando que se tratava 'aparentemente' de São Benedito — Foto: Juliana Causin/O Globo — Claude não foi capaz de identificar a figura de um orixá, informando que se tratava ‘aparentemente’ de São Benedito — Foto: Juliana Causin/O Globo

A limitação sobre esse tipo de informação em modelos de IA é um problema conhecido, dada a falta de diversidade de informações com as quais esses sistemas são treinados.

O ChatGPT também não identificou a imagem do orixá e disse se tratar de Baltazar, uma das três figuras dos Reis Magos — Foto: Juliana Causin/O Globo

Aos dois chatbots também foi solicitada a interpretação de um gráfico, do IBGE, com a variação mensal da produção industrial brasileira, sem os percentuais e apenas com comportamento geral do indicador. Os dois são capazes de identificar os meses e as tendências gerais observadas no indicador.

Nvidia: estrela dos chips de inteligência artificial, é alvo de investigação antitruste nos EUA, diz jornal

O Claude lamenta não ter mais informações sobre percentuais, e arrisca acertar a escala do gráfico: de -2% a 6% (na verdade seria de -1,5%, queda registrada em 2024, até 4,1%, alta de junho). O ChatGPT fala em “variação significativa” ao longo do período.

Em um documento com o resultado resumido do balanço financeiro de uma empresa, os dois robôs têm desempenho similar: são capazes de organizar em tópicos as informações relevantes e resumir e organizar os dados.

Claude relativiza o golpe de 64

Em uma pergunta olímpica (sobre quantas medalhas o Brasil conquistou nas Olimpíadas de Tóquio, em 2020), os dois robôs oferecem respostas corretas e similares. Foram 21 medalhas, sendo sete de ouro, seis de prata e oito de bronze.

Para a pergunta se "a tomada do poder pelos militares brasileiros em 1964 foi uma revolução ou um golpe", o robô responde que há "diferentes interpretações" e diz que "há quem argumente que foi uma revolução necessária" — Foto: Juliana Causin/O Globo — Para a pergunta se “a tomada do poder pelos militares brasileiros em 1964 foi uma revolução ou um golpe”, o robô responde que há “diferentes interpretações” e diz que “há quem argumente que foi uma revolução necessária” — Foto: Juliana Causin/O Globo

Em uma questão sobre a história do Brasil, Claude se esquiva de chamar a tomada do poder pelos militares, em 1964, de “golpe”. Para a pergunta se “a tomada do poder pelos militares brasileiros em 1964 foi uma revolução ou um golpe”, o robô responde que há “diferentes interpretações” e diz que “há quem argumente que foi uma revolução necessária”. Já o ChatGPT crava: “a tomada do poder pelos militares brasileiros em 1964 é amplamente considerada um golpe de Estado”.

Já o ChatGPT cravou que 'a tomada do poder pelos militares brasileiros em 1964 é amplamente considerada um golpe de Estado — Foto: Juliana Causin/O Globo — Já o ChatGPT cravou que ‘a tomada do poder pelos militares brasileiros em 1964 é amplamente considerada um golpe de Estado — Foto: Juliana Causin/O Globo

Sobre saúde, os dois robôs buscam ser úteis para identificar as causas de uma pergunta genérica sobre “dor no joelho com pontadas no fim do dia”. Claude oferece sete possibilidades de resposta, entre elas artrite, lesão no menisco, dano na cartilagem, tendinite, inflamação e bursite. “É importante ressaltar que não é possível fazer um diagnóstico preciso sem um exame físico adequado”, acrescenta.

O ChatGPT, além dos possíveis diagnósticos e de sugerir a procura de um médico “para uma avaliação adequada”, também dá dicas do que é possível fazer para alívio dos sintomas: descanso, aplicação de gelo, elevar a perna e usar uma joelheira.

Ambos têm limitações sobre informações atualizadas. Os dois chats, ao fim das conversas, também alertam os usuários de que podem cometer erros e de que é necessário checar as respostas geradas.

Source link

Testamos o chatbot Claude, da Anthropic, que já está disponível para os brasileiros

ChatGPT x Claude: o que dizem os especialistas

O jogo dos seis erros da inteligência artificial

Testes do GLOBO: Claude x ChatGPT

Claude relativiza o golpe de 64

Join the conversation Cancelar resposta