Pular para o conteúdo

Como ChatGPT, Claude, Gemini e Grok omitem fontes em 92% das notícias – ECO

Banner Aleatório

Os chatbots de inteligência artificial citam os órgãos de comunicação social quando dão informação noticiosa? O estudo “AI News Audit — How AI Models Use and Distribute Canadian Journalism” revela que, na grande maioria dos casos, o ChatGPT, Claude, Gemini e Grok não o fazem.

Banner Aleatório



Numa primeira fase, o estudo promovido pelo Centre for Media, Technology and Democracy testou quatro grandes modelos de inteligência artificial com 2.267 notícias canadianas reais, tanto em inglês como em francês. O objetivo desta ronda — que resultou num total de 18.134 respostas e incidiu sobre notícias publicadas entre janeiro de 2024 e fevereiro de 2026 — foi medir que informações os chatbots já tinham absorvido nos seus dados de treino e se atribuíam corretamente a fonte, sem recorrer a pesquisas na web.

“Os quatro modelos demonstraram um conhecimento extenso da atualidade canadiana, o que é consistente com a ingestão de reportagens dos meios de comunicação do país”, aponta o documento. Embora tenham revelado conhecimento — pelo menos parcial — em 74% das respostas a histórias ocorridas dentro do seu período de treino, em 92% destas respostas informadas não forneceram qualquer tipo de atribuição. Ou seja, não referiram o nome do órgão de comunicação social, não fizeram recomendações nem incluíram qualquer referência.

Um segundo teste permitiu aos modelos aceder à pesquisa web para responder a perguntas sobre 140 artigos específicos de sete publicações, em mais de três mil cenários diferentes. A meta era perceber se a IA já funciona como um substituto viável do jornalismo atual e se, ao fazê-lo, dá o devido crédito.

Quando ativámos a pesquisa na web, […] todos os modelos produziram respostas que cobriam o suficiente da reportagem original para que muitos consumidores raramente precisassem de visitar a fonte“, conclui o estudo. Os chatbots até incluem links frequentemente — 52% das respostas tinham pelo menos um URL canadiano –, mas só nomearam explicitamente a fonte no texto em 28% das vezes.

“As ligações fornecem um caminho de volta à fonte, mas os consumidores que leem a própria resposta raramente veem uma indicação de cujo jornalismo estão a consumir”, alertam os investigadores.

Os modelos provaram ainda conseguir furar paywalls, tendo acedido e coberto facilmente conteúdos de fontes pagas em 64% das vezes, uma taxa quase idêntica à dos conteúdos de acesso livre — 70%.

Segundo o estudo, num mercado competitivo as mesmas histórias circulam por vários meios, permitindo à IA recuperar versões gratuitas. Contudo, os registos de API também mostraram modelos a citar diretamente URLs pagos de forma massiva, o que sugere que as paywalls “podem não bloquear a recuperação automatizada da mesma forma que bloqueiam os leitores humanos”. Independentemente da forma como acedem, “o resultado para os editores é o mesmo — o meio de comunicação de origem não recebe nem tráfego nem crédito”.

Qual é o pior chatbot na atribuição de fontes?

Uma análise mais detalhada à pesquisa com acesso à web mostra desempenhos muito díspares. O Gemini e o Claude cobriram a informação das notícias em 81% e 72% das respostas, respetivamente, mas o Gemini creditou a fonte apenas 6% das vezes. O Grok entregou a notícia em 59% dos casos, citando a fonte em escassos 7%. Já o popular ChatGPT cobriu o conteúdo noticioso em 54% das respostas, mas quase nunca creditou a redação de origem.

grafico ia canada 1

Sob condições realistas — quando um utilizador faz uma pergunta genérica sem exigir citações –, os modelos partilham links, mas escondem o nome de quem produziu a notícia. O Gemini — 69% –, o Claude — 66% — e o Grok — 45% — forneceram URLs em muitos casos, enquanto o ChatGPT se ficou pelos 29%. No entanto, a nomeação clara do meio de comunicação foi rara em todos, tendo variado entre uns residuais 1% e 16%.

No “melhor cenário possível”, quando o utilizador atribui diretamente o meio de comunicação e pede citação de forma explícita, a atribuição dispara. Nestas condições, o Claude liderou as atribuições — 97% –, seguido do Gemini — 95% –, ChatGPT — 86% — e Grok — 74% –. As taxas de partilha de links também subiram substancialmente, sendo de 91% no Grok, 69% no Gemini, 64% no Claude e 59% no ChatGPT.

“O fosso entre a experiência por defeito e o melhor cenário possível é uma descoberta central”, sublinham os investigadores. “A maioria dos consumidores nunca nomeará explicitamente um meio de comunicação nem pedirá citações, pelo que os resultados em condições genéricas refletem a experiência que molda o mercado do jornalismo“, concluem.

Questionado sobre qual o melhor modelo de IA de um ponto de vista jornalístico, o coautor do estudo, Taylor Owen, confessou ao Nieman Lab, que divulgou notícia sobre a investigação, tratar-se de uma questão complexa. O Claude cita os meios com mais frequência do que os rivais e tem a vantagem de não “alucinar”, preferindo admitir que não sabe a resposta do que inventar. Contudo, tem a desvantagem de extrair grandes volumes de conteúdo protegido por paywalls.

Já o ChatGPT, considera o investigador, tem a interface mais atrativa para apresentar notícias recentes. O problema reside no facto de o seu modelo económico ser o pior no que toca a “alucinações”. Perante notícias que não constam na sua base de dados, a IA produziu respostas confiantes em 87% das vezes, sendo que 88% destas respostas eram inventadas e imprecisas.

O Gemini, por seu turno, é o que melhor consegue substituir a leitura da notícia original, absorvendo grande parte da reportagem — 81% —, mas é também o que mais esconde a fonte — 2% a 8%. Finalmente, o Grok destaca-se por conseguir referenciar órgãos de comunicação baseando-se apenas nos seus dados de treino, mas partilha com o ChatGPT o facto de alucinar e inventar factos sobre histórias mais recentes — abordou tópicos que não deveria conhecer em 89% das vezes que questionado sobre eles, sendo 84% destas imprecisas.

O estudo deixa ainda um duplo alerta sobre a desigualdade nesta distribuição. Primeiro, as citações que os chatbots fazem estão altamente concentradas num pequeno grupo de gigantes do setor no mercado canadiano com acesso gratuito — como a CBC, a CTV e o The Globe and Mail –, deixando de fora meios regionais e de acesso pago.

Em segundo lugar, o jornalismo de língua francesa sofre de uma dupla desvantagem. Apesar de as histórias serem absorvidas ao mesmo ritmo do que as inglesas, os meios francófonos foram citados em apenas 10% das respostas.

Como um servidor público com mais de 16 anos de experiência, vejo com preocupação a falta de transparência em algumas plataformas de notícias online, como ChatGPT, Claude, Gemini e Grok. Segundo estudos, essas plataformas omitem as fontes das notícias em 92% dos casos, o que levanta questões sobre a veracidade e a credibilidade das informações compartilhadas.

É fundamental que os usuários dessas plataformas estejam cientes dessa prática e busquem fontes confiáveis ao consumir notícias online. A transparência e a verificação das informações são essenciais para uma sociedade bem informada e capaz de tomar decisões assertivas.

Como cidadãos, devemos ser críticos em relação às fontes de informação que consumimos e buscar interagir de forma consciente com as notícias que nos são apresentadas. A busca pela verdade e pela transparência nas informações é um dever de todos nós, e só assim poderemos garantir a democracia e a qualidade da informação que recebemos.

Créditos Para a Fonte Original

Join the conversation

O seu endereço de e-mail não será publicado. Campos obrigatórios são marcados com *