Pular para o conteúdo

Como algoritmos criados por brasileiros detectam plágio e fraudes em artigos científicos usando IA e traduções

Banner Aleatório

IA com visão de mundo e IA cientista: o que esperar da inteligência artificial em 2026

Banner Aleatório

Vêm aí algoritmos que aprendem as regras do mundo e fazem novas descobertas.

A pesquisadora holandesa Elisabeth Bik tem um dom: ela consegue identificar imagens manipuladas em artigos científicos a olho nu. A microbiologista realizou uma análise manual de mais de 20 mil artigos da área de biomedicina em busca de imagens manipuladas e descobriu que 4% das publicações apresentaram problemas. O resultado foi publicado em 2016, muito antes de as inteligências artificiais estarem nas palmas das nossas mãos.

“Ela é uma super humana para detectar esse tipo de manipulação”, brinca o cientista da computação João Phillipe Cardenuto. O trabalho pioneiro de Bik foi uma das inspirações para o grupo do qual o pesquisador faz parte, o Laboratório de Inteligência Artificial (Recod.ai), do Instituto de Computação (IC) da Universidade Estadual de Campinas (Unicamp).

Em parceria com instituições estrangeiras e com acesso a um banco de dados da Retraction Watch, uma entidade internacional que reúne dados de artigos científicos retratados, Cardenuto desenvolveu um algoritmo capaz de identificar fraudes em artigos científicos. Esta área de pesquisa é chamada de ciência forense.

Entre os problemas que a ferramenta é treinada para detectar estão duplicatas e manipulações de imagens, conteúdo visual feito por inteligência artificial, plágio ou reuso de imagem, além de material usado em “fábricas de artigos” (paper mills, em inglês). “Estamos falando de milhares de artigos publicados dessa forma, em que organizações possivelmente criminosas vendem a autoria para grupos distintos”, diz Cardenuto.

Plágio, IA, traduções

A pressão no ambiente acadêmico pela quantidade de publicações acaba favorecendo ações de plágio e esse tipo de negócio. “Na China, até pouco tempo atrás os médicos que publicavam artigos científicos eram bonificados, então, fora os plantões, eles tinham que fazer pesquisa, então acabavam pagando essas empresas para fabricar um paper”, afirma o cientista.

As “fábricas” operam de maneiras diferentes, segundo Elisabeth Bik. “Algumas fazem artigos de baixa qualidade por meio de plágio ou parafraseando outros trabalhos, algumas usam inteligência artificial para reescrever publicações ou traduzir para outros idiomas”, afirma a holandesa em entrevista ao Estadão. “São organizações que fazem anúncios nas redes sociais e vendem autoria para quem quer crescer o currículo com artigos falsos.”

O avanço das tecnologias de inteligência artificial generativa dificultaram ainda mais o trabalho de pesquisadores como Bik e Cardenuto, mas também podem oferecer saídas.

“É muito fácil hoje pedir para o chatGPT escrever um paper, ele faz isso em minutos, e pode criar bases de dados falsas, imagens e experimentos que nunca existiram”, diz Bik. “Mas ferramentas como a Proofig e a ImageTwin têm ajudado, elas comparam com banco de dados de uma forma que os humanos não conseguem.”

Decisão sobre a veracidade do trabalho

Por enquanto, o algoritmo desenvolvido na Unicamp é focado em detectar imagens suspeitas, mas o grupo tem se interessado cada vez mais em investigar fraudes textuais em trabalhos acadêmicos e incentiva que mais especialistas da área da computação se dediquem a esse tipo de pesquisa.

“Existem poucas plataformas disponíveis para revistas científicas que detectam plágio e fraudes, então isso nos motivou também a criar tudo em código aberto”, diz Cardenuto. O material está disponível no artigo publicado pelo cientista da computação em parceria com seu orientador, Anderson Rocha, na revista “Science and Engineering Ethics”.

A partir desta pesquisa, os brasileiros também desenvolveram uma ferramenta mais amigável para pessoas leigas que está sendo utilizada pelo escritório de integridade científica dos Estados Unidos (Office of Research Integrity). “Ela é bem focada no trabalho que esses agentes relataram serem mais difíceis de realizar, então eles colocam o artigo suspeito em PDF na plataforma e ela aponta os problemas”, afirma Cardenuto.

A decisão sobre a veracidade de um trabalho, no entanto, é sempre de quem comanda a máquina. “A ferramenta não é uma verdade absoluta, a palavra final é sempre do ser humano”, diz o cientista.

No Brasil, órgãos que fomentam a pesquisa, como o Conselho Nacional de Desenvolvimento Científico e Tecnológico (CNPq) e a Fundação de Amparo à Pesquisa do Estado de São Paulo (Fapesp), dispõem de comissões de ética, de integridade e de códigos de conduta.

Em notas, as duas entidades informaram que o número de ocorrências de plágio e/ou fraudes é pequeno e que há investigações de má conduta, que, caso comprovadas, resultam em punições.

Em 2024, a Comissão de Integridade da Atividade Científica (CIAC), do CNPq, recebeu 101 denúncias, entre as quais 26 resultaram em correções nos currículos Lattes, 10 em suspensão de currículos, 13 foram consideradas procedentes e 6 resultaram em devolução de recursos.

O grupo do IC da Unicamp tem trabalhado em ferramentas mais acessíveis para serem adotadas pelas universidades e órgãos brasileiros, segundo Cardenuto.

Fake news

Outra preocupação dos pesquisadores é com relação ao excesso de fake news geradas por inteligência artificial nas redes sociais. Um algoritmo similar ao de detecção de fraudes foi elaborado por Jing Yang, outra cientista sob orientação de Rocha, só que voltado às notícias falsas.

“A ideia é deixar ferramentas de checagem cada vez mais disponíveis e acessíveis, até para identificar fraudes e plágios em outros campos, como no jornalismo”, afirma Cardenuto.

Source link

Join the conversation

O seu endereço de e-mail não será publicado. Campos obrigatórios são marcados com *