BRASÍLIA — O jornal Folha de S.Paulo entrou com uma ação na quarta-feira, 20, contra a OpenAI, criadora do ChatGPT, por concorrência desleal. O veículo pede que a empresa pare de coletar e usar seu conteúdo jornalístico sem permissão.
A Folha também pediu indenização à OpenAI por uso indevido do seu conteúdo e a destrução dos modelos de inteligência artificial construídos a partir do treinamento feito com base em seu conteúdo. O jornal alega que a empresa oferece aos usuários resumos e reproduções integrais de conteúdo jornalístico sem autorização, incluindo aquele restrito para assinantes, furando o paywall.

A Folha entrou com uma ação contra a OpenAI por uso indevido de dados e concorrência desleal Foto: Ascannio /Adobe Stock
Procurada, a OpenAI ainda não respondeu.
A concorrência desleal e a violação de direitos autorais, segundo a ação, se dá porque “o réu desenvolve e aprimora sua ferramenta de IA (…) com base em conteúdo alheio (…) sem autorização e sem o pagamento de qualquer remuneração. Além disso, em resposta a prompts (comandos) dos usuários, reproduz reportagens na íntegra no mesmo dia em que são publicadas, o que desvia “a ‘clientela’ —no caso, os internautas— de forma ilegítima”.
A Folha incluiu na ação documentos que mostram, segundo o veículo, como a OpenAI usou o site e o arquivo do jornal para treinar a sua tecnologia. A prova consta num repositório da plataforma GitHub mantido por funcionários da empresa americana, em que o UOL, que hospeda o domínio da Folha, aparece entre os principais domínios que são matéria-prima para o treinamento do ChatGPT. O Estadão também consta na lista.
O jornal diz ter detectado 45 mil acessos em seu site, apenas no mês de julho, feitos por robôs da empresa, que estariam usando o conteúdo nele produzido.
“O conteúdo da Folha foi utilizado para treinamento e desenvolvimento do Chat GPT e atualmente, para além disso, a ferramenta de IA da OpenAI reproduz conteúdo da Folha, redistribui esse conteúdo, gera textos e até fura o paywall. Uma consulta (prompt) no ChatGPT sobre o conteúdo da Folha traz resposta com detalhes. Além disso, há sistemas que detectam os acessos aos sites da Folha, e os bots da OpenAI nesses acessos são muitos”, afirma Taís Gasparian, advogada do jornal.
A Folha diz, na ação, que “o réu desenvolve e aprimora sua ferramenta de IA e, portanto, a sua atividade, com base em conteúdo alheio, fazendo-o sem autorização e sem o pagamento de qualquer remuneração, a despeito dos altíssimos investimentos feitos pela autora”. Também afirma que a OpenAI “explora comercialmente o conteúdo de titularidade da autora, reproduzindo-o ou plagiando-o, obtendo com isso enorme crescimento de sua audiência no Brasil: a OpenAI tinha 8,5 milhões de visitantes únicos/mês em junho de 2024 e, em junho deste ano, já conta com 35,8 milhões de visitantes únicos/mês, salto de mais de 4 vezes. Essa é a estratégia de todas as big techs: investir em aumento explosivo de sua audiência para monopolizá-la e explorá-la comercialmente”.
O jornal alega investir na produção de conteúdo, na sua publicação e armazenamento, o que inclui não só a divulgação de informações, mas toda a atividade jornalística em si, “como a contratação de editores, repórteres, jornalistas, cinegrafistas, fotógrafos e roteiristas”, além de toda a estrutura administrativa.
O jornal argumenta que a ação visa a proteger o conteúdo jornalístico de modo a garantir a valorização e a continuidade da produção intelectual e artística de forma profissional e autônoma. “Ao assegurar que editoras, jornais e produtoras, assim como artistas, tenham o controle sobre o uso e a remuneração de suas obras, o sistema de direitos autorais estimula a criação original, reconhece o esforço individual e o protege contra a apropriação indevida por terceiros”.
E diz que, sem essa proteção, “desincentiva-se a produção jornalística, cultural e criativa, uma vez que a ausência de retorno justo e a insegurança jurídica podem erodir tanto a sustentabilidade financeira das empresas e dos seus profissionais, quanto a diversidade e a qualidade das expressões culturais”.
A Folha diz que chegou a manter contato com a OpenAI no ano passado para tentar chegar a um acordo pela coleta de dados e uso do conteúdo, mas as negociações não tiveram avanço, por decisão unilateral do réu. “O último email enviado pela autora ficou sem resposta, o que reforça a atitude de descaso do réu. Esse início de negociação (frustrada) mostra o óbvio: o réu reconheceu que deveria pagar à autora pela coleta de uso de seus conteúdos, como outras empresas de inteligência artificial têm feito”, diz o documento.
Gasparian diz que o processo movido pelo The New York Times contra a OpenAI e a Microsoft nos Estados Unidos, pelo mesmo motivo, foi uma das referências para esta ação. “Há, contudo, diversas outras ações no mundo contra empresas de IA por motivos similares, muitas delas de jornais”, declara.
A ação do jornal americano é de 2023 e foi a primeira vez que uma organização de mídia do país processava as empresas, os criadores do ChatGPT e de outros sistemas de IA sobre questões de direitos autorais associadas aos seus trabalhos escritos.
O processo, movido no Tribunal Distrital Federal de Manhattan, afirmava que milhões de artigos publicados pelo The New York Times foram usados para treinar chatbots automatizados que agora competem com o meio de comunicação como fonte de informação confiável.

