Agora, as pessoas podem se sentir desconfortáveis se acreditarem que as conversas profundas ou até mesmo ridículas que tiveram com o ChatGPT permanecerão ocultas para sempre. Devido a uma disputa de direitos autorais em andamento, um tribunal de Nova York ordenou que a OpenAI entregasse aproximadamente vinte milhões de registros de bate-papo a advogados que representam veículos de mídia como o Chicago Tribune e o New York Times. Mesmo que os dados sejam anônimos, ainda há muitas informações sendo trocadas aqui. Ainda é questionável se a anonimização de usuários comuns pode realmente ser bem-sucedida, considerando esse volume.
O pano de fundo é uma ação judicial na qual as empresas de mídia acusam a OpenAI de usar seus artigos para treinamento de IA sem permissão. Os autores da ação querem usar os registros de bate-papo para provar que o ChatGPT reproduz regularmente conteúdo protegido por direitos autorais e não apenas quando o bot é forçado a fazê-lo por meio de manipulação direcionada (“hacking”), como a OpenAI havia alegado. O juiz Sidney H. Stein confirmou uma ordem anterior e ignorou as preocupações da OpenAI. A compilação de dados era muito onerosa e poderia comprometer a privacidade do cliente, de acordo com a OpenAI.
O tribunal viu as coisas de forma diferente e decidiu que a anonimização dos dados era suficiente como medida de proteção e que a relevância para o julgamento superava os riscos. Para a OpenAI, essa é uma derrota legal que os especialistas em segurança já estão descrevendo como um desastre. O Dr. Kolochenko, da ImmuniWeb, observou que isso provavelmente inspirará imitadores em casos semelhantes. Essa decisão prejudica significativamente a privacidade do usuário, independentemente de os 20 milhões de conjuntos de dados conterem violações explosivas de direitos autorais.

