A Meta teria usado milhares de livros pirateados para treinar seus modelos de IA, apesar dos avisos de seus advogados, relata a Reuters.

O processo, movido pela comediante Sarah Silverman, pelo vencedor do Pulitzer Michael Chabon e outros, protocolado nesta segunda-feira (11), acusa a empresa de Mark Zuckerberg de violar direitos autorais e treinar especificamente a Lhama, seu modelo de IA.

publicidade

Leia mais:

Em novembro, um juiz da Califórnia já havia rejeitado partes do processo, mas permitiu que os autores o reajustasse.

publicidade

Novidades do processo

  • A nova versão apresentada esta semana traz bate-papo de Tim Dettmers, pesquisador afiliado à Meta, discutindo aquisição do conjunto de dados em servidor Discord;
  • Essa evidência é significativa, pois mostra que a Meta sabia que o uso desses livros poderia não estar protegido pela lei de direitos autorais dos EUA;
  • Dettmers questiona o departamento jurídico da Meta sobre se o uso dos arquivos do livro como dados de treinamento seria “legalmente aceitável”;
  • “No Facebook, há muitas pessoas interessadas em trabalhar com (T)he (P)ile, inclusive eu, mas em sua forma atual, não podemos usá-lo por motivos legais”, escreveu Dettmers em 2021, referindo-se a conjunto de dados que a Meta reconheceu usar para treinar sua primeira versão do Llama;
  • “Os dados não podem ser usados ou os modelos não podem ser publicados se forem treinados com base nesses dados”, teriam dito os advogados da Meta a Dettmers;
  • Os acusadores dizem que o treinamento sobre os dados deveria “se enquadrar no uso justo”, doutrina legal dos EUA que protege certos usos não-licenciados de obras protegidas por direitos autorais;
  • Dettmers afirmou à Reuters que não poderia comentar as acusações.

Acusações de violação de direitos autorais

As empresas de tecnologia enfrentam ações judiciais este ano de criadores de conteúdo que as acusam de roubar obras protegidas por direitos autorais para construir modelos de IA.

Se forem bem-sucedidos, esses casos poderão atenuar a mania da IA generativa, podendo aumentar o custo de construção de modelos, obrigando as empresas de IA a compensar artistas, autores e outros criadores de conteúdos pela utilização de suas obras.

publicidade

Na Europa, novas regras provisórias regulam a IA podem forçar as empresas a divulgar os dados que utilizam para treinar seus modelos e expô-las a mais riscos jurídicos.