O jornal americano The New York Times entrou com uma ação judicial contra a OpenAI e sua colaboradora e investidora mais próxima, a Microsoft. A acusação alega que as empresas violaram a lei de direitos autorais ao treinar modelos de inteligência artificial generativa com seu conteúdo sem a devida autorização.

O que você precisa saber:

  • O processo, apresentado no Tribunal do Distrito Federal em Manhattan, afirma que milhões de artigos do NYT foram utilizados no treinamento de modelos de IA sem consentimento.
  • Isso inclui aqueles fundamentais para o ChatGPT, amplamente popular da OpenAI, e o Copilot da Microsoft.
  • O NYT exige que a OpenAI e a Microsoft “destruam” os modelos e os dados de treinamento contendo o material infringente, além de serem responsabilizadas por “bilhões de dólares em danos legais e reais” relacionados à “cópia e uso ilegal das obras exclusivas do The [New York] Times”.
  • “Se o The [New York] Times e outras organizações de notícias não puderem produzir e proteger seu jornalismo independente, haverá um vácuo que nenhum computador ou inteligência artificial poderá preencher”, declara a queixa do jornal “Menos jornalismo será produzido, e o custo para a sociedade será enorme.”

Leia mais:

publicidade

Em comunicado por e-mail ao Tech Crunch, um porta-voz da OpenAI declarou: “Respeitamos os direitos dos criadores e proprietários de conteúdo e estamos comprometidos em colaborar com eles para garantir que se beneficiem da tecnologia de IA e dos novos modelos de receita. Nossas conversas contínuas com o The New York Times têm sido produtivas e estão avançando de maneira construtiva, então estamos surpresos e desapontados com esse desenvolvimento. Estamos esperançosos de encontrar uma maneira mutuamente benéfica de trabalhar juntos, assim como estamos fazendo com muitos outros editores.”

Treinamento de modelos de IA

Os modelos de IA generativa “aprendem” a partir de exemplos para criar ensaios, códigos, e-mails, artigos e muito mais, e empresas como a OpenAI vasculham a web em busca de milhões a bilhões desses exemplos para adicionar aos seus conjuntos de treinamento. Alguns exemplos estão no domínio público. Outros não estão, ou estão sob licenças restritivas que exigem citação ou formas específicas de compensação.

publicidade

Os fornecedores argumentam que a doutrina de uso justo fornece uma proteção abrangente para suas práticas de vasculhamento da web. Os detentores de direitos autorais discordam; centenas de organizações de notícias estão agora utilizando códigos para evitar que OpenAI, Google e outros escaneiem seus sites em busca de dados de treinamento.

O conflito entre fornecedores e veículos de mídia resultou em um número crescente de batalhas legais, sendo esta a mais recente.