Meta é acusada de usar dados pirateados em corrida contra OpenAI

Meta é acusada de usar dados protegidos por direitos autorais, como os do site LibGen, para treinar seus modelos de IA
Ana Luiza Figueiredo16/01/2025 12h46
meta
(Imagem: Cristian Valderas / Shutterstock.com)
Compartilhe esta matéria
Ícone Whatsapp Ícone Whatsapp Ícone X (Tweeter) Ícone Facebook Ícone Linkedin Ícone Telegram Ícone Email

Siga o Olhar Digital no Google Discover

Um processo de direitos autorais contra a Meta revelou detalhes internos sobre o desenvolvimento dos modelos de inteligência artificial (IA) de código aberto da empresa, conhecidos como Llama. Documentos judiciais, recentemente divulgados na Califórnia, mostram discussões internas que levantam preocupações sobre o uso de dados possivelmente protegidos por direitos autorais, incluindo esforços para evitar que o uso de conteúdo “pirata” viesse à tona.

Ofertas

Romantic Crown Mochila de Viagem Expansivel Masculina Feminina, Mochila Para Notebook Executiva Impermeável Reforçada Cabo USB, Trabalho, Escola, Viagens (Preto)
Vendido por Amazon
Romantic Crown Mochila de Viagem Expansivel Masculina Feminina, Mochila Para Notebook Executiva Impermeável Reforçada Cabo USB, Trabalho, Escola, Viagens (Preto)
De: R$ 119,99
Por: R$ 112,40
US Army Vehicle Transport : Army Truck Driving Simulator Game 2025
Vendido por Amazon
US Army Vehicle Transport : Army Truck Driving Simulator Game 2025
Por R$ 64,55
Samsung Galaxy Watch Ulta Smartwatch 47mm LTE- Titânio Azul
Vendido por Amazon
Samsung Galaxy Watch Ulta Smartwatch 47mm LTE- Titânio Azul
De: R$ 4.999,00
Por: R$ 2.288,93
Material Dourado Com 74 Peças Pais & Filhos Dourado
Vendido por Amazon
Material Dourado Com 74 Peças Pais & Filhos Dourado
De: R$ 11,85
Por: R$ 8,28
Ar-Condicionado Split HW Elgin Eco Inverter II Wi-Fi 12.000 BTUs R-32 Quente/Frio 220V
Vendido por Amazon
Ar-Condicionado Split HW Elgin Eco Inverter II Wi-Fi 12.000 BTUs R-32 Quente/Frio 220V
De: R$ 2.499,00
Por: R$ 1.998,89
Freezer Vertical Consul 231 Litros - CVU26FB 110V
Vendido por Amazon
Freezer Vertical Consul 231 Litros - CVU26FB 110V
De: R$ 3.279,35
Por: R$ 2.498,89
WAP Ventilador de Torre AIR SILENCE com 4 Ní­veis de Velocidade, Time de até 15 Horas e Desligamento Automático 127V
Vendido por Amazon
WAP Ventilador de Torre AIR SILENCE com 4 Ní­veis de Velocidade, Time de até 15 Horas e Desligamento Automático 127V
De: R$ 599,90
Por: R$ 491,92
MONDIAL Ventilador de Mesa 40cm Super Power, Branco/Azul, 140W, 110V - VSP-40-W
Vendido por Amazon
MONDIAL Ventilador de Mesa 40cm Super Power, Branco/Azul, 140W, 110V - VSP-40-W
De: R$ 189,90
Por: R$ 129,90
Climatizador de Ar Digital Midea 127V 60Hz
Vendido por Amazon
Climatizador de Ar Digital Midea 127V 60Hz
De: R$ 529,99
Por: R$ 412,69
Monitor Gamer IPS 24 Polegadas, Full HD, 180Hz, 1ms, HDR400, G-SYNC, 250cd/m², Alto-falantes embutidos, Entradas HDMI/DisplayPort/USB/3.5mm
Vendido por Amazon
Monitor Gamer IPS 24 Polegadas, Full HD, 180Hz, 1ms, HDR400, G-SYNC, 250cd/m², Alto-falantes embutidos, Entradas HDMI/DisplayPort/USB/3.5mm
De: R$ 799,00
Por: R$ 593,00
Câmera Digital EOS, Canon, Preto, 23 x 14 x 17 cm
Vendido por Amazon
Câmera Digital EOS, Canon, Preto, 23 x 14 x 17 cm
De: R$ 3.799,00
Por: R$ 3.598,94
Câmera digital, vídeo de 5k, câmera de 75 megapixels, transmissão Wi-Fi, foco automático, zoom digital de 18x, tela giratória de 180 graus, cartão SD de 32G,câmera compacta,vlog,fotográfica
Vendido por Amazon
Câmera digital, vídeo de 5k, câmera de 75 megapixels, transmissão Wi-Fi, foco automático, zoom digital de 18x, tela giratória de 180 graus, cartão SD de 32G,câmera compacta,vlog,fotográfica
De: R$ 699,00
Por: R$ 499,00
PlayStation DualSense Controle sem fio – Branco
Vendido por Amazon
PlayStation DualSense Controle sem fio – Branco
De: R$ 499,90
Por: R$ 369,00
Robô Aspirador Liectroux XR500 Pro 3 em 1 Aspira Varre Passa Pano Com Aplicativo Compatível Com Alexa e Google Mapeamento Inteligente Salva os Mapas Bivolt
Vendido por Amazon
Robô Aspirador Liectroux XR500 Pro 3 em 1 Aspira Varre Passa Pano Com Aplicativo Compatível Com Alexa e Google Mapeamento Inteligente Salva os Mapas Bivolt
De: R$ 2.489,00
Por: R$ 1.616,02
MONDIAL Ventilador de Parede 40cm Super Turbo 8 Pás, Preto/Prata, 140W, 110V - VTX-40P-8P
Vendido por Amazon
MONDIAL Ventilador de Parede 40cm Super Turbo 8 Pás, Preto/Prata, 140W, 110V - VTX-40P-8P
De: R$ 259,90
Por: R$ 179,90
Notebook ASUS Vivobook 15 X1504VA Intel Core i5 1334U 8GB Ram 512GB SSD Windows 11 Tela 15,6" FHD Silver - NJ1740W
Vendido por Amazon
Notebook ASUS Vivobook 15 X1504VA Intel Core i5 1334U 8GB Ram 512GB SSD Windows 11 Tela 15,6" FHD Silver - NJ1740W
De: R$ 3.599,00
Por: R$ 2.759,00
Fritadeira Sem Óleo Air Fryer Eos Chef Gourmet 6.2 Litros Compacta Digital Vermelho Eaf60v 110v
Vendido por Amazon
Fritadeira Sem Óleo Air Fryer Eos Chef Gourmet 6.2 Litros Compacta Digital Vermelho Eaf60v 110v
De: R$ 299,90
Por: R$ 199,00
soundcore P20i da Anker Fone de Ouvido Sem Fio, Drivers de 10mm, Graves Potentes, Bluetooth 5.3, 30H de Bateria, Resistência à Água, 2 Microfones IA, App Personalizável
Vendido por Amazon
soundcore P20i da Anker Fone de Ouvido Sem Fio, Drivers de 10mm, Graves Potentes, Bluetooth 5.3, 30H de Bateria, Resistência à Água, 2 Microfones IA, App Personalizável
De: R$ 249,00
Por: R$ 166,19
Philips Walita Preta Fritadeira Airfryer Essential XL Digital, 6.2L de capacidade, Garantia internacional de dois anos, 110V, 2000W (RI9270/90)
Vendido por Amazon
Philips Walita Preta Fritadeira Airfryer Essential XL Digital, 6.2L de capacidade, Garantia internacional de dois anos, 110V, 2000W (RI9270/90)
De: R$ 899,90
Por: R$ 399,00
WAP Umidificador de Ar AIR FLOW com Luminária e Difusor de Aromas, 4 Litros, Autonomia de até 12 horas, 20W Bivolt
Vendido por Amazon
WAP Umidificador de Ar AIR FLOW com Luminária e Difusor de Aromas, 4 Litros, Autonomia de até 12 horas, 20W Bivolt
De: R$ 229,90
Por: R$ 132,00
CAMERA INSTAX MINI 12 ROSA GLOSS
Vendido por Amazon
CAMERA INSTAX MINI 12 ROSA GLOSS
De: R$ 649,00
Por: R$ 505,00

As comunicações internas destacam a competição acirrada entre a Meta e rivais como OpenAI e Mistral no desenvolvimento de IA. Em um e-mail de outubro de 2023, Ahmad Al-Dahle, vice-presidente de IA generativa da Meta, afirmou que o objetivo da empresa era competir diretamente com o GPT-4 da OpenAI.

Al-Dahle enfatizou a necessidade de “aprender a construir fronteiras e vencer esta corrida”. Entre os dados utilizados para treinar os modelos, surgiu a menção ao controverso site de pirataria Library Genesis (LibGen).

Discussões sobre o uso de LibGen

Um e-mail de Sony Theakanath, diretor de produto da Meta, enviado a Joelle Pineau, vice-presidente de pesquisa em IA, detalha opções para o uso do LibGen. Entre elas, estavam utilizar o site internamente, incluir benchmarks em postagens de blog ou até mesmo treinar um modelo baseado em seu conteúdo. O e-mail revela que o uso do LibGen foi escalado até Mark Zuckerberg e aprovado para o Llama 3, desde que “mitigações acordadas” fossem aplicadas.

Entre essas medidas, estava a remoção de dados marcados como “pirateados” e evitar referências externas ao uso do LibGen nos treinamentos. Internamente, foi mencionado que rivais como OpenAI e Mistral já utilizavam dados do site, embora nenhuma dessas empresas tenha confirmado publicamente essa prática.

libgen
LibGen pode ter sido usado para treinar modelos de IA da Meta (Imagem: Sharaf Maksumov / Shutterstock.com)

Riscos e estratégias para ocultar evidências

Além de preocupações legais, documentos internos mostram que a Meta também tomou medidas para ocultar informações sobre os dados utilizados. Sugestões incluíam remover cabeçalhos de direitos autorais, metadados e listas de autores de documentos para reduzir possíveis responsabilidades jurídicas.

A Meta também enfrentou críticas ao buscar formas alternativas de obter dados para seus modelos. Em 2023, relatórios indicaram que a empresa considerou a compra da editora Simon & Schuster e até a contratação de trabalhadores na África para resumirem livros sem permissão.

Leia mais:

Escassez de dados e impacto na competição

O setor de IA enfrenta um problema crescente: a escassez de novos dados. Líderes como o CEO da OpenAI, Sam Altman, negam a existência de um “muro de dados”, enquanto outros, como Ilya Sutskever, cofundador da OpenAI, admitiram que o setor atingiu o “pico de dados”. Essa limitação tem levado empresas a buscar fontes alternativas, como pagar criadores de conteúdo digital por materiais não utilizados.

Sam Altman, CEO da OpenAI, nega a existência de um muro de dados (Imagem: QubixStudio / Shutterstock.com)

A disputa acirrada entre gigantes da tecnologia para avançar em IA está gerando controvérsias e processos legais que podem moldar o futuro do setor. As evidências apresentadas no caso contra a Meta podem fortalecer as alegações de violação de direitos autorais, enquanto a indústria busca equilibrar inovação e conformidade legal.

Ana Luiza Figueiredo é repórter do Olhar Digital. Formada em Jornalismo pela Universidade Federal de Uberlândia (UFU), foi Roteirista na Blues Content, criando conteúdos para TV e internet.

Ícone tagsTags: