Meta é acusada de usar dados pirateados em corrida contra OpenAI

Tudo sobre OpenAI

Um processo de direitos autorais contra a Meta revelou detalhes internos sobre o desenvolvimento dos modelos de inteligência artificial (IA) de código aberto da empresa, conhecidos como Llama. Documentos judiciais, recentemente divulgados na Califórnia, mostram discussões internas que levantam preocupações sobre o uso de dados possivelmente protegidos por direitos autorais, incluindo esforços para evitar que o uso de conteúdo “pirata” viesse à tona.

Ofertas

Vendido por Amazon

Agenda 2026 Coleção Happy Com Capa Dura Círculos Colors

Por R$ 45,90

Vendido por Amazon

Suporte para 2 Controles de PlayStation 5 PS5, Apoio de Mesa Gamer, Modelo VN

De: R$ 39,92
Por: R$ 37,92

Vendido por Amazon

Pasta Sanfonada DAC A4 Com 12 Divisões All Black Preto

De: R$ 27,90
Por: R$ 22,59

Vendido por Amazon

Carregador Fonte para Notebook Asus 19V 2.37A 45W com Pino Fino 4.0x1.35mm, compatível com VivoBook X543ua X543ma X515 X512 X510U ZenBook 14 UX433FA UX431FA X512F, referência Ad2108020 bivolt

De: R$ 67,44
Por: R$ 59,95

Vendido por Amazon

Garmin Relógio Venu 3 Branco 45mm com Monitor Cardíaco de Pulso e GPS

De: R$ 4.699,00
Por: R$ 3.099,00

Vendido por Amazon

eufy Câmera S3 Pro Kit 2+1 por anker, Câmera De Segurança Wi-Fi Externa Sem Fio, 4K, Energia Solar, Visão Noturna MaxColor, Reconhecimento Facial por IA, Compatível com Alexa, Sem taxas mensais

De: R$ 3.499,00
Por: R$ 3.324,00

Vendido por Amazon

eufy HomeBase3, Câmera de segurança, Reconhecimento Facial por IA, Armazenamento Local Expansível até 16TB, Criptografia Avançada, Ecossistema de Segurança eufy, Sem taxas mensais

De: R$ 1.049,00
Por: R$ 799,00

Vendido por Amazon

Bettdow SmartWatch, Relogio Smartwatch Feminino, 1.27" Ecrã tátil, à prova d'água IP68, 100+ Modos Esportivos, chamada Bluetooth, Compatível com Android iOS, voz por IA (Azul)

De: R$ 299,00
Por: R$ 241,44

Vendido por Amazon

Combo Teclado e Mouse sem fio Logitech POP Icon com Teclas e Botões Personalizáveis, Clique Silencioso, Easy-Switch para até 3 dispositivos e Conexão Bluetooth - Grafite

De: R$ 499,90
Por: R$ 349,90

Vendido por Amazon

eufy Câmera S330 (eufyCam 3) 2-Cam Kit por anker, Câmera De Segurança Wi-Fi Externa Sem Fio, 4K, Painel Solar, Forever Power, Reconhecimento Facial IA, Armazenamento Local Até 16TB, Sem Taxa Mensal

De: R$ 2.399,00
Por: R$ 2.159,00

Vendido por Amazon

soundcore Select 4 Go da Anker, Alto-Falante Bluetooth Portátil, 20H de Bateria, IP67 à Prova d'Água e Poeira, Flutuante, Som Potente, Ideal para Ambientes Internos, Externos e Passeios

De: R$ 339,00
Por: R$ 188,99

Vendido por Amazon

WB Smart Tag Localizador Bluetooth, Rastreador Compatível com o Apple Find My, bateria substituível, Localizador de itens para bolsas

De: R$ 88,00
Por: R$ 45,00

Vendido por Amazon

Anker Nano Carregador Portátil, Power Bank Compacto 10000mAh 45W Máx., Bateria Portátil Essencial para Viagens com Cabo Retrátil InstaCord de 70 cm para iPhone 17/16 Series, iPad, Galaxy, Pixel e Mais

De: R$ 399,00
Por: R$ 379,00

Vendido por Amazon

Capa com Teclado Combo Touch para iPad (10ª geração e A16) Com Teclado Retroiluminado Destacável com Suporte, Trackpad Preciso e Tecnologia Smart Connector - Cinza

De: R$ 1.629,90
Por: R$ 1.239,90

Vendido por Amazon

ULANZI VL-200Bi 200W luz de estúdio bicolor, luz de preenchimento COB, iluminação de saída contínua com controle de APP, 2700K-6500K, 6 cenas, montagem Bowens

De: R$ 1.179,00
Por: R$ 943,20

Vendido por Amazon

eufy Câmera S350, Camera de Segurança Wi-Fi, 4K Inteligente com Câmera Dupla, Visão 360°, Zoom 8×, Visão Noturna, Babá Eletrônica, Rastreamento por IA, Compatível com Alexa e HomeBase 3

De: R$ 999,00
Por: R$ 798,99

Vendido por Amazon

WAAW By ALOK Fone de Ouvido Bluetooth SENSE 310 Com Cancelamento de Ruído e Assistente de Voz, 30h de Bateria

De: R$ 329,90
Por: R$ 205,91

Vendido por Amazon

WAAW by ALOK Caixa de Som US 200SB DUO Bluetooth 2 em 1, Resistente à Água, Acabamento Metálico, TWS, 20W RMS

De: R$ 599,90
Por: R$ 476,10

Vendido por Amazon

Eufy Cam E340 Câmera De Segurança Wi-Fi Dual Band (2.4/5GHz) Exterior, 360° PTZ, Gravação 24/7, 2000 Lúmens, Detecção de Movimento + Sirene Integrada, Câmera Dupla, Sem Taxa Mensal, Branco

De: R$ 1.199,00
Por: R$ 1.139,05

Vendido por Amazon

Novo Kindle Paperwhite Signature Edition (32 GB) - O Kindle mais rápido já lançado, com luz frontal autoadaptável, carregamento sem fio e bateria que dura semanas - Cor Preta Metálica

De: R$ 1.199,00
Por: R$ 949,00

Vendido por Amazon

Cis Cola Em Bastão Fix 34 Gramas, Blister

De: R$ 9,60
Por: R$ 7,60

Vendido por Amazon

Estojo Escolar Organizador Box Grande Para Lapis Feminino Masculino Material Escolar (Azul)

Por R$ 38,70

Vendido por Amazon

Compasso Escolar 106-S, CIS, 18.7700, Estojo c/1 sortido (Não é possível escolher cor)

De: R$ 31,40
Por: R$ 21,77

Vendido por Amazon

Ecolapis Cor Pastel F.Castell 10 Cores, Faber-Castell, 120510P, Multicor, pacote de 10

De: R$ 21,00
Por: R$ 16,63

Vendido por Amazon

Tilibra - Estojo Box Académie Cinza

De: R$ 106,90
Por: R$ 59,95

Vendido por Amazon

Estojo Escolar Box Grande Organizador com Divisórias e Alça - Estojo Necessaire Unissex Capacidade Ampla para Lápis, Canetas, Material Escolar (Preto)

Por R$ 34,90

Vendido por Amazon

Chamequinho Papel A4, 75 g, 100 Folhas, Verde Sulfite

De: R$ 9,90
Por: R$ 7,20

Vendido por Amazon

Combo Teclado e Mouse Sem Fio Logitech MK250 Bluetooth com Conectividade Rápida e Fácil, Design Compacto, Mouse Ambidestro, Layout ABNT2, Construção Durável, Compatível com PC e Mac - Rosa

De: R$ 169,90
Por: R$ 139,90

Vendido por Amazon

Combo Teclado e Mouse sem fio Logitech MK235 com Conexão USB, Pilhas Inclusas e Layout ABNT2

De: R$ 149,90
Por: R$ 119,90

Vendido por Amazon

Anker MagGo Power Bank, Carregador Portátil com Certificação Qi2 de 15W, Compatível com MagSafe, 10.000mAh, Tela Inteligente e Suporte Dobrável, para iPhone 17/15/14/13/12, Inclui Cabo USB-C, Branco

De: R$ 699,00
Por: R$ 398,99

Vendido por Amazon

Mouse Sem Fio Logitech M330 SILENT com Clique Silencioso, Design Destro, Bateria de 18 Meses, Receptor USB, Compatível com Windows, macOS, ChromeOS e Pilha Inclusa - Preto

De: R$ 109,90
Por: R$ 79,90

Vendido por Amazon

Webcam Full HD Logitech Brio 100 com Microfone Integrado, Proteção de Privacidade, Correção Automática de Luz e Conexão USB-C - Grafite

De: R$ 299,90
Por: R$ 199,90

As comunicações internas destacam a competição acirrada entre a Meta e rivais como OpenAI e Mistral no desenvolvimento de IA. Em um e-mail de outubro de 2023, Ahmad Al-Dahle, vice-presidente de IA generativa da Meta, afirmou que o objetivo da empresa era competir diretamente com o GPT-4 da OpenAI.

Al-Dahle enfatizou a necessidade de “aprender a construir fronteiras e vencer esta corrida”. Entre os dados utilizados para treinar os modelos, surgiu a menção ao controverso site de pirataria Library Genesis (LibGen).

Discussões sobre o uso de LibGen

Um e-mail de Sony Theakanath, diretor de produto da Meta, enviado a Joelle Pineau, vice-presidente de pesquisa em IA, detalha opções para o uso do LibGen. Entre elas, estavam utilizar o site internamente, incluir benchmarks em postagens de blog ou até mesmo treinar um modelo baseado em seu conteúdo. O e-mail revela que o uso do LibGen foi escalado até Mark Zuckerberg e aprovado para o Llama 3, desde que “mitigações acordadas” fossem aplicadas.

Entre essas medidas, estava a remoção de dados marcados como “pirateados” e evitar referências externas ao uso do LibGen nos treinamentos. Internamente, foi mencionado que rivais como OpenAI e Mistral já utilizavam dados do site, embora nenhuma dessas empresas tenha confirmado publicamente essa prática.

Riscos e estratégias para ocultar evidências

Além de preocupações legais, documentos internos mostram que a Meta também tomou medidas para ocultar informações sobre os dados utilizados. Sugestões incluíam remover cabeçalhos de direitos autorais, metadados e listas de autores de documentos para reduzir possíveis responsabilidades jurídicas.

A Meta também enfrentou críticas ao buscar formas alternativas de obter dados para seus modelos. Em 2023, relatórios indicaram que a empresa considerou a compra da editora Simon & Schuster e até a contratação de trabalhadores na África para resumirem livros sem permissão.

Leia mais:

Escassez de dados e impacto na competição

O setor de IA enfrenta um problema crescente: a escassez de novos dados. Líderes como o CEO da OpenAI, Sam Altman, negam a existência de um “muro de dados”, enquanto outros, como Ilya Sutskever, cofundador da OpenAI, admitiram que o setor atingiu o “pico de dados”. Essa limitação tem levado empresas a buscar fontes alternativas, como pagar criadores de conteúdo digital por materiais não utilizados.

Sam Altman, CEO da OpenAI, nega a existência de um muro de dados (Imagem: QubixStudio / Shutterstock.com)

A disputa acirrada entre gigantes da tecnologia para avançar em IA está gerando controvérsias e processos legais que podem moldar o futuro do setor. As evidências apresentadas no caso contra a Meta podem fortalecer as alegações de violação de direitos autorais, enquanto a indústria busca equilibrar inovação e conformidade legal.