O CEO da Meta, Mark Zuckerberg, se gabou de possuir uma vasta biblioteca com o que você postou tanto no Facebook quanto Instagram (publicações, vídeos, comentários). E esse conteúdo servirá para treinar o grande modelo de linguagem – leia-se: inteligência artificial (IA) estilo ChatGPT – da big tech, segundo Zuckerberg. A fala veio durante a conferência para divulgar os resultados financeiros da empresa.

Para quem tem pressa:

  • Durante conferência sobre resultados financeiros, Mark Zuckerberg, CEO da Meta, revelou planos de utilizar o vasto conteúdo postado no Facebook e Instagram para treinar um modelo de inteligência artificial (IA) avançado;
  • Esta abordagem capitaliza centenas de bilhões de imagens e vídeos, além de postagens de texto e comentários, superando até mesmo o dataset Common Crawl, amplamente utilizado para treinamento de IA;
  • A estratégia da Meta de recorrer ao histórico de dados para desenvolver novas ferramentas de IA segue uma tendência de maximização do valor extraído das interações online dos usuários em redes sociais;
  • A falta de discussão pública sobre a utilização automática de dados postados no Instagram e Facebook para construir a IA da Meta levanta preocupações sobre a posse dessas informações;
  • A empresa adicionou significativo valor de mercado com seus avanços em IA, o que evidencia a importância e o potencial financeiro dos dados coletados dos usuários ao longo dos anos quando usados neste contexto.

O CEO da Meta destacou que Facebook e Instagram reúnem centenas de bilhões de imagens compartilhadas publicamente e dezenas de bilhões de vídeos públicos, além de um grande número de postagens de texto e comentários públicos em seus serviços. Isso supera, segundo estimativas, o dataset Common Crawl, utilizado para treinar grandes modelos de linguagem.

Leia mais:

Planos de Mark Zuckerberg

meta ia
(Imagem: Ascannio/Shutterstock)

Este é o próximo grande passo da Meta. Após te viciar em Instagram e Facebook por 20 anos e monetizar sua atenção, agora revisita antigas postagens e momentos especiais para criar ferramentas de IA bilionárias.

publicidade

O comentário de Zuckerberg sobre o vasto conjunto de dados da Meta vem após o jornal The New York Times processar a OpenAI por propriedade intelectual. Enquanto isso, a Meta maximiza o valor extraído dos usuários das redes sociais sob seu guarda-chuva, reivindicando a propriedade de sua presença online.

Ainda não houve uma discussão ampla sobre a posse automática de dados pelo Instagram para construir a IA da Meta. No entanto, personalidades como Sarah Silverman e outras editoras já processam a Meta por supostamente roubar suas ideias.

Enquanto isso, a Meta tem lucrado com os dados dos usuários há anos, mas nunca nessa magnitude. A big tech segue uma prática semelhante à de Elon Musk com o X, que usou o antigo Twitter para treinar o chatbot xAI Grok.

Treinamento de IAs com seus dados

Ilustração de inteligência artificial filtrando informações
(Imagem: Pedro Spadoni via DALL-E/Olhar Digital)

Em setembro de 2023, a Meta revelou que usava postagens públicas do Facebook e Instagram para treinar seu novo assistente de IA. Para contextualizar, o dataset Common Crawl mencionado por Zuckerberg compreende mais de 250 bilhões de páginas da web coletadas ao longo de 17 anos.

O dataset Common Crawl é uma das maiores bases de dados da internet para treinamento de modelos de linguagem de grande escala. No entanto, os dados da Meta são considerados melhores, mais amplos e mais pessoais.

Em suma: Zuckerberg descobriu uma mina de ouro nas prateleiras da Meta. A biblioteca de aproximadamente duas décadas de postagens no Facebook e Instagram agora é um dos ativos mais valiosos da empresa. Companhia essa que, sem grandes anúncios ou avisos aos usuários, reivindicou a propriedade do perfil social público deles para gerar bilhões de dólares.

O modelo de linguagem de grande escala da Meta, Llama, é um dos melhores do mundo e está sendo usado para treinar produtos como Meta AI, Imagine e mais, com planos de integrá-los ao Facebook, Instagram e ao metaverso nos próximos anos.

Para você ter uma ideia, a Meta adicionou US$ 200 bilhões (aproximadamente R$ 1 trilhão) ao seu valor de mercado num único dia na semana passada, devido a seus esforços em IA. Isso destaca o valor desses dados. Ou melhor, dos seus dados.