A empresa controladora do Tumblr e do WordPress.com, a Automattic, pode estar negociando com as desenvolvedoras OpenAI e Midjourney para vender dados de publicações de usuários para treinamento de IA.

Por enquanto, a notícia é um rumor divulgado em relatório pela 404 Media a partir de fontes internas da companhia, mas, segundo o site, o compartilhamento dos dados já começou.

publicidade

Leia mais:

Tumblr e WordPress vs. IA

O relatório divulgado pelo site se baseia em fonte anônima dentro da Automattic. De acordo com ela, a parceria entre a controladora e as desenvolvedoras de IA é “iminente”.

publicidade

O 404 também diz que a Automattic planeja lançar configuração ainda nesta semana, na quarta-feira (28), permitindo que usuários do Tumblr cancelem o “compartilhamento de dados com terceiros, incluindo empresas de IA”.

No entanto, segundo a fonte, documentos internos indicam que a rede social já fez “despejo de dados inicial” para as desenvolvedoras, incluindo conteúdo anterior à configuração, de 2014 a 2023. Alguns deles não estariam sequer visíveis publicamente no Tumblr, mas não está claro exatamente quais dados foram compartilhados.

publicidade

Uma publicação feita nesta terça-feira (27) da empresa controladora, intitulada “Protegendo a escolha do usuário” (em tradução livre) já dá a entender parcerias com companhias de IA não nomeadas. O documento diz:

Compartilharemos apenas conteúdo público hospedado no WordPress.com e no Tumblr de sites que não cancelaram. Também estamos trabalhando diretamente com empresas selecionadas de IA, desde que seus planos estejam alinhados com o que interessa à nossa comunidade: atribuição, opt-outs e controle.

Automattic, em postagem em blog

Midjourney e OpenAI não responderam a pedidos de comentários do The Verge.

publicidade

Wordpress
Imagem: Primakov /Shutterstock

Automattic não é a única

Se a decisão da Automattic se concretizar, o Tumblr e o WordPress.com não serão as primeiras plataformas a fecharem acordos com desenvolvedoras de IA para vender dados para treinamento.

O Reddit vendeu dados para o Google e a Shutterstock permitiu que a OpenAI treinasse seu modelo de linguagem a partir de sua biblioteca de fotos.

Como lembra o The Verge, a situação se complica no caso do Tumblr porque a plataforma é conhecida por seu público criativo, como escritores e ilustradores. Esse mesmo público já vem se manifestando publicamente há algum tempo contra o uso de seus trabalhos para treinar IAs sem as devidas remunerações.