Sites de notícia bloquearam bot do ChatGPT que “rouba” conteúdo

Novo bot do ChatGPT "vasculha" internet para coletar informações; jornais não querem seus conteúdos usados para treinar IA e o bloquearam
Por Vitoria Lopes Gomez, editado por Bruno Capozzi 01/09/2023 16h08
Pessoa olhando para home do site do jornal The New York Times num computador
Imagem: Karen Bleier/AFP/Getty Images
Compartilhe esta matéria
Ícone Whatsapp Ícone Whatsapp Ícone X (Tweeter) Ícone Facebook Ícone Linkedin Ícone Telegram Ícone Email

Sites de jornais do mundo inteiro aderiram a um movimento contra o ChatGPT. Eles estão bloqueando o “rastreador” da OpenAI, desenvolvedora do chatbot, que coleta informações dessas páginas da internet para treinar seu modelo de linguagem. Na prática, isso significa que a tecnologia não terá acesso a websites como The New York Times, CNN, Reuters e Bloomberg, que acusam a ferramenta de roubo de conteúdo.

O Olhar Digital já explicou como o código de bloqueio funciona aqui.

Leia mais:

GPTBot e roubo de conteúdo

  • Os modelos de linguagem que fazem chatbots como o ChatGPT funcionar são treinados com informações já existentes, como as disponíveis na internet. No entanto, isso não significa que eles tenham autorização para isso.
  • Assim, veículos de comunicação têm acusado a OpenAI de roubo de conteúdo. Segundo a Agence France-Presse, a presidente da emissora francesa Radio France, Sibyle Veil, foi uma das que se manifestou contra “o roubo não autorizado de conteúdo” durante uma coletiva de imprensa.
  • Agora, os sites de veículos jornalísticos do mundo inteiro estão bloqueando o GPTBot, um web crawler (uma espécie de vasculhador de conteúdo) da OpenAI projetado para percorrer a internet e coletar informações, como textos e imagens, para treinar seus modelos de IA.
  • Isso porque a empresa divulgou o código que impede o acesso desse crawler aos sites, que pode ser desabilitado pelos desenvolvedores e impedir o uso não autorizado dos conteúdos.
Fachada do prédio do The New York Times
Bot do ChatGPT está impedido de acessar o The New York Times (Imagem: Osugi//Shutterstock)

Jornais do mundo inteiro contra o ChatGPT

Com isso, jornais como o The New York Times já aderiram ao bloqueio. O Olhar Digital já falou sobre esse caso aqui.

A CNN, Reuters, Bloomberg, a emissora australiana ABC e os veículos franceses France 24, RFI, Mediapart, Radio France e TF1 foram outros que impediram o acesso do GPTBot a seus domínios.

De acordo com a ferramenta detectora de plágios Originality.ai, 10% das páginas mais importantes do mundo já negaram acesso à extensão do ChatGPT e o número aumentará em 5% semanalmente. Algumas delas são a Amazon.com, Wikihow.com, Quora.com e o banco de imagens Shutterstock.

Arte com pessoa apontando o dedo em uma tela artificial com as letras AI
Solução para embate entre OpenAI e sites do mundo inteiro pode estar na remuneração pelos conteúdos (Imagem Shutterstock)

Solução está na remuneração

  • As emissores se opõem ao “roubo” de conteúdo não recompensado. A solução, então, pode estar na remuneração correta.
  • Segundo Bertrand Gié, diretor da divisão de notícias do jornal francês Le Figaro, o desejo dos veículos é de “obter acordos de licença e pagamento” pelas informações usadas.
  • A agência de notícias Associated Press (AP), dos Estados Unidos, é uma das que já abriu caminhos para isso. Em julho, o veículo assinou um acordo com a OpenAI que autoriza a empresa a coletar seus arquivos desde 1985, em troca do acesso à tecnologia de IA.
  • Além disso, a desenvolvedora do ChatGPT se comprometeu a enviar US$ 5 milhões ao American Journalism Project, uma organização que apoia veículos do país.

Já assistiu aos novos vídeos no YouTube do Olhar Digital? Inscreva-se no canal!

Vitória Lopes Gomez é jornalista formada pela UNESP e redatora no Olhar Digital.

Bruno Capozzi é jornalista formado pela Faculdade Cásper Líbero e mestre em Ciências Sociais pela PUC-SP, tendo como foco a pesquisa de redes sociais e tecnologia.