Sites de notícia bloquearam bot do ChatGPT que “rouba” conteúdo

Imagem: Karen Bleier/AFP/Getty Images

Sites de jornais do mundo inteiro aderiram a um movimento contra o ChatGPT. Eles estão bloqueando o “rastreador” da OpenAI, desenvolvedora do chatbot, que coleta informações dessas páginas da internet para treinar seu modelo de linguagem. Na prática, isso significa que a tecnologia não terá acesso a websites como The New York Times, CNN, Reuters e Bloomberg, que acusam a ferramenta de roubo de conteúdo.

O Olhar Digital já explicou como o código de bloqueio funciona aqui.

Leia mais:

GPTBot e roubo de conteúdo

Os modelos de linguagem que fazem chatbots como o ChatGPT funcionar são treinados com informações já existentes, como as disponíveis na internet. No entanto, isso não significa que eles tenham autorização para isso.
Assim, veículos de comunicação têm acusado a OpenAI de roubo de conteúdo. Segundo a Agence France-Presse, a presidente da emissora francesa Radio France, Sibyle Veil, foi uma das que se manifestou contra “o roubo não autorizado de conteúdo” durante uma coletiva de imprensa.
Agora, os sites de veículos jornalísticos do mundo inteiro estão bloqueando o GPTBot, um web crawler (uma espécie de vasculhador de conteúdo) da OpenAI projetado para percorrer a internet e coletar informações, como textos e imagens, para treinar seus modelos de IA.
Isso porque a empresa divulgou o código que impede o acesso desse crawler aos sites, que pode ser desabilitado pelos desenvolvedores e impedir o uso não autorizado dos conteúdos.

Bot do ChatGPT está impedido de acessar o The New York Times (Imagem: Osugi//Shutterstock)

Jornais do mundo inteiro contra o ChatGPT

Com isso, jornais como o The New York Times já aderiram ao bloqueio. O Olhar Digital já falou sobre esse caso aqui.

A CNN, Reuters, Bloomberg, a emissora australiana ABC e os veículos franceses France 24, RFI, Mediapart, Radio France e TF1 foram outros que impediram o acesso do GPTBot a seus domínios.

De acordo com a ferramenta detectora de plágios Originality.ai, 10% das páginas mais importantes do mundo já negaram acesso à extensão do ChatGPT e o número aumentará em 5% semanalmente. Algumas delas são a Amazon.com, Wikihow.com, Quora.com e o banco de imagens Shutterstock.

Solução para embate entre OpenAI e sites do mundo inteiro pode estar na remuneração pelos conteúdos (Imagem Shutterstock)

Solução está na remuneração

As emissores se opõem ao “roubo” de conteúdo não recompensado. A solução, então, pode estar na remuneração correta.
Segundo Bertrand Gié, diretor da divisão de notícias do jornal francês Le Figaro, o desejo dos veículos é de “obter acordos de licença e pagamento” pelas informações usadas.
A agência de notícias Associated Press (AP), dos Estados Unidos, é uma das que já abriu caminhos para isso. Em julho, o veículo assinou um acordo com a OpenAI que autoriza a empresa a coletar seus arquivos desde 1985, em troca do acesso à tecnologia de IA.
Além disso, a desenvolvedora do ChatGPT se comprometeu a enviar US$ 5 milhões ao American Journalism Project, uma organização que apoia veículos do país.

Já assistiu aos novos vídeos no YouTube do Olhar Digital? Inscreva-se no canal!

Esta post foi modificado pela última vez em 1 de setembro de 2023 16:08

Publicado por

Vitoria Lopes Gomez

Tags: ChatGPTJornaisOpenAIThe New York Times

1 de setembro de 2023 16:08