Sites de notícia bloquearam bot do ChatGPT que "rouba" conteúdo

Tudo sobre ChatGPT

Tudo sobre OpenAI

Sites de jornais do mundo inteiro aderiram a um movimento contra o ChatGPT. Eles estão bloqueando o “rastreador” da OpenAI, desenvolvedora do chatbot, que coleta informações dessas páginas da internet para treinar seu modelo de linguagem. Na prática, isso significa que a tecnologia não terá acesso a websites como The New York Times, CNN, Reuters e Bloomberg, que acusam a ferramenta de roubo de conteúdo.

O Olhar Digital já explicou como o código de bloqueio funciona aqui.

Leia mais:

GPTBot e roubo de conteúdo

Os modelos de linguagem que fazem chatbots como o ChatGPT funcionar são treinados com informações já existentes, como as disponíveis na internet. No entanto, isso não significa que eles tenham autorização para isso.
Assim, veículos de comunicação têm acusado a OpenAI de roubo de conteúdo. Segundo a Agence France-Presse, a presidente da emissora francesa Radio France, Sibyle Veil, foi uma das que se manifestou contra “o roubo não autorizado de conteúdo” durante uma coletiva de imprensa.
Agora, os sites de veículos jornalísticos do mundo inteiro estão bloqueando o GPTBot, um web crawler (uma espécie de vasculhador de conteúdo) da OpenAI projetado para percorrer a internet e coletar informações, como textos e imagens, para treinar seus modelos de IA.
Isso porque a empresa divulgou o código que impede o acesso desse crawler aos sites, que pode ser desabilitado pelos desenvolvedores e impedir o uso não autorizado dos conteúdos.

Fachada do prédio do The New York Times — Bot do ChatGPT está impedido de acessar o The New York Times (Imagem: Osugi//Shutterstock)

Jornais do mundo inteiro contra o ChatGPT

Com isso, jornais como o The New York Times já aderiram ao bloqueio. O Olhar Digital já falou sobre esse caso aqui.

A CNN, Reuters, Bloomberg, a emissora australiana ABC e os veículos franceses France 24, RFI, Mediapart, Radio France e TF1 foram outros que impediram o acesso do GPTBot a seus domínios.

De acordo com a ferramenta detectora de plágios Originality.ai, 10% das páginas mais importantes do mundo já negaram acesso à extensão do ChatGPT e o número aumentará em 5% semanalmente. Algumas delas são a Amazon.com, Wikihow.com, Quora.com e o banco de imagens Shutterstock.

Arte com pessoa apontando o dedo em uma tela artificial com as letras AI — Solução para embate entre OpenAI e sites do mundo inteiro pode estar na remuneração pelos conteúdos (Imagem Shutterstock)

Solução está na remuneração

As emissores se opõem ao “roubo” de conteúdo não recompensado. A solução, então, pode estar na remuneração correta.
Segundo Bertrand Gié, diretor da divisão de notícias do jornal francês Le Figaro, o desejo dos veículos é de “obter acordos de licença e pagamento” pelas informações usadas.
A agência de notícias Associated Press (AP), dos Estados Unidos, é uma das que já abriu caminhos para isso. Em julho, o veículo assinou um acordo com a OpenAI que autoriza a empresa a coletar seus arquivos desde 1985, em troca do acesso à tecnologia de IA.
Além disso, a desenvolvedora do ChatGPT se comprometeu a enviar US$ 5 milhões ao American Journalism Project, uma organização que apoia veículos do país.

Já assistiu aos novos vídeos no YouTube do Olhar Digital? Inscreva-se no canal!

Sites de notícia bloquearam bot do ChatGPT que “rouba” conteúdo

GPTBot e roubo de conteúdo

Jornais do mundo inteiro contra o ChatGPT

Solução está na remuneração