Sites de jornais do mundo inteiro aderiram a um movimento contra o ChatGPT. Eles estão bloqueando o “rastreador” da OpenAI, desenvolvedora do chatbot, que coleta informações dessas páginas da internet para treinar seu modelo de linguagem. Na prática, isso significa que a tecnologia não terá acesso a websites como The New York Times, CNN, Reuters e Bloomberg, que acusam a ferramenta de roubo de conteúdo.
O Olhar Digital já explicou como o código de bloqueio funciona aqui.
Leia mais:
- Aprenda a usar o ChatGPT: 10 dicas valiosas para criar perguntas precisas
- ChatGPT e IA: o que os chatbots sabem sobre nós e com quem compartilham dados?
- Como baixar e usar ChatGPT no celular Android
GPTBot e roubo de conteúdo
- Os modelos de linguagem que fazem chatbots como o ChatGPT funcionar são treinados com informações já existentes, como as disponíveis na internet. No entanto, isso não significa que eles tenham autorização para isso.
- Assim, veículos de comunicação têm acusado a OpenAI de roubo de conteúdo. Segundo a Agence France-Presse, a presidente da emissora francesa Radio France, Sibyle Veil, foi uma das que se manifestou contra “o roubo não autorizado de conteúdo” durante uma coletiva de imprensa.
- Agora, os sites de veículos jornalísticos do mundo inteiro estão bloqueando o GPTBot, um web crawler (uma espécie de vasculhador de conteúdo) da OpenAI projetado para percorrer a internet e coletar informações, como textos e imagens, para treinar seus modelos de IA.
- Isso porque a empresa divulgou o código que impede o acesso desse crawler aos sites, que pode ser desabilitado pelos desenvolvedores e impedir o uso não autorizado dos conteúdos.
![Fachada do prédio do The New York Times](https://img.odcdn.com.br/wp-content/uploads/2023/08/Destaque-The-New-York-Times-1024x576.jpg)
Jornais do mundo inteiro contra o ChatGPT
Com isso, jornais como o The New York Times já aderiram ao bloqueio. O Olhar Digital já falou sobre esse caso aqui.
A CNN, Reuters, Bloomberg, a emissora australiana ABC e os veículos franceses France 24, RFI, Mediapart, Radio France e TF1 foram outros que impediram o acesso do GPTBot a seus domínios.
De acordo com a ferramenta detectora de plágios Originality.ai, 10% das páginas mais importantes do mundo já negaram acesso à extensão do ChatGPT e o número aumentará em 5% semanalmente. Algumas delas são a Amazon.com, Wikihow.com, Quora.com e o banco de imagens Shutterstock.
![Arte com pessoa apontando o dedo em uma tela artificial com as letras AI](https://img.odcdn.com.br/wp-content/uploads/2023/07/Arte-com-pessoa-apontando-o-dedo-em-uma-tela-artificial-com-as-letras-AI--1024x576.jpg)
Solução está na remuneração
- As emissores se opõem ao “roubo” de conteúdo não recompensado. A solução, então, pode estar na remuneração correta.
- Segundo Bertrand Gié, diretor da divisão de notícias do jornal francês Le Figaro, o desejo dos veículos é de “obter acordos de licença e pagamento” pelas informações usadas.
- A agência de notícias Associated Press (AP), dos Estados Unidos, é uma das que já abriu caminhos para isso. Em julho, o veículo assinou um acordo com a OpenAI que autoriza a empresa a coletar seus arquivos desde 1985, em troca do acesso à tecnologia de IA.
- Além disso, a desenvolvedora do ChatGPT se comprometeu a enviar US$ 5 milhões ao American Journalism Project, uma organização que apoia veículos do país.
Já assistiu aos novos vídeos no YouTube do Olhar Digital? Inscreva-se no canal!