O ChatGPT ainda mente muito — e até seus criadores sabem disso

OpenAI está desenvolvendo uma nova abordagem para combater as alucinações da IA, recebendo críticas e ceticismo dos especialistas
Ana Luiza Figueiredo31/05/2023 20h05
Celular com ChatGPT aberto num navegador com logomarca da OpenAI ao fundo
Imagem: Markus Mainka/Shutterstock
Compartilhe esta matéria
Ícone Whatsapp Ícone Whatsapp Ícone X (Tweeter) Ícone Facebook Ícone Linkedin Ícone Telegram Ícone Email

Siga o Olhar Digital no Google Discover

A OpenAI está assumindo a responsabilidade de combater as “alucinações” de sua IA no ChatGPT, anunciou a empresa na quarta-feira, 31 de maio, com um método mais recente para treinar modelos de inteligência artificial.

Ofertas

Agenda 2026 Coleção Happy Com Capa Dura Círculos Colors
Vendido por Amazon
Agenda 2026 Coleção Happy Com Capa Dura Círculos Colors
Por R$ 45,90
Suporte para 2 Controles de PlayStation 5 PS5, Apoio de Mesa Gamer, Modelo VN
Vendido por Amazon
Suporte para 2 Controles de PlayStation 5 PS5, Apoio de Mesa Gamer, Modelo VN
De: R$ 39,92
Por: R$ 37,92
Pasta Sanfonada DAC A4 Com 12 Divisões All Black Preto
Vendido por Amazon
Pasta Sanfonada DAC A4 Com 12 Divisões All Black Preto
De: R$ 27,90
Por: R$ 22,59
Carregador Fonte para Notebook Asus 19V 2.37A 45W com Pino Fino 4.0x1.35mm, compatível com VivoBook X543ua X543ma X515 X512 X510U ZenBook 14 UX433FA UX431FA X512F, referência Ad2108020 bivolt
Vendido por Amazon
Carregador Fonte para Notebook Asus 19V 2.37A 45W com Pino Fino 4.0x1.35mm, compatível com VivoBook X543ua X543ma X515 X512 X510U ZenBook 14 UX433FA UX431FA X512F, referência Ad2108020 bivolt
De: R$ 67,44
Por: R$ 59,95
Garmin Relógio Venu 3 Branco 45mm com Monitor Cardíaco de Pulso e GPS
Vendido por Amazon
Garmin Relógio Venu 3 Branco 45mm com Monitor Cardíaco de Pulso e GPS
De: R$ 4.699,00
Por: R$ 3.099,00
eufy Câmera S3 Pro Kit 2+1 por anker, Câmera De Segurança Wi-Fi Externa Sem Fio, 4K, Energia Solar, Visão Noturna MaxColor, Reconhecimento Facial por IA, Compatível com Alexa, Sem taxas mensais
Vendido por Amazon
eufy Câmera S3 Pro Kit 2+1 por anker, Câmera De Segurança Wi-Fi Externa Sem Fio, 4K, Energia Solar, Visão Noturna MaxColor, Reconhecimento Facial por IA, Compatível com Alexa, Sem taxas mensais
De: R$ 3.499,00
Por: R$ 3.324,00
eufy HomeBase3, Câmera de segurança, Reconhecimento Facial por IA, Armazenamento Local Expansível até 16TB, Criptografia Avançada, Ecossistema de Segurança eufy, Sem taxas mensais
Vendido por Amazon
eufy HomeBase3, Câmera de segurança, Reconhecimento Facial por IA, Armazenamento Local Expansível até 16TB, Criptografia Avançada, Ecossistema de Segurança eufy, Sem taxas mensais
De: R$ 1.049,00
Por: R$ 799,00
Bettdow SmartWatch, Relogio Smartwatch Feminino, 1.27" Ecrã tátil, à prova d'água IP68, 100+ Modos Esportivos, chamada Bluetooth, Compatível com Android iOS, voz por IA (Azul)
Vendido por Amazon
Bettdow SmartWatch, Relogio Smartwatch Feminino, 1.27" Ecrã tátil, à prova d'água IP68, 100+ Modos Esportivos, chamada Bluetooth, Compatível com Android iOS, voz por IA (Azul)
De: R$ 299,00
Por: R$ 241,44
Combo Teclado e Mouse sem fio Logitech POP Icon com Teclas e Botões Personalizáveis, Clique Silencioso, Easy-Switch para até 3 dispositivos e Conexão Bluetooth - Grafite
Vendido por Amazon
Combo Teclado e Mouse sem fio Logitech POP Icon com Teclas e Botões Personalizáveis, Clique Silencioso, Easy-Switch para até 3 dispositivos e Conexão Bluetooth - Grafite
De: R$ 499,90
Por: R$ 349,90
eufy Câmera S330 (eufyCam 3) 2-Cam Kit por anker, Câmera De Segurança Wi-Fi Externa Sem Fio, 4K, Painel Solar, Forever Power, Reconhecimento Facial IA, Armazenamento Local Até 16TB, Sem Taxa Mensal
Vendido por Amazon
eufy Câmera S330 (eufyCam 3) 2-Cam Kit por anker, Câmera De Segurança Wi-Fi Externa Sem Fio, 4K, Painel Solar, Forever Power, Reconhecimento Facial IA, Armazenamento Local Até 16TB, Sem Taxa Mensal
De: R$ 2.399,00
Por: R$ 2.159,00
soundcore Select 4 Go da Anker, Alto-Falante Bluetooth Portátil, 20H de Bateria, IP67 à Prova d'Água e Poeira, Flutuante, Som Potente, Ideal para Ambientes Internos, Externos e Passeios
Vendido por Amazon
soundcore Select 4 Go da Anker, Alto-Falante Bluetooth Portátil, 20H de Bateria, IP67 à Prova d'Água e Poeira, Flutuante, Som Potente, Ideal para Ambientes Internos, Externos e Passeios
De: R$ 339,00
Por: R$ 188,99
WB Smart Tag Localizador Bluetooth, Rastreador Compatível com o Apple Find My, bateria substituível, Localizador de itens para bolsas
Vendido por Amazon
WB Smart Tag Localizador Bluetooth, Rastreador Compatível com o Apple Find My, bateria substituível, Localizador de itens para bolsas
De: R$ 88,00
Por: R$ 45,00
Anker Nano Carregador Portátil, Power Bank Compacto 10000mAh 45W Máx., Bateria Portátil Essencial para Viagens com Cabo Retrátil InstaCord de 70 cm para iPhone 17/16 Series, iPad, Galaxy, Pixel e Mais
Vendido por Amazon
Anker Nano Carregador Portátil, Power Bank Compacto 10000mAh 45W Máx., Bateria Portátil Essencial para Viagens com Cabo Retrátil InstaCord de 70 cm para iPhone 17/16 Series, iPad, Galaxy, Pixel e Mais
De: R$ 399,00
Por: R$ 379,00
Capa com Teclado Combo Touch para iPad (10ª geração e A16) Com Teclado Retroiluminado Destacável com Suporte, Trackpad Preciso e Tecnologia Smart Connector - Cinza
Vendido por Amazon
Capa com Teclado Combo Touch para iPad (10ª geração e A16) Com Teclado Retroiluminado Destacável com Suporte, Trackpad Preciso e Tecnologia Smart Connector - Cinza
De: R$ 1.629,90
Por: R$ 1.239,90
ULANZI VL-200Bi 200W luz de estúdio bicolor, luz de preenchimento COB, iluminação de saída contínua com controle de APP, 2700K-6500K, 6 cenas, montagem Bowens
Vendido por Amazon
ULANZI VL-200Bi 200W luz de estúdio bicolor, luz de preenchimento COB, iluminação de saída contínua com controle de APP, 2700K-6500K, 6 cenas, montagem Bowens
De: R$ 1.179,00
Por: R$ 943,20
eufy Câmera S350, Camera de Segurança Wi-Fi, 4K Inteligente com Câmera Dupla, Visão 360°, Zoom 8×, Visão Noturna, Babá Eletrônica, Rastreamento por IA, Compatível com Alexa e HomeBase 3
Vendido por Amazon
eufy Câmera S350, Camera de Segurança Wi-Fi, 4K Inteligente com Câmera Dupla, Visão 360°, Zoom 8×, Visão Noturna, Babá Eletrônica, Rastreamento por IA, Compatível com Alexa e HomeBase 3
De: R$ 999,00
Por: R$ 798,99
WAAW By ALOK Fone de Ouvido Bluetooth SENSE 310 Com Cancelamento de Ruído e Assistente de Voz, 30h de Bateria
Vendido por Amazon
WAAW By ALOK Fone de Ouvido Bluetooth SENSE 310 Com Cancelamento de Ruído e Assistente de Voz, 30h de Bateria
De: R$ 329,90
Por: R$ 205,91
WAAW by ALOK Caixa de Som US 200SB DUO Bluetooth 2 em 1, Resistente à Água, Acabamento Metálico, TWS, 20W RMS
Vendido por Amazon
WAAW by ALOK Caixa de Som US 200SB DUO Bluetooth 2 em 1, Resistente à Água, Acabamento Metálico, TWS, 20W RMS
De: R$ 599,90
Por: R$ 476,10
Eufy Cam E340 Câmera De Segurança Wi-Fi Dual Band (2.4/5GHz) Exterior, 360° PTZ, Gravação 24/7, 2000 Lúmens, Detecção de Movimento + Sirene Integrada, Câmera Dupla, Sem Taxa Mensal, Branco
Vendido por Amazon
Eufy Cam E340 Câmera De Segurança Wi-Fi Dual Band (2.4/5GHz) Exterior, 360° PTZ, Gravação 24/7, 2000 Lúmens, Detecção de Movimento + Sirene Integrada, Câmera Dupla, Sem Taxa Mensal, Branco
De: R$ 1.199,00
Por: R$ 1.139,05
Novo Kindle Paperwhite Signature Edition (32 GB) - O Kindle mais rápido já lançado, com luz frontal autoadaptável, carregamento sem fio e bateria que dura semanas - Cor Preta Metálica
Vendido por Amazon
Novo Kindle Paperwhite Signature Edition (32 GB) - O Kindle mais rápido já lançado, com luz frontal autoadaptável, carregamento sem fio e bateria que dura semanas - Cor Preta Metálica
De: R$ 1.199,00
Por: R$ 949,00
Combo Teclado e Mouse Sem Fio Logitech MK250 Bluetooth com Conectividade Rápida e Fácil, Design Compacto, Mouse Ambidestro, Layout ABNT2, Construção Durável, Compatível com PC e Mac - Rosa
Vendido por Amazon
Combo Teclado e Mouse Sem Fio Logitech MK250 Bluetooth com Conectividade Rápida e Fácil, Design Compacto, Mouse Ambidestro, Layout ABNT2, Construção Durável, Compatível com PC e Mac - Rosa
De: R$ 169,90
Por: R$ 139,90
Combo Teclado e Mouse sem fio Logitech MK235 com Conexão USB, Pilhas Inclusas e Layout ABNT2
Vendido por Amazon
Combo Teclado e Mouse sem fio Logitech MK235 com Conexão USB, Pilhas Inclusas e Layout ABNT2
De: R$ 149,90
Por: R$ 119,90
Anker MagGo Power Bank, Carregador Portátil com Certificação Qi2 de 15W, Compatível com MagSafe, 10.000mAh, Tela Inteligente e Suporte Dobrável, para iPhone 17/15/14/13/12, Inclui Cabo USB-C, Branco
Vendido por Amazon
Anker MagGo Power Bank, Carregador Portátil com Certificação Qi2 de 15W, Compatível com MagSafe, 10.000mAh, Tela Inteligente e Suporte Dobrável, para iPhone 17/15/14/13/12, Inclui Cabo USB-C, Branco
De: R$ 699,00
Por: R$ 398,99
Mouse Sem Fio Logitech M330 SILENT com Clique Silencioso, Design Destro, Bateria de 18 Meses, Receptor USB, Compatível com Windows, macOS, ChromeOS e Pilha Inclusa - Preto
Vendido por Amazon
Mouse Sem Fio Logitech M330 SILENT com Clique Silencioso, Design Destro, Bateria de 18 Meses, Receptor USB, Compatível com Windows, macOS, ChromeOS e Pilha Inclusa - Preto
De: R$ 109,90
Por: R$ 79,90
Webcam Full HD Logitech Brio 100 com Microfone Integrado, Proteção de Privacidade, Correção Automática de Luz e Conexão USB-C - Grafite
Vendido por Amazon
Webcam Full HD Logitech Brio 100 com Microfone Integrado, Proteção de Privacidade, Correção Automática de Luz e Conexão USB-C - Grafite
De: R$ 299,90
Por: R$ 199,90

Leia mais:

A pesquisa vem em um momento em que a desinformação proveniente de sistemas de IA é mais debatida do que nunca, em meio ao boom da IA generativa e à preparação para as eleições presidenciais dos EUA em 2024.

  • A OpenAI impulsionou o boom da IA generativa seis meses atrás, quando lançou o ChatGPT, seu chatbot alimentado pelo GPT-3 e GPT-4.
  • O ChatGPT alcançou mais de 100 milhões de usuários mensais em dois meses, estabelecendo, segundo relatos, um recorde como o aplicativo de crescimento mais rápido.
  • Até o momento, a Microsoft investiu mais de US$ 13 bilhões na OpenAI, e o valor da startup alcançou aproximadamente US$ 29 bilhões.

As alucinações da IA ocorrem quando modelos como o ChatGPT da OpenAI ou o Bard do Google fabricam informações, agindo como se estivessem transmitindo fatos.

Alguns exemplos:

Até mesmo os modelos de última geração têm a tendência de produzir falsidades — eles exibem uma tendência de inventar fatos em momentos de incerteza. Essas alucinações são particularmente problemáticas em domínios que exigem raciocínio de várias etapas, uma vez que um único erro lógico é suficiente para desviar uma solução muito maior.

Pesquisadores da OpenAI no relatório

Nova abordagem

A potencial nova estratégia da OpenAI para combater as fabricações: treinar modelos de IA para se recompensarem por cada etapa de raciocínio individual correta quando estão chegando a uma resposta, em vez de apenas recompensar uma conclusão final correta.

A abordagem é chamada de “supervisão de processo”, em oposição à “supervisão de resultado”, e pode levar a uma IA mais explicável, de acordo com os pesquisadores, uma vez que a estratégia incentiva os modelos a seguir mais uma abordagem de “pensamento” semelhante ao humano.

Detectar e mitigar os erros lógicos ou alucinações de um modelo é um passo crítico para a construção de uma IA geral alinhada. A motivação por trás desta pesquisa é abordar as alucinações para tornar os modelos mais capazes de resolver problemas complexos de raciocínio.”

Karl Cobbe, pesquisador de matemática da OpenAI, ao CNBC

A OpenAI lançou um conjunto complementar de dados com 800.000 rótulos humanos usados para treinar o modelo mencionado no artigo de pesquisa, disse Cobbe.

Avanços da OpenAI são positivos, mas há ceticismo

Ben Winters, consultor sênior do Electronic Privacy Information Center e líder de seu projeto de IA e direitos humanos, expressou ceticismo, afirmando em entrevista ao CNBC que gostaria de examinar o conjunto de dados completo e os exemplos correspondentes.

“Eu simplesmente não acho que isso, por si só, mitiga significativamente as preocupações com desinformação e resultados incorretos… quando está sendo usado na prática”, disse Winters. Ele acrescentou: “Certamente importa se eles planejam implementar o que encontraram por meio desta pesquisa [em seus produtos], e se não o fizerem, isso levanta algumas questões bastante sérias sobre o que eles estão dispostos a disponibilizar ao público.”

Logomarca do ChatGPT com ilustração de homem expandindo mente ao fundo
(Imagem: Pedro Spadoni/Olhar Digital)

Como não está claro se o artigo da OpenAI foi revisado por pares ou revisado em outro formato, Suresh Venkatasubramanian, diretor do centro de responsabilidade tecnológica da Brown University, disse ao CNBC que vê a pesquisa mais como uma observação preliminar do que qualquer outra coisa.

Isso terá que ser avaliado pela comunidade de pesquisa antes de podermos afirmar algo certo sobre isso. Neste mundo, há muitos resultados que são publicados com muita regularidade, e devido à instabilidade geral de como os grandes modelos de linguagem funcionam, o que pode funcionar em um cenário, modelo e contexto pode não funcionar em outro cenário, modelo e contexto.

Suresh Venkatasubramanian, ao CNBC

Venkatasubramanian acrescentou: “Algumas das coisas alucinatórias com as quais as pessoas estão preocupadas são [modelos] inventando citações e referências. Não há evidências neste artigo de que isso funcione para isso… Não estou dizendo que não funcionará; estou dizendo que este artigo não fornece essa evidência.”

Cobbe disse que a empresa “provavelmente enviará [o artigo] para uma conferência futura para revisão por pares.” Segundo o CNBC, a OpenAI não respondeu a um pedido de comentário sobre quando, se algum dia, a empresa planeja implementar a nova estratégia no ChatGPT e em seus outros produtos.

É certamente bem-vindo ver empresas tentando ajustar o desenvolvimento de seus sistemas para tentar reduzir esse tipo de erro — acho que o mais importante é interpretar isso como pesquisa corporativa, à luz das muitas barreiras que existem para formas mais profundas de responsabilização.

Sarah Myers West, diretora administrativa do AI Now Institute, ao CNBC

West acrescentou: “[A OpenAI está] lançando um pequeno conjunto de dados de feedback humano com este artigo, mas não forneceu detalhes básicos sobre os dados usados para treinar e testar o GPT-4. Portanto, ainda há uma quantidade tremenda de opacidade que dificulta os esforços significativos de responsabilização no campo da IA, mesmo quando esses sistemas já estão afetando diretamente as pessoas.”

Com informações do CNBC.

Já assistiu aos novos vídeos no YouTube do Olhar Digital? Inscreva-se no canal!

Ana Luiza Figueiredo é repórter do Olhar Digital. Formada em Jornalismo pela Universidade Federal de Uberlândia (UFU), foi Roteirista na Blues Content, criando conteúdos para TV e internet.