OpenAI explica por que IAs ainda “alucinam”

“Mesmo com modelos mais capazes, um desafio continua difícil de resolver: as alucinações”, afirma startup
Rodrigo Mozelli05/09/2025 17h22
AI com um logo de atenção
Segundo a companhia, as avaliações atuais criam incentivos para que os modelos arrisquem respostas em vez de assumirem que não sabem (Imagem: Digineer Station/Shutterstock)
Compartilhe esta matéria
Ícone Whatsapp Ícone Whatsapp Ícone X (Tweeter) Ícone Facebook Ícone Linkedin Ícone Telegram Ícone Email

Siga o Olhar Digital no Google Discover

A OpenAI divulgou um novo estudo em que detalha as razões pelas quais modelos de linguagem grande (LLMs, na sigla em inglês), usado pelas inteligências artificiais (IAs), continuam apresentando “alucinações” — respostas falsas, mas plausíveis, dadas com confiança. Segundo a empresa, o problema está ligado a como os sistemas são treinados e avaliados.

Ofertas

Fone de Ouvido Headphone P47 Sem Fio Bluetooth Wireless Micro Sd 5.0 Dobrável Com Microfone Regulável Para Corrida Academia Escritório Caminhada Linha Premium (Preto)
Vendido por Amazon
Fone de Ouvido Headphone P47 Sem Fio Bluetooth Wireless Micro Sd 5.0 Dobrável Com Microfone Regulável Para Corrida Academia Escritório Caminhada Linha Premium (Preto)
De: R$ 39,90
Por: R$ 19,90
Smart TV Multi Roku 32" HD 3 HDMI 2 USB Compatível com Alexa e Google Home - TL052M
Vendido por Amazon
Smart TV Multi Roku 32" HD 3 HDMI 2 USB Compatível com Alexa e Google Home - TL052M
De: R$ 1.149,00
Por: R$ 819,00
Carregador Super Turbo 50W Ultra Rápido Tipo C e USB Com Carregamento Rápido + Cabo Tipo C Compatível Com Todos Os Dispositivos, Android, Ios 15/16, Xiaomi - Todos Dispositivos Celulares
Vendido por Amazon
Carregador Super Turbo 50W Ultra Rápido Tipo C e USB Com Carregamento Rápido + Cabo Tipo C Compatível Com Todos Os Dispositivos, Android, Ios 15/16, Xiaomi - Todos Dispositivos Celulares
De: R$ 32,90
Por: R$ 22,90
Placa de Video MSI RTX 5060 Shadow 2X OC, 8GB, GDDR7-912-V537-037
Vendido por Amazon
Placa de Video MSI RTX 5060 Shadow 2X OC, 8GB, GDDR7-912-V537-037
De: R$ 2.920,14
Por: R$ 2.240,00
Ar-Condicionado Split HW Elgin Eco Inverter II Wi-Fi 12.000 BTUs R-32 Quente/Frio 220V
Vendido por Amazon
Ar-Condicionado Split HW Elgin Eco Inverter II Wi-Fi 12.000 BTUs R-32 Quente/Frio 220V
De: R$ 2.499,00
Por: R$ 1.998,89
Freezer Vertical Consul 231 Litros - CVU26FB 110V
Vendido por Amazon
Freezer Vertical Consul 231 Litros - CVU26FB 110V
De: R$ 3.279,35
Por: R$ 2.498,89
WAP Ventilador de Torre AIR SILENCE com 4 Ní­veis de Velocidade, Time de até 15 Horas e Desligamento Automático 127V
Vendido por Amazon
WAP Ventilador de Torre AIR SILENCE com 4 Ní­veis de Velocidade, Time de até 15 Horas e Desligamento Automático 127V
De: R$ 599,90
Por: R$ 404,90
MONDIAL Ventilador de Mesa 40cm Super Power, Branco/Azul, 140W, 110V - VSP-40-W
Vendido por Amazon
MONDIAL Ventilador de Mesa 40cm Super Power, Branco/Azul, 140W, 110V - VSP-40-W
De: R$ 189,90
Por: R$ 129,90
Climatizador de Ar Digital Midea 127V 60Hz
Vendido por Amazon
Climatizador de Ar Digital Midea 127V 60Hz
De: R$ 529,99
Por: R$ 412,69
Monitor Gamer IPS 24 Polegadas, Full HD, 180Hz, 1ms, HDR400, G-SYNC, 250cd/m², Alto-falantes embutidos, Entradas HDMI/DisplayPort/USB/3.5mm
Vendido por Amazon
Monitor Gamer IPS 24 Polegadas, Full HD, 180Hz, 1ms, HDR400, G-SYNC, 250cd/m², Alto-falantes embutidos, Entradas HDMI/DisplayPort/USB/3.5mm
De: R$ 799,00
Por: R$ 593,00
Câmera Digital EOS, Canon, Preto, 23 x 14 x 17 cm
Vendido por Amazon
Câmera Digital EOS, Canon, Preto, 23 x 14 x 17 cm
De: R$ 3.799,00
Por: R$ 3.598,94
Anker MagGo Power Bank, Bateria Magnética Ultra Fina de 10.000mAh, Certificação Qi2, Portátil, Carregador MagSafe Compatível de 15W Ultra Rápido, Compatível com iPhone 17/16/15, Samsung,Xiaomi e Mais
Vendido por Amazon
Anker MagGo Power Bank, Bateria Magnética Ultra Fina de 10.000mAh, Certificação Qi2, Portátil, Carregador MagSafe Compatível de 15W Ultra Rápido, Compatível com iPhone 17/16/15, Samsung,Xiaomi e Mais
De: R$ 649,00
Por: R$ 469,00
Notebook Acer Nitro V15 ANV15-41-R4Q9 R77735HS AMD Ryzen 7 32GB 512GB SSD NVIDIA RTX 4050 15.6” FHD LED IPS 165Hz AGPOS
Vendido por Amazon
Notebook Acer Nitro V15 ANV15-41-R4Q9 R77735HS AMD Ryzen 7 32GB 512GB SSD NVIDIA RTX 4050 15.6” FHD LED IPS 165Hz AGPOS
De: R$ 7.799,00
Por: R$ 5.610,00
Câmera digital, vídeo de 5k, câmera de 75 megapixels, transmissão Wi-Fi, foco automático, zoom digital de 18x, tela giratória de 180 graus, cartão SD de 32G,câmera compacta,vlog,fotográfica
Vendido por Amazon
Câmera digital, vídeo de 5k, câmera de 75 megapixels, transmissão Wi-Fi, foco automático, zoom digital de 18x, tela giratória de 180 graus, cartão SD de 32G,câmera compacta,vlog,fotográfica
De: R$ 699,00
Por: R$ 499,00
PlayStation DualSense Controle sem fio – Branco
Vendido por Amazon
PlayStation DualSense Controle sem fio – Branco
De: R$ 499,90
Por: R$ 379,00
Robô Aspirador Liectroux XR500 Pro 3 em 1 Aspira Varre Passa Pano Com Aplicativo Compatível Com Alexa e Google Mapeamento Inteligente Salva os Mapas Bivolt
Vendido por Amazon
Robô Aspirador Liectroux XR500 Pro 3 em 1 Aspira Varre Passa Pano Com Aplicativo Compatível Com Alexa e Google Mapeamento Inteligente Salva os Mapas Bivolt
De: R$ 2.489,00
Por: R$ 1.616,02
MONDIAL Ventilador de Parede 40cm Super Turbo 8 Pás, Preto/Prata, 140W, 110V - VTX-40P-8P
Vendido por Amazon
MONDIAL Ventilador de Parede 40cm Super Turbo 8 Pás, Preto/Prata, 140W, 110V - VTX-40P-8P
De: R$ 259,90
Por: R$ 179,90
Notebook ASUS Vivobook 15 X1504VA Intel Core i5 1334U 8GB Ram 512GB SSD Windows 11 Tela 15,6" FHD Silver - NJ1740W
Vendido por Amazon
Notebook ASUS Vivobook 15 X1504VA Intel Core i5 1334U 8GB Ram 512GB SSD Windows 11 Tela 15,6" FHD Silver - NJ1740W
De: R$ 3.599,00
Por: R$ 2.759,00
Fritadeira Sem Óleo Air Fryer Eos Chef Gourmet 6.2 Litros Compacta Digital Vermelho Eaf60v 110v
Vendido por Amazon
Fritadeira Sem Óleo Air Fryer Eos Chef Gourmet 6.2 Litros Compacta Digital Vermelho Eaf60v 110v
De: R$ 299,90
Por: R$ 199,00
soundcore P20i da Anker Fone de Ouvido Sem Fio, Drivers de 10mm, Graves Potentes, Bluetooth 5.3, 30H de Bateria, Resistência à Água, 2 Microfones IA, App Personalizável
Vendido por Amazon
soundcore P20i da Anker Fone de Ouvido Sem Fio, Drivers de 10mm, Graves Potentes, Bluetooth 5.3, 30H de Bateria, Resistência à Água, 2 Microfones IA, App Personalizável
De: R$ 249,00
Por: R$ 166,19
Philips Walita Preta Fritadeira Airfryer Essential XL Digital, 6.2L de capacidade, Garantia internacional de dois anos, 110V, 2000W (RI9270/90)
Vendido por Amazon
Philips Walita Preta Fritadeira Airfryer Essential XL Digital, 6.2L de capacidade, Garantia internacional de dois anos, 110V, 2000W (RI9270/90)
De: R$ 899,90
Por: R$ 399,00
WAP Umidificador de Ar AIR FLOW com Luminária e Difusor de Aromas, 4 Litros, Autonomia de até 12 horas, 20W Bivolt
Vendido por Amazon
WAP Umidificador de Ar AIR FLOW com Luminária e Difusor de Aromas, 4 Litros, Autonomia de até 12 horas, 20W Bivolt
De: R$ 229,90
Por: R$ 132,00
CAMERA INSTAX MINI 12 ROSA GLOSS
Vendido por Amazon
CAMERA INSTAX MINI 12 ROSA GLOSS
De: R$ 649,00
Por: R$ 473,00

“Mesmo com modelos mais capazes, um desafio continua difícil de resolver: as alucinações”, afirma o texto. A empresa define essas ocorrências como situações em que o sistemagera uma resposta confiante que não é verdadeira”.

Logo da OpenAI em um smartphone que está em cima do teclado de um notebook
Segundo a dona do ChatGPT, o problema está ligado a como os sistemas são treinados e avaliados (Imagem: Ascannio/Shutterstock)

Um exemplo citado foi quando pesquisadores perguntaram a um chatbot sobre a tese de doutorado de Adam Tauman Kalai, coautor do estudo. O sistema deu três respostas diferentestodas incorretas. Ao perguntar sobre sua data de nascimento, novamente surgiram três datas distintas, nenhuma correta.

Incentivo a “chutar” em vez de admitir incerteza

De acordo com a OpenAI, as avaliações atuais criam incentivos para que os modelos arrisquem respostas em vez de assumirem que não sabem. “Se o modelo arrisca ‘10 de setembro’ como data de aniversário, há uma chance em 365 de estar certo. Já dizer ‘não sei’ garante zero pontos”, explica o estudo. Dessa forma, os algoritmos passam a ser recompensados por adivinhar.

O problema, segundo a empresa, é que “a maioria dos scoreboards prioriza a precisão, mas erros são piores do que abstenções”. A OpenAI defende que é melhor um modelo indicar incerteza ou pedir esclarecimento do que oferecer uma informação incorreta com confiança.

Como corrigir o problema

  • A solução, de acordo com o documento, seria mudar a forma de avaliação;
  • “Penalizar erros confiantes mais do que a incerteza e dar crédito parcial para expressões adequadas de dúvida” é, segundo a empresa, o caminho mais promissor;
  • A prática já é usada em alguns exames padronizados, que desestimulam o chute;
  • A OpenAI critica o fato de que “os testes mais usados continuam recompensando palpites de sorte”. Para a empresa, isso mantém o ciclo de modelos que preferem arriscar em vez de admitir limitações.

ChatGPT
“Nossos modelos mais recentes têm taxas menores de alucinação e seguimos trabalhando para reduzir ainda mais os erros confiantes”, diz a OpenAI (Imagem: PhotoGranary02/Shutterstock)

Origem das alucinações das IAs

O estudo também explica como esses erros surgem no treinamento. Os modelos aprendem inicialmente a prever a próxima palavra em grandes volumes de texto, sem rótulos de “verdadeiro” ou “falso”. Isso significa que não há exemplos explícitos de informações incorretas. “É duplamente difícil distinguir declarações válidas das inválidas quando você não tem exemplos rotulados como inválidos”, aponta o relatório.

Enquanto padrões consistentes, como ortografia, são facilmente aprendidos, fatos aleatórios e de baixa frequência — como a data de nascimento de alguém — não seguem lógica previsível e acabam mais sujeitos a erros.

Conclusões do estudo

O estudo rebate alguns equívocos comuns. Entre eles, a ideia de que alucinações seriam inevitáveis. “Elas não são, porque modelos de linguagem podem se abster quando estão incertos”, defende a empresa. Outro ponto é a noção de que só modelos maiores poderiam evitar erros. Para a OpenAI, “pode ser mais fácil para um modelo pequeno reconhecer seus limites”.

A empresa reforça que está avançando: “Nossos modelos mais recentes têm taxas menores de alucinação e seguimos trabalhando para reduzir ainda mais os erros confiantes”. Contudo, a chave para resolver o problema pode estar menos no aumento da capacidade computacional e mais em como os modelos são avaliados e recompensados durante seu desenvolvimento.

Página web da OpenAI
Para a startup, a chave para resolver o problema pode estar menos no aumento da capacidade computacional e mais em como os modelos são avaliados e recompensados durante seu desenvolvimento (Imagem: Iljanaresvara Studio/Shutterstock)

Rodrigo Mozelli é jornalista formado pela Universidade Metodista de São Paulo (UMESP) e, atualmente, é redator do Olhar Digital.