Novos modelos de IA não admitem quando não sabem responder algo

Tudo sobre Inteligência Artificial

Um novo estudo publicado na revista Nature revela que, à medida que os modelos de linguagem grande (LLMs) de IA se tornam mais avançados, eles têm menos probabilidade de admitir que não conseguem responder a uma pergunta.

Ofertas

Vendido por Amazon

Kit Roteador Mesh Wi-Fi 6 Gigabit AX3000 - Deco X50(2-pack)(US)

De: R$ 1.156,80
Por: R$ 727,20

Vendido por Amazon

Tilibra - Agenda Costurada Diária 12,3 x 16,6 cm Charme 2026 - Flores fundo branco e roxo

De: R$ 30,90
Por: R$ 27,81

Vendido por Amazon

Caderneta s Pastel, Cicero, 6726, Azul, Médio (14X21)

De: R$ 79,99
Por: R$ 50,10

Vendido por Amazon

Tilibra - Estojo Triplo Grande Académie Azul

De: R$ 110,90
Por: R$ 67,95

Vendido por Amazon

Giz Pastel Oleoso Pentel Arts 12 Cores

De: R$ 17,90
Por: R$ 10,90

Vendido por Amazon

GoPro Max 360 - Câmera de Ação à Prova d'água, Vídeo 360 5.6K, Reenquadramento 4K, Foto 360, GPS, Live 1080p, Max HyperSmooth, TimeWarp, Trava de horizonte, Capturas com bastão invisível

De: R$ 2.699,00
Por: R$ 2.069,90

Vendido por Amazon

Carregador de Pilhas AA/AAA com 2 Pilhas AA 2500mAh e 2 Pilhas AAA 1000mAh, Multilaser - CB045

De: R$ 89,90
Por: R$ 56,60

Vendido por Amazon

Adaptador Wireless TP-Link Archer T2U Nano USB

De: R$ 109,90
Por: R$ 75,85

Vendido por Amazon

SMS - NOBREAK LITE 600 - POTÊNCIA 600VA | 300W - BIVOLT ENT.: 115/ 220V | SAÍDA: 115V - 4 TOMADAS - SENOIDAL P/APROX. - LINE INTERACTIVE - PN 29202

De: R$ 616,58
Por: R$ 334,32

Vendido por Amazon

Película Para Kindle 11ª Geração 2024 e 2022 (RS23CV e C2V2L3) 6" Polegadas - Antirreflexo - Fosca – FD Acessórios

De: R$ 33,90
Por: R$ 23,83

Vendido por Amazon

Drone DJI Air 3S Fly More Combo (Com tela) BR - DJI056

Por R$ 17.180,00

Vendido por Amazon

PHILIPS, Fone de Ouvido Sem Fio TWS, TAT2500BK/00, Bluetooth, Com Cancelamento de Ruído Ativo ANC, Com Microfone, Até 24 horas de bateria, iPX4, Preto

De: R$ 156,00
Por: R$ 140,00

Vendido por Amazon

Microfone USB Gaming PC, Microfone RGB para PC/Notebook, Mic with Boom Arm, Microphone Condensador de mesa/Braço, Live, Podcast, Gravação de Audio, Karaoke, Gamer Youtuber DJ

De: R$ 199,99
Por: R$ 178,49

Vendido por Amazon

Relógio Inteligente Smartwatch Feminino Masculino, com Tela AMOLED, AI ChatGPT, Chamadas Bluetooth, 150+ Monitoramento Esportivo, Chamadas Bluetooth,Relogio smartwatch iphone

Por R$ 299,99

Vendido por Amazon

soundcore Q11i da Anker Fone De Ouvido Bluetooth 5.3, Fone Gamer, Headphone Bluetooth Over-Ear, Graves Profundos, 60H Autonomia, Hi-Res Áudio, Almofadas Removíveis, Conexão Multiponto, Preto

De: R$ 259,35
Por: R$ 198,99

Vendido por Amazon

Bundle Nintendo Switch + Super Mario Bros. Wonder + 3 Meses de Assinatura Nintendo Switch Online

Por R$ 2.399,00

Vendido por Amazon

Notebook ASUS TUF Gaming A15, RTX 3050, AMD RYZEN 7, 8 GB, 512 GB SSD, KeepOS, Tela 15.6'' FHD, Graphite Black - FA506NCR-HN089

De: R$ 5.299,00
Por: R$ 3.999,00

Vendido por Amazon

Havit Headphone Fone de Ouvido H2002d Pink, Gamer, com Microfone, Falante 53mm, Plug 3, 5mm: compatível com XBOX ONE e PS4, HAVIT, HV-H2002d Cor Rosa

De: R$ 229,00
Por: R$ 160,65

Vendido por Amazon

Roku Streaming Stick HD 2025 | Dispositivo de streaming para TV HD/FHD com controle remoto por comando de voz compatível com Alexa, Siri e Google

De: R$ 289,90
Por: R$ 187,00

Vendido por Amazon

EMEET Webcam 4K, webcam S600 com tripé, 2 microfones de redução de ruído, FOV ajustável de 40° a 73°, foco automático PDAF, capa de privacidade integrada, câmera de streaming para jogos, chamadas de

Por R$ 419,99

Vendido por Amazon

soundcore P30i by Anker, Fones de Ouvido com Cancelamento de Ruído, Graves Poderosos, 45H de Reprodução, Estojo 2-em-1 com Suporte para Celular, IP54, Bluetooth 5.4, Fones Sem Fio

De: R$ 369,00
Por: R$ 209,90

Vendido por Amazon

soundcore P20i da Anker Fone de Ouvido Sem Fio, Drivers de 10mm, Graves Potentes, Bluetooth 5.3, 30H de Bateria, Resistência à Água, 2 Microfones IA, App Personalizável

De: R$ 249,00
Por: R$ 166,19

Vendido por Amazon

HD Externo Toshiba 1TB Canvio Basics Preto HDTB510XK3AA

De: R$ 464,65
Por: R$ 330,00

Pesquisadores da Universitat Politècnica de Valência, na Espanha, testaram os últimos modelos BLOOM, Llama e GPT para verificar a precisão de suas respostas em matemática, ciências e geografia, fazendo milhares de perguntas. Eles classificaram as respostas como corretas, incorretas ou evasivas.

Honestidade dos modelos de IA diminuiu

O estudo sobre LLMs também mostrou que, embora a precisão em questões mais desafiadoras tenha melhorado com cada novo modelo, esses modelos são menos transparentes sobre sua capacidade de responder corretamente.
Enquanto versões anteriores admitiam quando não sabiam a resposta ou precisavam de mais informações, os novos modelos tendem a adivinhar e podem até errar em perguntas simples.
Os LLMs, que usam aprendizado profundo para entender e gerar conteúdo, conseguem resolver problemas complexos, mas ainda cometem erros em questões básicas.
O estudo afirma que “a confiabilidade total não é alcançada nem mesmo em níveis de dificuldade muito baixos”.

Pessoa apontando e quase tocando em fileira de dados holográficas que parece correnteza de um rio — Modelos de linguagem estão avançando, mas isso não significa que as IAs estão mais confiáveis (Imagem: NicoElNino/Shutterstock)

Leia mais

Por exemplo, o GPT-4 da OpenAI apresentou uma redução significativa nas respostas evasivas em comparação com o GPT-3.5, mas isso não corresponde à expectativa de que modelos mais novos seriam melhores em evitar respostas fora de sua capacidade.

Os pesquisadores concluíram que não houve “nenhuma melhoria aparente” nos modelos, apesar do avanço tecnológico.