Igual aos humanos? Melhor que 80% dos alunos no Enem, ChatGPT vai mal em matemática

Testes mostram que IA se dá bem em humanas
Rodrigo Mozelli05/04/2023 20h20
Logomarca da OpenAI, dona do ChatGPT, sobre imagem de mesa em restaurante
Por meio de parceria com um site de reservas, ChatGPT traz recomendações de restaurantes com links para mesas (Imagem: Pedro Spadoni/Olhar Digital)
Compartilhe esta matéria
Ícone Whatsapp Ícone Whatsapp Ícone X (Tweeter) Ícone Facebook Ícone Linkedin Ícone Telegram Ícone Email

Siga o Olhar Digital no Google Discover

Testes realizados com o GPT-3.5, a linguagem original do ChatGPT, colocaram a ferramenta à prova quando comparada com alunos que realizaram o Enem (Exame Nacional do Ensino Médio).

Ofertas

Offroad Jeep Driving Simulator 3D - Ultimate 4x4 Offroad Mountain Driving Games
Vendido por Amazon
Offroad Jeep Driving Simulator 3D - Ultimate 4x4 Offroad Mountain Driving Games
Por R$ 63,96
Agenda Diaria Executiva 2026 Capa Dura em Couro Sintético Planner Diario Caderno Anotações Anual Escolar Trabalho A5 (Marrom)
Vendido por Amazon
Agenda Diaria Executiva 2026 Capa Dura em Couro Sintético Planner Diario Caderno Anotações Anual Escolar Trabalho A5 (Marrom)
De: R$ 44,90
Por: R$ 39,90
Painel Central Inteligente Wi-Fi e Hub Zigbee NovaDigital PCI01-Z C Tuya e Smart Life Comando de Voz Compatível com Alexa e Google Assistente
Vendido por Amazon
Painel Central Inteligente Wi-Fi e Hub Zigbee NovaDigital PCI01-Z C Tuya e Smart Life Comando de Voz Compatível com Alexa e Google Assistente
De: R$ 915,41
Por: R$ 678,90
Peak Game; Hill Climber – Mountain Climbing Adventure & Survival Challenge
Vendido por Amazon
Peak Game; Hill Climber – Mountain Climbing Adventure & Survival Challenge
Por R$ 11,09
Royale Knockout Run: Fun Race Challenge
Vendido por Amazon
Royale Knockout Run: Fun Race Challenge
Por R$ 37,69
Dino T-Rex Runner: Offline Endless Jump Adventure Game – Dinosaur Arcade Action & Survival Challenge
Vendido por Amazon
Dino T-Rex Runner: Offline Endless Jump Adventure Game – Dinosaur Arcade Action & Survival Challenge
Por R$ 9,53
Romantic Crown Mochila de Viagem Expansivel Masculina Feminina, Mochila Para Notebook Executiva Impermeável Reforçada Cabo USB, Trabalho, Escola, Viagens (Preto)
Vendido por Amazon
Romantic Crown Mochila de Viagem Expansivel Masculina Feminina, Mochila Para Notebook Executiva Impermeável Reforçada Cabo USB, Trabalho, Escola, Viagens (Preto)
De: R$ 119,99
Por: R$ 112,40
US Army Vehicle Transport : Army Truck Driving Simulator Game 2025
Vendido por Amazon
US Army Vehicle Transport : Army Truck Driving Simulator Game 2025
Por R$ 64,55
Samsung Galaxy Watch Ulta Smartwatch 47mm LTE- Titânio Azul
Vendido por Amazon
Samsung Galaxy Watch Ulta Smartwatch 47mm LTE- Titânio Azul
De: R$ 4.999,00
Por: R$ 2.359,00
Ar-Condicionado Split HW Elgin Eco Inverter II Wi-Fi 12.000 BTUs R-32 Quente/Frio 220V
Vendido por Amazon
Ar-Condicionado Split HW Elgin Eco Inverter II Wi-Fi 12.000 BTUs R-32 Quente/Frio 220V
De: R$ 2.499,00
Por: R$ 1.998,89
Freezer Vertical Consul 231 Litros - CVU26FB 110V
Vendido por Amazon
Freezer Vertical Consul 231 Litros - CVU26FB 110V
De: R$ 3.279,35
Por: R$ 2.498,89
WAP Ventilador de Torre AIR SILENCE com 4 Ní­veis de Velocidade, Time de até 15 Horas e Desligamento Automático 127V
Vendido por Amazon
WAP Ventilador de Torre AIR SILENCE com 4 Ní­veis de Velocidade, Time de até 15 Horas e Desligamento Automático 127V
De: R$ 599,90
Por: R$ 491,92
MONDIAL Ventilador de Mesa 40cm Super Power, Branco/Azul, 140W, 110V - VSP-40-W
Vendido por Amazon
MONDIAL Ventilador de Mesa 40cm Super Power, Branco/Azul, 140W, 110V - VSP-40-W
De: R$ 189,90
Por: R$ 129,90
Climatizador de Ar Digital Midea 127V 60Hz
Vendido por Amazon
Climatizador de Ar Digital Midea 127V 60Hz
De: R$ 529,99
Por: R$ 412,69
Monitor Gamer IPS 24 Polegadas, Full HD, 180Hz, 1ms, HDR400, G-SYNC, 250cd/m², Alto-falantes embutidos, Entradas HDMI/DisplayPort/USB/3.5mm
Vendido por Amazon
Monitor Gamer IPS 24 Polegadas, Full HD, 180Hz, 1ms, HDR400, G-SYNC, 250cd/m², Alto-falantes embutidos, Entradas HDMI/DisplayPort/USB/3.5mm
De: R$ 799,00
Por: R$ 592,00
Câmera Digital EOS, Canon, Preto, 23 x 14 x 17 cm
Vendido por Amazon
Câmera Digital EOS, Canon, Preto, 23 x 14 x 17 cm
De: R$ 3.799,00
Por: R$ 3.598,94
Câmera digital, vídeo de 5k, câmera de 75 megapixels, transmissão Wi-Fi, foco automático, zoom digital de 18x, tela giratória de 180 graus, cartão SD de 32G,câmera compacta,vlog,fotográfica
Vendido por Amazon
Câmera digital, vídeo de 5k, câmera de 75 megapixels, transmissão Wi-Fi, foco automático, zoom digital de 18x, tela giratória de 180 graus, cartão SD de 32G,câmera compacta,vlog,fotográfica
Por R$ 799,00
PlayStation DualSense Controle sem fio – Branco
Vendido por Amazon
PlayStation DualSense Controle sem fio – Branco
De: R$ 499,90
Por: R$ 369,00
Robô Aspirador Liectroux XR500 Pro 3 em 1 Aspira Varre Passa Pano Com Aplicativo Compatível Com Alexa e Google Mapeamento Inteligente Salva os Mapas Bivolt
Vendido por Amazon
Robô Aspirador Liectroux XR500 Pro 3 em 1 Aspira Varre Passa Pano Com Aplicativo Compatível Com Alexa e Google Mapeamento Inteligente Salva os Mapas Bivolt
De: R$ 2.489,00
Por: R$ 1.616,02
MONDIAL Ventilador de Parede 40cm Super Turbo 8 Pás, Preto/Prata, 140W, 110V - VTX-40P-8P
Vendido por Amazon
MONDIAL Ventilador de Parede 40cm Super Turbo 8 Pás, Preto/Prata, 140W, 110V - VTX-40P-8P
Por R$ 259,90
Notebook ASUS Vivobook 15 X1504VA Intel Core i5 1334U 8GB Ram 512GB SSD Windows 11 Tela 15,6" FHD Silver - NJ1740W
Vendido por Amazon
Notebook ASUS Vivobook 15 X1504VA Intel Core i5 1334U 8GB Ram 512GB SSD Windows 11 Tela 15,6" FHD Silver - NJ1740W
De: R$ 3.599,00
Por: R$ 3.099,00
Fritadeira Sem Óleo Air Fryer Eos Chef Gourmet 6.2 Litros Compacta Digital Vermelho Eaf60v 110v
Vendido por Amazon
Fritadeira Sem Óleo Air Fryer Eos Chef Gourmet 6.2 Litros Compacta Digital Vermelho Eaf60v 110v
De: R$ 299,90
Por: R$ 199,00
soundcore P20i da Anker Fone de Ouvido Sem Fio, Drivers de 10mm, Graves Potentes, Bluetooth 5.3, 30H de Bateria, Resistência à Água, 2 Microfones IA, App Personalizável
Vendido por Amazon
soundcore P20i da Anker Fone de Ouvido Sem Fio, Drivers de 10mm, Graves Potentes, Bluetooth 5.3, 30H de Bateria, Resistência à Água, 2 Microfones IA, App Personalizável
De: R$ 249,00
Por: R$ 166,19
Philips Walita Preta Fritadeira Airfryer Essential XL Digital, 6.2L de capacidade, Garantia internacional de dois anos, 110V, 2000W (RI9270/90)
Vendido por Amazon
Philips Walita Preta Fritadeira Airfryer Essential XL Digital, 6.2L de capacidade, Garantia internacional de dois anos, 110V, 2000W (RI9270/90)
De: R$ 899,90
Por: R$ 399,00
WAP Umidificador de Ar AIR FLOW com Luminária e Difusor de Aromas, 4 Litros, Autonomia de até 12 horas, 20W Bivolt
Vendido por Amazon
WAP Umidificador de Ar AIR FLOW com Luminária e Difusor de Aromas, 4 Litros, Autonomia de até 12 horas, 20W Bivolt
De: R$ 229,90
Por: R$ 132,00
CAMERA INSTAX MINI 12 ROSA GLOSS
Vendido por Amazon
CAMERA INSTAX MINI 12 ROSA GLOSS
De: R$ 649,00
Por: R$ 505,00

A pesquisa foi realizada pelo DeltaFolha com base em respostas da IA em provas realizadas de 2017 a 2021.

Leia mais:

Confira como o ChatGPT se saiu no Enem:

  • O chatbot se sairia melhor que 78,9% que os alunos em geral, sendo 98,9% em ciências humanas e 95,3% em linguagens e códigos;
  • Já nas disciplinas, há desigualdade: em matemática, a IA só supera 27% dos participantes;
  • O ChatGPT respondeu a 1,29 mil perguntas.

Estrutura do teste

Para as provas de 2020 e 2021 (a última possuindo as pontuações individuais disponíveis publicamente), considerou-se duas aplicações do exame em cada ano, com perguntas distintas entre si.

Na de 2021, especificamente, foi pedido que a tecnologia fizesse redação de acordo com o enunciado do exame. Para seguir a metodologia do MEC, dois especialistas corrigiram o texto seguindo o critério do Enem.

  • A nota média do ChatGPT foi 700, superando 68% dos estudantes, que tiveram média de 613;
  • Se somarmos a nota da redação à média das provas objetivas de 2021 (726,8 em ciências humanas, 606,2 em linguagens e códigos, 577 em ciências da natureza e 433,6 em matemática), a nota da IA foi 608,7:
    • Resultado melhor que o de 79% dos alunos naquele ano.

Com essa nota, o robô poderia pedir vaga no curso de serviço social na UFPE (Universidade Federal de Pernambuco) e ciências sociais na UFF (Universidade Federal Fluminense).

IA é melhor em humanas

O ponto forte do ChatGPT foram as ciências humanas. A média das notas dos cinco anos da ferramenta foi de 725,3, ante 523,3 pontos dos estudantes. Em 2017, quando teve a melhor nota – 785,3 -, ele só foi superado por 775 candidatos (foram 4,7 milhões de participantes naquele ano).

O chatbot também levou a melhor em linguagem e ciências naturais. A nota média foi de 641,4 (versus 516,1) e 639,2 (versus 492,5), respectivamente.

Matemática: a dor de cabeça dos alunos (e do ChatGPT!)

Na média das provas de matemática, a tecnologia da OpenAI obteve 443,1 pontos, abaixo dos 527,1 conquistados pelos participantes. Ele acertou de 13,6% a 27,3% das questões em cada aplicação. Um aluno que respondesse as questões por meio de chute acertaria em torno de 20%.

Pesquisadores tiveram a mesma impressão

Na quarta-feira (29), foi divulgado artigo científico escrito por pesquisadores de USP, USF e Unicamp, no qual detalharam que obtiveram resultados similares – inclusive nas notas de matemática.

Ricardo Primi, um dos pesquisadores, indica que uma das possíveis explicações e a de que tais questões exigem que a IA extraia as informações da pergunta e siga uma linha de raciocínio, como montar a conta necessária, para então chegar à resposta correta – diferente das de humanas e linguagens, nas quais ele só precisa acessar seus dados, sem executar nada a mais.

Neste estudo, o resultado foi melhor, pois os pesquisadores deram exemplos de questões respondidas antes, ajudando a ferramenta. Quando justificava a resposta, a IA tinha ainda mais acertos.

“Quando se apresenta um problema em texto, talvez ele não tenha esse mesmo dado no processo de treinamento. Ele não viu os padrões dos passos do raciocínio explicitamente”, diz Primi.

A OpenAI afirmou, no fim de janeiro, que, acerca de matemática, haverá melhorias no sistema do ChatGPT, de modo que a IA fique melhor na disciplina. Em março ele saiu – trata-se do GPT-4, mas este ainda está sendo implementado. Testes oficiais comprovaram que a nova versão da linguagem se saiu melhor em humanas em relação ao GPT-3.

Na redação, o sistema passou das 30 linhas permitidas. Um dos especialistas disse que o chatbot pecou em vírgulas e na construção sintática, não mostrou bom repertório sociocultural, falhou em argumentar com dados concretos e em propor intervenção para resolver o problema.

Com informações de Estado de Minas

Imagem destacada: Pedro Spadoni/Olhar Digital

Já assistiu aos novos vídeos no YouTube do Olhar Digital? Inscreva-se no canal!

Rodrigo Mozelli é jornalista formado pela Universidade Metodista de São Paulo (UMESP) e, atualmente, é redator do Olhar Digital.

Ícone tagsTags: