Pesquisadores usam agentes de IA em debate para reduzir erros em respostas

Estudo mostra como debates entre agentes de IA reduzem erros e melhoram respostas de modelos de linguagem.
Maurício Thomaz16/12/2025 05h10, atualizada em 05/01/2026 18h18
Novo método com agentes de IA aumenta a confiabilidade dos LLMs
Novo método com agentes de IA aumenta a confiabilidade dos LLMs (Imagem: Who is Danny / Shutterstock)
Compartilhe esta matéria
Ícone Whatsapp Ícone Whatsapp Ícone X (Tweeter) Ícone Facebook Ícone Linkedin Ícone Telegram Ícone Email

Siga o Olhar Digital no Google Discover

Pesquisadores chineses apresentaram um novo método para tornar respostas de modelos de linguagem mais confiáveis ao estimular debates estruturados entre agentes de IA. A proposta busca enfrentar um dos principais desafios desses sistemas: a tendência de produzir respostas que parecem corretas, mas contêm erros factuais, contradições internas ou falhas lógicas — um problema que limita o uso da inteligência artificial em contextos educacionais e profissionais. As informações são do TechXplore.

Ofertas

Monitor Gamer AOC AGON G4S 25" 310Hz 0.3ms HDR10 IPS Base Ajustável 25G4S/P
Vendido por Amazon
Monitor Gamer AOC AGON G4S 25" 310Hz 0.3ms HDR10 IPS Base Ajustável 25G4S/P
Por R$ 1.479,00
Tilibra - Estojo Minibox Happy Lilás
Vendido por Amazon
Tilibra - Estojo Minibox Happy Lilás
De: R$ 38,12
Por: R$ 36,21
Caneta Gel – CiS Gelyx – Estojo com 6 unidades – Glitter
Vendido por Amazon
Caneta Gel – CiS Gelyx – Estojo com 6 unidades – Glitter
De: R$ 30,90
Por: R$ 24,96
Pentel Caneta Izee 4 Cores 1.0 Corpo Branco Tinta Azul Vermelho Verde e Preto SM/BXC470W
Vendido por Amazon
Pentel Caneta Izee 4 Cores 1.0 Corpo Branco Tinta Azul Vermelho Verde e Preto SM/BXC470W
De: R$ 15,32
Por: R$ 9,90
Tilibra - Caderno Brochura Capa Dura 1/4 D+ Rosa 48 Folhas, 317403
Vendido por Amazon
Tilibra - Caderno Brochura Capa Dura 1/4 D+ Rosa 48 Folhas, 317403
De: R$ 11,85
Por: R$ 5,86
Celular Positivo P26 4G Tela 1,8", Câmera traseira, 48MB RAM 128MB, Bluetooth, Modem Tethering - Preto
Vendido por Amazon
Celular Positivo P26 4G Tela 1,8", Câmera traseira, 48MB RAM 128MB, Bluetooth, Modem Tethering - Preto
Por R$ 139,90
Mochila Grande E Reforçada Impermeável Para Notebook Antifurto Bolsa Executiva Masculina Feminina Trabalho Viagem Escolar Faculdade Cabo De Aço Saída Usb Saída Fone De Ouvido
Vendido por Amazon
Mochila Grande E Reforçada Impermeável Para Notebook Antifurto Bolsa Executiva Masculina Feminina Trabalho Viagem Escolar Faculdade Cabo De Aço Saída Usb Saída Fone De Ouvido
De: R$ 149,79
Por: R$ 113,70
Tilibra D+ - Caderno Brochura Capa Dura, 1/4 Pequeno, 14x20cm, 48 Folhas, Vermelho
Vendido por Amazon
Tilibra D+ - Caderno Brochura Capa Dura, 1/4 Pequeno, 14x20cm, 48 Folhas, Vermelho
De: R$ 11,81
Por: R$ 6,90
Garmin Relógio Venu 3 Branco 45mm com Monitor Cardíaco de Pulso e GPS
Vendido por Amazon
Garmin Relógio Venu 3 Branco 45mm com Monitor Cardíaco de Pulso e GPS
De: R$ 4.699,00
Por: R$ 3.099,00
eufy Câmera S3 Pro Kit 2+1 por anker, Câmera De Segurança Wi-Fi Externa Sem Fio, 4K, Energia Solar, Visão Noturna MaxColor, Reconhecimento Facial por IA, Compatível com Alexa, Sem taxas mensais
Vendido por Amazon
eufy Câmera S3 Pro Kit 2+1 por anker, Câmera De Segurança Wi-Fi Externa Sem Fio, 4K, Energia Solar, Visão Noturna MaxColor, Reconhecimento Facial por IA, Compatível com Alexa, Sem taxas mensais
De: R$ 3.499,00
Por: R$ 3.324,00
eufy HomeBase3, Câmera de segurança, Reconhecimento Facial por IA, Armazenamento Local Expansível até 16TB, Criptografia Avançada, Ecossistema de Segurança eufy, Sem taxas mensais
Vendido por Amazon
eufy HomeBase3, Câmera de segurança, Reconhecimento Facial por IA, Armazenamento Local Expansível até 16TB, Criptografia Avançada, Ecossistema de Segurança eufy, Sem taxas mensais
De: R$ 1.049,00
Por: R$ 799,00
Bettdow SmartWatch, Relogio Smartwatch Feminino, 1.27" Ecrã tátil, à prova d'água IP68, 100+ Modos Esportivos, chamada Bluetooth, Compatível com Android iOS, voz por IA (Azul)
Vendido por Amazon
Bettdow SmartWatch, Relogio Smartwatch Feminino, 1.27" Ecrã tátil, à prova d'água IP68, 100+ Modos Esportivos, chamada Bluetooth, Compatível com Android iOS, voz por IA (Azul)
De: R$ 299,00
Por: R$ 241,44
Combo Teclado e Mouse sem fio Logitech POP Icon com Teclas e Botões Personalizáveis, Clique Silencioso, Easy-Switch para até 3 dispositivos e Conexão Bluetooth - Grafite
Vendido por Amazon
Combo Teclado e Mouse sem fio Logitech POP Icon com Teclas e Botões Personalizáveis, Clique Silencioso, Easy-Switch para até 3 dispositivos e Conexão Bluetooth - Grafite
De: R$ 499,90
Por: R$ 388,78
eufy Câmera S330 (eufyCam 3) 2-Cam Kit por anker, Câmera De Segurança Wi-Fi Externa Sem Fio, 4K, Painel Solar, Forever Power, Reconhecimento Facial IA, Armazenamento Local Até 16TB, Sem Taxa Mensal
Vendido por Amazon
eufy Câmera S330 (eufyCam 3) 2-Cam Kit por anker, Câmera De Segurança Wi-Fi Externa Sem Fio, 4K, Painel Solar, Forever Power, Reconhecimento Facial IA, Armazenamento Local Até 16TB, Sem Taxa Mensal
De: R$ 2.399,00
Por: R$ 2.159,00
soundcore Select 4 Go da Anker, Alto-Falante Bluetooth Portátil, 20H de Bateria, IP67 à Prova d'Água e Poeira, Flutuante, Som Potente, Ideal para Ambientes Internos, Externos e Passeios
Vendido por Amazon
soundcore Select 4 Go da Anker, Alto-Falante Bluetooth Portátil, 20H de Bateria, IP67 à Prova d'Água e Poeira, Flutuante, Som Potente, Ideal para Ambientes Internos, Externos e Passeios
De: R$ 339,00
Por: R$ 188,99
WB Smart Tag Localizador Bluetooth, Rastreador Compatível com o Apple Find My, bateria substituível, Localizador de itens para bolsas
Vendido por Amazon
WB Smart Tag Localizador Bluetooth, Rastreador Compatível com o Apple Find My, bateria substituível, Localizador de itens para bolsas
De: R$ 88,00
Por: R$ 45,00
Anker Nano Carregador Portátil, Power Bank Compacto 10000mAh 45W Máx., Bateria Portátil Essencial para Viagens com Cabo Retrátil InstaCord de 70 cm para iPhone 17/16 Series, iPad, Galaxy, Pixel e Mais
Vendido por Amazon
Anker Nano Carregador Portátil, Power Bank Compacto 10000mAh 45W Máx., Bateria Portátil Essencial para Viagens com Cabo Retrátil InstaCord de 70 cm para iPhone 17/16 Series, iPad, Galaxy, Pixel e Mais
De: R$ 399,00
Por: R$ 379,00
Capa com Teclado Combo Touch para iPad (10ª geração e A16) Com Teclado Retroiluminado Destacável com Suporte, Trackpad Preciso e Tecnologia Smart Connector - Cinza
Vendido por Amazon
Capa com Teclado Combo Touch para iPad (10ª geração e A16) Com Teclado Retroiluminado Destacável com Suporte, Trackpad Preciso e Tecnologia Smart Connector - Cinza
De: R$ 1.629,90
Por: R$ 1.239,90
ULANZI VL-200Bi 200W luz de estúdio bicolor, luz de preenchimento COB, iluminação de saída contínua com controle de APP, 2700K-6500K, 6 cenas, montagem Bowens
Vendido por Amazon
ULANZI VL-200Bi 200W luz de estúdio bicolor, luz de preenchimento COB, iluminação de saída contínua com controle de APP, 2700K-6500K, 6 cenas, montagem Bowens
De: R$ 1.179,00
Por: R$ 943,20
eufy Câmera S350, Camera de Segurança Wi-Fi, 4K Inteligente com Câmera Dupla, Visão 360°, Zoom 8×, Visão Noturna, Babá Eletrônica, Rastreamento por IA, Compatível com Alexa e HomeBase 3
Vendido por Amazon
eufy Câmera S350, Camera de Segurança Wi-Fi, 4K Inteligente com Câmera Dupla, Visão 360°, Zoom 8×, Visão Noturna, Babá Eletrônica, Rastreamento por IA, Compatível com Alexa e HomeBase 3
De: R$ 999,00
Por: R$ 798,99
WAAW By ALOK Fone de Ouvido Bluetooth SENSE 310 Com Cancelamento de Ruído e Assistente de Voz, 30h de Bateria
Vendido por Amazon
WAAW By ALOK Fone de Ouvido Bluetooth SENSE 310 Com Cancelamento de Ruído e Assistente de Voz, 30h de Bateria
De: R$ 329,90
Por: R$ 199,00
WAAW by ALOK Caixa de Som US 200SB DUO Bluetooth 2 em 1, Resistente à Água, Acabamento Metálico, TWS, 20W RMS
Vendido por Amazon
WAAW by ALOK Caixa de Som US 200SB DUO Bluetooth 2 em 1, Resistente à Água, Acabamento Metálico, TWS, 20W RMS
De: R$ 599,90
Por: R$ 476,10
Eufy Cam E340 Câmera De Segurança Wi-Fi Dual Band (2.4/5GHz) Exterior, 360° PTZ, Gravação 24/7, 2000 Lúmens, Detecção de Movimento + Sirene Integrada, Câmera Dupla, Sem Taxa Mensal, Branco
Vendido por Amazon
Eufy Cam E340 Câmera De Segurança Wi-Fi Dual Band (2.4/5GHz) Exterior, 360° PTZ, Gravação 24/7, 2000 Lúmens, Detecção de Movimento + Sirene Integrada, Câmera Dupla, Sem Taxa Mensal, Branco
De: R$ 1.199,00
Por: R$ 1.139,05
Novo Kindle Paperwhite Signature Edition (32 GB) - O Kindle mais rápido já lançado, com luz frontal autoadaptável, carregamento sem fio e bateria que dura semanas - Cor Preta Metálica
Vendido por Amazon
Novo Kindle Paperwhite Signature Edition (32 GB) - O Kindle mais rápido já lançado, com luz frontal autoadaptável, carregamento sem fio e bateria que dura semanas - Cor Preta Metálica
De: R$ 1.199,00
Por: R$ 949,00
Combo Teclado e Mouse Sem Fio Logitech MK250 Bluetooth com Conectividade Rápida e Fácil, Design Compacto, Mouse Ambidestro, Layout ABNT2, Construção Durável, Compatível com PC e Mac - Rosa
Vendido por Amazon
Combo Teclado e Mouse Sem Fio Logitech MK250 Bluetooth com Conectividade Rápida e Fácil, Design Compacto, Mouse Ambidestro, Layout ABNT2, Construção Durável, Compatível com PC e Mac - Rosa
Por R$ 169,90
Combo Teclado e Mouse sem fio Logitech MK235 com Conexão USB, Pilhas Inclusas e Layout ABNT2
Vendido por Amazon
Combo Teclado e Mouse sem fio Logitech MK235 com Conexão USB, Pilhas Inclusas e Layout ABNT2
De: R$ 149,90
Por: R$ 119,90
Anker MagGo Power Bank, Carregador Portátil com Certificação Qi2 de 15W, Compatível com MagSafe, 10.000mAh, Tela Inteligente e Suporte Dobrável, para iPhone 17/15/14/13/12, Inclui Cabo USB-C, Branco
Vendido por Amazon
Anker MagGo Power Bank, Carregador Portátil com Certificação Qi2 de 15W, Compatível com MagSafe, 10.000mAh, Tela Inteligente e Suporte Dobrável, para iPhone 17/15/14/13/12, Inclui Cabo USB-C, Branco
De: R$ 699,00
Por: R$ 398,99
Mouse Sem Fio Logitech M330 SILENT com Clique Silencioso, Design Destro, Bateria de 18 Meses, Receptor USB, Compatível com Windows, macOS, ChromeOS e Pilha Inclusa - Preto
Vendido por Amazon
Mouse Sem Fio Logitech M330 SILENT com Clique Silencioso, Design Destro, Bateria de 18 Meses, Receptor USB, Compatível com Windows, macOS, ChromeOS e Pilha Inclusa - Preto
De: R$ 109,90
Por: R$ 79,90
Webcam Full HD Logitech Brio 100 com Microfone Integrado, Proteção de Privacidade, Correção Automática de Luz e Conexão USB-C - Grafite
Vendido por Amazon
Webcam Full HD Logitech Brio 100 com Microfone Integrado, Proteção de Privacidade, Correção Automática de Luz e Conexão USB-C - Grafite
De: R$ 299,90
Por: R$ 222,11

Os chamados modelos de linguagem de grande escala (LLMs) já são amplamente usados para gerar textos, buscar informações e até programar aplicações. Apesar dos avanços recentes, eles ainda podem “alucinar” fatos ou apresentar raciocínios inconsistentes. Foi nesse cenário que pesquisadores da South China Agricultural University e da Shanghai University of Finance and Economics desenvolveram um novo framework para aprimorar o raciocínio matemático e a confiabilidade das respostas.

Debates entre agentes de IA para reduzir erros

O estudo, publicado no Journal of King Saud University Computer and Information Sciences, propõe um modelo em que múltiplos agentes de IA debatem entre si antes de chegar a uma resposta final. Em vez de depender de um único modelo, a abordagem cria um ambiente de discussão em que diferentes agentes apresentam soluções, questionam argumentos e apontam possíveis falhas.

Agentes de IA mostram caos e confabulação em teste de autonomia total
Apesar dos avanços recentes, os LLMs ainda podem “alucinar” fatos ou apresentar raciocínios inconsistentes (Imagem: Summit Art Creations / Shutterstock)

Segundo os autores, métodos anteriores já haviam melhorado o desempenho dos LLMs com técnicas de prompting ou refinamento posterior, mas quase sempre operando em uma única instância do modelo. Frameworks mais recentes de debate multiagente avançaram ao permitir que diferentes modelos discutissem respostas, porém ainda utilizavam agentes homogêneos e decisões por maioria simples, o que limitava os ganhos.

A nova proposta, chamada de Adaptive Heterogeneous Multi-Agent Debate (A-HMAD), introduz agentes com papéis distintos. Cada um assume uma especialidade específica, como verificação factual, raciocínio lógico ou planejamento estratégico. Além disso, um mecanismo de coordenação decide dinamicamente quais agentes participam de cada rodada de debate, de acordo com o tipo de problema e com a evolução da discussão.

Resultados iniciais e possíveis aplicações futuras

Para chegar a um consenso mais confiável, o sistema utiliza um otimizador que avalia a contribuição de cada agente, levando em conta a consistência lógica e a confiança nas informações apresentadas. Esse processo permite selecionar a resposta final com maior probabilidade de estar correta.

Chip Nvidia
Processo permite selecionar a resposta final com maior probabilidade de estar correta (Imagem: BLKstudio/Shutterstock)

Nos testes iniciais, os pesquisadores avaliaram o desempenho do A-HMAD em seis tipos de tarefas consideradas desafiadoras, tanto para sistemas de IA quanto para humanos. Entre elas estavam problemas matemáticos, perguntas aritméticas, questões de múltiplos fatos, geração de biografias factuais e até estratégias de xadrez.

De forma geral, o novo framework superou métodos tradicionais baseados em um único modelo e também abordagens anteriores de debate multiagente. Os resultados indicaram ganhos de precisão entre 4% e 6% em relação a debates padrão, além de uma redução superior a 30% em erros factuais na geração de biografias.

Entre os principais diferenciais observados pelos autores estão:

  • uso de agentes com especialidades distintas;
  • maior diversidade de perspectivas durante o debate;
  • rodadas adicionais de discussão ajustadas ao problema;
  • um módulo de consenso capaz de ponderar a confiabilidade dos argumentos.
Agente de IA.
Avanços sugerem que conjuntos adaptativos e diversos de agentes de IA podem impulsionar melhorias relevantes no raciocínio baseado em LLMs (Imagem: Wanan Wanan/Shutterstock)

Segundo os pesquisadores, esses avanços sugerem que conjuntos adaptativos e diversos de agentes de IA podem impulsionar melhorias relevantes no raciocínio baseado em LLMs. No futuro, a abordagem pode ser aplicada em plataformas educacionais, pesquisa científica e outras áreas que exigem respostas precisas e bem fundamentadas.

Leia mais:

Ao concluir o estudo, os autores afirmam que o modelo abre caminho para sistemas de IA mais seguros, interpretáveis e pedagogicamente confiáveis, reforçando o papel dos debates entre agentes como uma estratégia promissora para reduzir erros e inconsistências em respostas automatizadas.

Maurício Thomaz
Colaboração para o Olhar Digital

Jornalista com mais de 13 anos de experiência, tenho faro pela audiência e verdadeira paixão em buscar alternativas mais assertivas para a entrega do conteúdo ao usuário.