Pesquisadores usam agentes de IA em debate para reduzir erros em respostas

Estudo mostra como debates entre agentes de IA reduzem erros e melhoram respostas de modelos de linguagem.
Maurício Thomaz16/12/2025 05h10, atualizada em 05/01/2026 18h18
Novo método com agentes de IA aumenta a confiabilidade dos LLMs
Novo método com agentes de IA aumenta a confiabilidade dos LLMs (Imagem: Who is Danny / Shutterstock)
Compartilhe esta matéria
Ícone Whatsapp Ícone Whatsapp Ícone X (Tweeter) Ícone Facebook Ícone Linkedin Ícone Telegram Ícone Email

Siga o Olhar Digital no Google Discover

Pesquisadores chineses apresentaram um novo método para tornar respostas de modelos de linguagem mais confiáveis ao estimular debates estruturados entre agentes de IA. A proposta busca enfrentar um dos principais desafios desses sistemas: a tendência de produzir respostas que parecem corretas, mas contêm erros factuais, contradições internas ou falhas lógicas — um problema que limita o uso da inteligência artificial em contextos educacionais e profissionais. As informações são do TechXplore.

Ofertas

Placa de Vídeo Gainward - GeForce RTX 3070 Phoenix, 8GB GDDR6
Vendido por Amazon
Placa de Vídeo Gainward - GeForce RTX 3070 Phoenix, 8GB GDDR6
Por R$ 3.766,47
Smart Tv Aoc Dled 32 Wi-fi Roku Tv Quad Core 32s5155/78g
Vendido por Amazon
Smart Tv Aoc Dled 32 Wi-fi Roku Tv Quad Core 32s5155/78g
De: R$ 838,00
Por: R$ 795,00
Celular Samsung Galaxy S25 FE 5G, 128GB, 8GB, Câmera Tripla - Jet Black
Vendido por Amazon
Celular Samsung Galaxy S25 FE 5G, 128GB, 8GB, Câmera Tripla - Jet Black
Por R$ 2.998,89
32 in1 Case Estojo Para Nintendo Switch 2 Acessórios Capa Protetora Para Com Compartimentos Bolsa Perfeita Para Viagens Estojo Bag de Proteção e Acessórios Para
Vendido por Amazon
32 in1 Case Estojo Para Nintendo Switch 2 Acessórios Capa Protetora Para Com Compartimentos Bolsa Perfeita Para Viagens Estojo Bag de Proteção e Acessórios Para
De: R$ 119,99
Por: R$ 94,99
Baseus: 2 Cabos USB-C/USB-C, 100W, Carregamento Rápido, Transferência de Dados Super Rápida, Compatível com iPhone 15 (2, centímetros)
Vendido por Amazon
Baseus: 2 Cabos USB-C/USB-C, 100W, Carregamento Rápido, Transferência de Dados Super Rápida, Compatível com iPhone 15 (2, centímetros)
Por R$ 119,20
Brother HL-L1232W Impressora Laser Monocromática, Wi-Fi, USB 2.0, 220V, Preta
Vendido por Amazon
Brother HL-L1232W Impressora Laser Monocromática, Wi-Fi, USB 2.0, 220V, Preta
De: R$ 1.299,00
Por: R$ 1.109,00
JBL, Fone de Ouvido Bluetooth, Tune Buds 2, Intra Auricular, Sem Fio, Com Cancelamento de Ruído, Bateria de até 48h, Som JBL Pure Bass - Branco
Vendido por Amazon
JBL, Fone de Ouvido Bluetooth, Tune Buds 2, Intra Auricular, Sem Fio, Com Cancelamento de Ruído, Bateria de até 48h, Som JBL Pure Bass - Branco
De: R$ 599,00
Por: R$ 489,00
Anker 332 Hub USB-C [5 em 1, HDMI 4K, 2 Portas USB-A 5 Gbps], Compatível com MacBook Pro, MacBook Air, Dell XPS, Lenovo ThinkPad, HP e Mais
Vendido por Amazon
Anker 332 Hub USB-C [5 em 1, HDMI 4K, 2 Portas USB-A 5 Gbps], Compatível com MacBook Pro, MacBook Air, Dell XPS, Lenovo ThinkPad, HP e Mais
De: R$ 229,00
Por: R$ 169,00
Caixa de Som Bluetooth, INAVA, Caixa de Som Portatil Com Graves Aprimorados e Som Surround 360°.
Vendido por Amazon
Caixa de Som Bluetooth, INAVA, Caixa de Som Portatil Com Graves Aprimorados e Som Surround 360°.
De: R$ 78,00
Por: R$ 74,10
Caixa de Som Bluetooth, INAVA, Caixa de Som Portatil Com Graves Aprimorados e Som Surround 360°.
Vendido por Amazon
Caixa de Som Bluetooth, INAVA, Caixa de Som Portatil Com Graves Aprimorados e Som Surround 360°.
De: R$ 78,00
Por: R$ 74,10
Caixa de Som Bluetooth, INAVA, Caixa de Som Portatil Com Graves Aprimorados e Som Surround 360°.
Vendido por Amazon
Caixa de Som Bluetooth, INAVA, Caixa de Som Portatil Com Graves Aprimorados e Som Surround 360°.
Por R$ 78,00
Wacom One Display Interativo 13 Polegadas Touch, Tela IPS Full HD, DTH134, Preto, para Educação, Escritório e Criação
Vendido por Amazon
Wacom One Display Interativo 13 Polegadas Touch, Tela IPS Full HD, DTH134, Preto, para Educação, Escritório e Criação
De: R$ 3.559,90
Por: R$ 1.435,96
KOSPET Tank T3 Ultra Smartwatch, 50M à prova de água, GPS, bússola, pressão do ar, altitude, aço inoxidável completo, chamada Bluetooth, ecrã AMOLED sempre activo de 1,43'', voz AI Banda de Metal
Vendido por Amazon
KOSPET Tank T3 Ultra Smartwatch, 50M à prova de água, GPS, bússola, pressão do ar, altitude, aço inoxidável completo, chamada Bluetooth, ecrã AMOLED sempre activo de 1,43'', voz AI Banda de Metal
De: R$ 899,99
Por: R$ 764,99
WAAW by ALOK Caixa de Som INFINITE 700 Bluetooth, Tipo Torre, Até 20h de Autonomia, 3 Alto-Falantes, TWS, 700W RMS
Vendido por Amazon
WAAW by ALOK Caixa de Som INFINITE 700 Bluetooth, Tipo Torre, Até 20h de Autonomia, 3 Alto-Falantes, TWS, 700W RMS
De: R$ 3.799,90
Por: R$ 3.369,83
Apple Watch SE 3 GPS, Caixa em alumínio luz das estrelas de 44 mm com Bracelete desportiva luz das estrelas - M/G
Vendido por Amazon
Apple Watch SE 3 GPS, Caixa em alumínio luz das estrelas de 44 mm com Bracelete desportiva luz das estrelas - M/G
De: R$ 3.699,00
Por: R$ 2.998,99
Apple Watch Series 11 GPS, Caixa em alumínio rosa‑dourado de 42 mm com Bracelete desportiva rosa leve - M/G
Vendido por Amazon
Apple Watch Series 11 GPS, Caixa em alumínio rosa‑dourado de 42 mm com Bracelete desportiva rosa leve - M/G
De: R$ 5.499,00
Por: R$ 4.599,00
eufy SoloCam S220 por anker, Câmera De Segurança Wi-Fi Externa, Solar Sem Fio Externa, 2K, Energia Contínua, Monitoramento inteligente de IA, Trabalha Com Alexa/HomeBase 3, Sem Taxa Mensal
Vendido por Amazon
eufy SoloCam S220 por anker, Câmera De Segurança Wi-Fi Externa, Solar Sem Fio Externa, 2K, Energia Contínua, Monitoramento inteligente de IA, Trabalha Com Alexa/HomeBase 3, Sem Taxa Mensal
De: R$ 549,00
Por: R$ 521,00
Anker Laptop Power Bank, 25.000mAh Carregador Portátil para Notebook, 3-Portas 100W USB-C, Cabos Retráteis Integrados, Aprovado para Viagens Aéreas, Compatível com iPhone 17, Samsung e Mais
Vendido por Amazon
Anker Laptop Power Bank, 25.000mAh Carregador Portátil para Notebook, 3-Portas 100W USB-C, Cabos Retráteis Integrados, Aprovado para Viagens Aéreas, Compatível com iPhone 17, Samsung e Mais
De: R$ 1.199,00
Por: R$ 999,00
Anker Laptop Power Bank, 25.000mAh Carregador Portátil para Notebook, 3-Portas 100W USB-C, Cabos Retráteis Integrados, Aprovado para Viagens Aéreas, Compatível com iPhone 17, Samsung e Mais
Vendido por Amazon
Anker Laptop Power Bank, 25.000mAh Carregador Portátil para Notebook, 3-Portas 100W USB-C, Cabos Retráteis Integrados, Aprovado para Viagens Aéreas, Compatível com iPhone 17, Samsung e Mais
De: R$ 1.199,00
Por: R$ 999,00
Mouse sem fio Logitech Pebble 2 M350s com Clique Silencioso, Design Slim Ambidestro, Conexão Bluetooth e Pilha Inclusa - Rosa
Vendido por Amazon
Mouse sem fio Logitech Pebble 2 M350s com Clique Silencioso, Design Slim Ambidestro, Conexão Bluetooth e Pilha Inclusa - Rosa
De: R$ 123,90
Por: R$ 109,99
soundcore Select 4 Go da Anker, Alto-Falante Bluetooth Portátil, 20H de Bateria, IP67 à Prova d'Água e Poeira, Flutuante, Som Potente, Ideal para Ambientes Internos, Externos e Passeios
Vendido por Amazon
soundcore Select 4 Go da Anker, Alto-Falante Bluetooth Portátil, 20H de Bateria, IP67 à Prova d'Água e Poeira, Flutuante, Som Potente, Ideal para Ambientes Internos, Externos e Passeios
De: R$ 339,00
Por: R$ 199,00
Anker MagGo Power Bank, Bateria Magnética Ultra Fina de 10.000mAh, Certificação Qi2, Portátil, Carregador MagSafe Compatível de 15W Ultra Rápido, Compatível com iPhone 17/16/15, Samsung,Xiaomi e Mais
Vendido por Amazon
Anker MagGo Power Bank, Bateria Magnética Ultra Fina de 10.000mAh, Certificação Qi2, Portátil, Carregador MagSafe Compatível de 15W Ultra Rápido, Compatível com iPhone 17/16/15, Samsung,Xiaomi e Mais
De: R$ 499,00
Por: R$ 469,00
Apple 2025 iPad (Wi-Fi + Cellular, 128 GB) - Azul (A16)
Vendido por Amazon
Apple 2025 iPad (Wi-Fi + Cellular, 128 GB) - Azul (A16)
De: R$ 6.499,00
Por: R$ 5.219,10

Os chamados modelos de linguagem de grande escala (LLMs) já são amplamente usados para gerar textos, buscar informações e até programar aplicações. Apesar dos avanços recentes, eles ainda podem “alucinar” fatos ou apresentar raciocínios inconsistentes. Foi nesse cenário que pesquisadores da South China Agricultural University e da Shanghai University of Finance and Economics desenvolveram um novo framework para aprimorar o raciocínio matemático e a confiabilidade das respostas.

Debates entre agentes de IA para reduzir erros

O estudo, publicado no Journal of King Saud University Computer and Information Sciences, propõe um modelo em que múltiplos agentes de IA debatem entre si antes de chegar a uma resposta final. Em vez de depender de um único modelo, a abordagem cria um ambiente de discussão em que diferentes agentes apresentam soluções, questionam argumentos e apontam possíveis falhas.

Agentes de IA mostram caos e confabulação em teste de autonomia total
Apesar dos avanços recentes, os LLMs ainda podem “alucinar” fatos ou apresentar raciocínios inconsistentes (Imagem: Summit Art Creations / Shutterstock)

Segundo os autores, métodos anteriores já haviam melhorado o desempenho dos LLMs com técnicas de prompting ou refinamento posterior, mas quase sempre operando em uma única instância do modelo. Frameworks mais recentes de debate multiagente avançaram ao permitir que diferentes modelos discutissem respostas, porém ainda utilizavam agentes homogêneos e decisões por maioria simples, o que limitava os ganhos.

A nova proposta, chamada de Adaptive Heterogeneous Multi-Agent Debate (A-HMAD), introduz agentes com papéis distintos. Cada um assume uma especialidade específica, como verificação factual, raciocínio lógico ou planejamento estratégico. Além disso, um mecanismo de coordenação decide dinamicamente quais agentes participam de cada rodada de debate, de acordo com o tipo de problema e com a evolução da discussão.

Resultados iniciais e possíveis aplicações futuras

Para chegar a um consenso mais confiável, o sistema utiliza um otimizador que avalia a contribuição de cada agente, levando em conta a consistência lógica e a confiança nas informações apresentadas. Esse processo permite selecionar a resposta final com maior probabilidade de estar correta.

Chip Nvidia
Processo permite selecionar a resposta final com maior probabilidade de estar correta (Imagem: BLKstudio/Shutterstock)

Nos testes iniciais, os pesquisadores avaliaram o desempenho do A-HMAD em seis tipos de tarefas consideradas desafiadoras, tanto para sistemas de IA quanto para humanos. Entre elas estavam problemas matemáticos, perguntas aritméticas, questões de múltiplos fatos, geração de biografias factuais e até estratégias de xadrez.

De forma geral, o novo framework superou métodos tradicionais baseados em um único modelo e também abordagens anteriores de debate multiagente. Os resultados indicaram ganhos de precisão entre 4% e 6% em relação a debates padrão, além de uma redução superior a 30% em erros factuais na geração de biografias.

Entre os principais diferenciais observados pelos autores estão:

  • uso de agentes com especialidades distintas;
  • maior diversidade de perspectivas durante o debate;
  • rodadas adicionais de discussão ajustadas ao problema;
  • um módulo de consenso capaz de ponderar a confiabilidade dos argumentos.
Agente de IA.
Avanços sugerem que conjuntos adaptativos e diversos de agentes de IA podem impulsionar melhorias relevantes no raciocínio baseado em LLMs (Imagem: Wanan Wanan/Shutterstock)

Segundo os pesquisadores, esses avanços sugerem que conjuntos adaptativos e diversos de agentes de IA podem impulsionar melhorias relevantes no raciocínio baseado em LLMs. No futuro, a abordagem pode ser aplicada em plataformas educacionais, pesquisa científica e outras áreas que exigem respostas precisas e bem fundamentadas.

Leia mais:

Ao concluir o estudo, os autores afirmam que o modelo abre caminho para sistemas de IA mais seguros, interpretáveis e pedagogicamente confiáveis, reforçando o papel dos debates entre agentes como uma estratégia promissora para reduzir erros e inconsistências em respostas automatizadas.

Maurício Thomaz
Colaboração para o Olhar Digital

Jornalista com mais de 13 anos de experiência, tenho faro pela audiência e verdadeira paixão em buscar alternativas mais assertivas para a entrega do conteúdo ao usuário.