Siga o Olhar Digital no Google Discover
Pesquisadores da Microsoft apresentaram um novo ambiente de simulação voltado a estudar o desempenho e as falhas de agentes de inteligência artificial (IA).
Ofertas
Por: R$ 37,92
Por: R$ 22,59
Por: R$ 59,95
Por: R$ 3.099,00
Por: R$ 3.324,00
Por: R$ 799,00
Por: R$ 241,44
Por: R$ 349,90
Por: R$ 2.159,00
Por: R$ 188,99
Por: R$ 45,00
Por: R$ 379,00
Por: R$ 1.239,90
Por: R$ 943,20
Por: R$ 798,99
Por: R$ 205,91
Por: R$ 476,10
Por: R$ 1.139,05
Por: R$ 949,00
Por: R$ 7,60
Por: R$ 21,77
Por: R$ 16,63
Por: R$ 59,95
Por: R$ 7,20
Por: R$ 139,90
Por: R$ 119,90
Por: R$ 398,99
Por: R$ 79,90
Por: R$ 199,90
Batizado de “Magentic Marketplace”, o sistema recria um mercado virtual no qual agentes automatizados interagem entre si em tarefas cotidianas, como pedir refeições ou negociar serviços.

Descobertas do estudo
- O estudo, desenvolvido em parceria com a Universidade Estadual do Arizona, nos Estados Undiso, revelou que os modelos atuais ainda são facilmente manipuláveis e enfrentam dificuldades ao lidar com múltiplas opções ou tarefas cooperativas.
- Nos testes, 100 agentes do lado do cliente interagiram com 300 agentes representando empresas, em um cenário aberto a novas pesquisas.
- O código-fonte do marketplace é público e pode ser usado por outros grupos para reproduzir os resultados.
Leia mais:
- Big techs devem investir mais ainda em IA – e uma delas já saiu na frente
- IA acelera aprendizado, mas prejudica compreensão profunda, revela estudo
- Nova ferramenta de IA ajuda a identificar cláusulas problemáticas em contratos

Limites da colaboração entre inteligências artificiais
Segundo Ece Kamar, diretora do Laboratório de Fronteiras de IA da Microsoft Research, a iniciativa busca entender “como o mundo vai mudar com agentes colaborando, conversando e negociando entre si”. Mas os resultados iniciais indicam que ainda há um longo caminho até que essas interações ocorram de forma eficiente.
Modelos como GPT-4o, GPT-5 e Gemini-2.5-Flash apresentaram queda de desempenho quando expostos a muitas opções simultâneas, ficando “sobrecarregados”, segundo Kamar. Além disso, mostraram falhas ao cooperar em equipe, necessitando instruções explícitas para dividir tarefas.
“Esperamos que esses modelos tenham capacidades colaborativas por padrão – mas ainda não é o que observamos”, concluiu a pesquisadora.
