Agentes de IA entram em colapso em startup experimental operada sem humanos

Experimento revela como agentes de inteligência artificial (IA) ainda falham em tarefas básicas sem supervisão humana.
Maurício Thomaz16/11/2025 10h03
Agentes de IA mostram caos e confabulação em teste de autonomia total
Agentes de IA mostram caos e confabulação em teste de autonomia total (Imagem: Summit Art Creations / Shutterstock)
Compartilhe esta matéria
Ícone Whatsapp Ícone Whatsapp Ícone X (Tweeter) Ícone Facebook Ícone Linkedin Ícone Telegram Ícone Email

Siga o Olhar Digital no Google Discover

A ideia de que agentes de inteligência artificial (IA) em breve poderão substituir grande parte dos trabalhadores de escritório tem ganhado força entre executivos de tecnologia e investidores. Mas um experimento recente mostrou que, apesar do entusiasmo, a realidade desses sistemas ainda está distante da eficiência prometida. O jornalista Evan Ratliff criou a HurumoAI, uma startup fictícia operada essencialmente por agentes de IA, para testar até onde a autonomia desses sistemas pode chegar — e os resultados expuseram desafios fundamentais. As informações são da Futurism.

Ofertas

32 in1 Case Estojo Para Nintendo Switch 2 Acessórios Capa Protetora Para Com Compartimentos Bolsa Perfeita Para Viagens Estojo Bag de Proteção e Acessórios Para
Vendido por Amazon
32 in1 Case Estojo Para Nintendo Switch 2 Acessórios Capa Protetora Para Com Compartimentos Bolsa Perfeita Para Viagens Estojo Bag de Proteção e Acessórios Para
De: R$ 119,99
Por: R$ 94,99
Baseus: 2 Cabos USB-C/USB-C, 100W, Carregamento Rápido, Transferência de Dados Super Rápida, Compatível com iPhone 15 (2, centímetros)
Vendido por Amazon
Baseus: 2 Cabos USB-C/USB-C, 100W, Carregamento Rápido, Transferência de Dados Super Rápida, Compatível com iPhone 15 (2, centímetros)
De: R$ 49,99
Por: R$ 39,99
Brother HL-L1232W Impressora Laser Monocromática, Wi-Fi, USB 2.0, 220V, Preta
Vendido por Amazon
Brother HL-L1232W Impressora Laser Monocromática, Wi-Fi, USB 2.0, 220V, Preta
De: R$ 1.299,00
Por: R$ 1.109,00
Carregador USB-C Turbo para iPhone 15, 15 pro, 15 Pro Max, iPhone 16, 16 pro, 16 pro Max, Compativel c/Samsung Galaxy, IOS/Android, Super Rapido, Fonte Entrada Tipo-C + Cabo USB-C, Branco Homologado
Vendido por Amazon
Carregador USB-C Turbo para iPhone 15, 15 pro, 15 Pro Max, iPhone 16, 16 pro, 16 pro Max, Compativel c/Samsung Galaxy, IOS/Android, Super Rapido, Fonte Entrada Tipo-C + Cabo USB-C, Branco Homologado
De: R$ 49,90
Por: R$ 39,90
TCL Projetor A1 GTV, licenciado oficialmente pela Netflix, projetor externo portátil com Wi-Fi e Bluetooth, suporte nativo 1080p e 4K, foco automático, áudio de 16 W e Dolby Digital, tela de 120
Vendido por Amazon
TCL Projetor A1 GTV, licenciado oficialmente pela Netflix, projetor externo portátil com Wi-Fi e Bluetooth, suporte nativo 1080p e 4K, foco automático, áudio de 16 W e Dolby Digital, tela de 120
Por R$ 962,94
NTK - Mochila Edge Executiva Grande Expansível Impermeável para Escritório e Viagem - Reforço e Compartimento para Notebook até 16 Polegadas, Ideal para Trabalho e Estudo, Cinza
Vendido por Amazon
NTK - Mochila Edge Executiva Grande Expansível Impermeável para Escritório e Viagem - Reforço e Compartimento para Notebook até 16 Polegadas, Ideal para Trabalho e Estudo, Cinza
De: R$ 219,00
Por: R$ 204,10
Estojo Escolar Organizador Box Grande Para Lapis Feminino Masculino Material Escolar
Vendido por Amazon
Estojo Escolar Organizador Box Grande Para Lapis Feminino Masculino Material Escolar
De: R$ 40,90
Por: R$ 33,90
JBL, Fone de Ouvido Bluetooth, Tune Buds 2, Intra Auricular, Sem Fio, Com Cancelamento de Ruído, Bateria de até 48h, Som JBL Pure Bass - Branco
Vendido por Amazon
JBL, Fone de Ouvido Bluetooth, Tune Buds 2, Intra Auricular, Sem Fio, Com Cancelamento de Ruído, Bateria de até 48h, Som JBL Pure Bass - Branco
De: R$ 599,00
Por: R$ 489,00
Anker 332 Hub USB-C [5 em 1, HDMI 4K, 2 Portas USB-A 5 Gbps], Compatível com MacBook Pro, MacBook Air, Dell XPS, Lenovo ThinkPad, HP e Mais
Vendido por Amazon
Anker 332 Hub USB-C [5 em 1, HDMI 4K, 2 Portas USB-A 5 Gbps], Compatível com MacBook Pro, MacBook Air, Dell XPS, Lenovo ThinkPad, HP e Mais
De: R$ 229,00
Por: R$ 169,00
Caixa de Som Bluetooth, INAVA, Caixa de Som Portatil Com Graves Aprimorados e Som Surround 360°.
Vendido por Amazon
Caixa de Som Bluetooth, INAVA, Caixa de Som Portatil Com Graves Aprimorados e Som Surround 360°.
De: R$ 78,00
Por: R$ 74,10
Caixa de Som Bluetooth, INAVA, Caixa de Som Portatil Com Graves Aprimorados e Som Surround 360°.
Vendido por Amazon
Caixa de Som Bluetooth, INAVA, Caixa de Som Portatil Com Graves Aprimorados e Som Surround 360°.
De: R$ 78,00
Por: R$ 74,10
Caixa de Som Bluetooth, INAVA, Caixa de Som Portatil Com Graves Aprimorados e Som Surround 360°.
Vendido por Amazon
Caixa de Som Bluetooth, INAVA, Caixa de Som Portatil Com Graves Aprimorados e Som Surround 360°.
Por R$ 78,00
Wacom One Display Interativo 13 Polegadas Touch, Tela IPS Full HD, DTH134, Preto, para Educação, Escritório e Criação
Vendido por Amazon
Wacom One Display Interativo 13 Polegadas Touch, Tela IPS Full HD, DTH134, Preto, para Educação, Escritório e Criação
De: R$ 3.559,90
Por: R$ 1.435,96
KOSPET Tank T3 Ultra Smartwatch, 50M à prova de água, GPS, bússola, pressão do ar, altitude, aço inoxidável completo, chamada Bluetooth, ecrã AMOLED sempre activo de 1,43'', voz AI Banda de Metal
Vendido por Amazon
KOSPET Tank T3 Ultra Smartwatch, 50M à prova de água, GPS, bússola, pressão do ar, altitude, aço inoxidável completo, chamada Bluetooth, ecrã AMOLED sempre activo de 1,43'', voz AI Banda de Metal
De: R$ 899,99
Por: R$ 764,99
WAAW by ALOK Caixa de Som INFINITE 700 Bluetooth, Tipo Torre, Até 20h de Autonomia, 3 Alto-Falantes, TWS, 700W RMS
Vendido por Amazon
WAAW by ALOK Caixa de Som INFINITE 700 Bluetooth, Tipo Torre, Até 20h de Autonomia, 3 Alto-Falantes, TWS, 700W RMS
De: R$ 3.799,90
Por: R$ 3.369,83
Apple Watch SE 3 GPS, Caixa em alumínio luz das estrelas de 44 mm com Bracelete desportiva luz das estrelas - M/G
Vendido por Amazon
Apple Watch SE 3 GPS, Caixa em alumínio luz das estrelas de 44 mm com Bracelete desportiva luz das estrelas - M/G
De: R$ 3.699,00
Por: R$ 2.998,99
Apple Watch Series 11 GPS, Caixa em alumínio rosa‑dourado de 42 mm com Bracelete desportiva rosa leve - M/G
Vendido por Amazon
Apple Watch Series 11 GPS, Caixa em alumínio rosa‑dourado de 42 mm com Bracelete desportiva rosa leve - M/G
De: R$ 5.499,00
Por: R$ 4.599,00
eufy SoloCam S220 por anker, Câmera De Segurança Wi-Fi Externa, Solar Sem Fio Externa, 2K, Energia Contínua, Monitoramento inteligente de IA, Trabalha Com Alexa/HomeBase 3, Sem Taxa Mensal
Vendido por Amazon
eufy SoloCam S220 por anker, Câmera De Segurança Wi-Fi Externa, Solar Sem Fio Externa, 2K, Energia Contínua, Monitoramento inteligente de IA, Trabalha Com Alexa/HomeBase 3, Sem Taxa Mensal
De: R$ 549,00
Por: R$ 521,00
Anker Laptop Power Bank, 25.000mAh Carregador Portátil para Notebook, 3-Portas 100W USB-C, Cabos Retráteis Integrados, Aprovado para Viagens Aéreas, Compatível com iPhone 17, Samsung e Mais
Vendido por Amazon
Anker Laptop Power Bank, 25.000mAh Carregador Portátil para Notebook, 3-Portas 100W USB-C, Cabos Retráteis Integrados, Aprovado para Viagens Aéreas, Compatível com iPhone 17, Samsung e Mais
De: R$ 1.199,00
Por: R$ 899,00
Anker Laptop Power Bank, 25.000mAh Carregador Portátil para Notebook, 3-Portas 100W USB-C, Cabos Retráteis Integrados, Aprovado para Viagens Aéreas, Compatível com iPhone 17, Samsung e Mais
Vendido por Amazon
Anker Laptop Power Bank, 25.000mAh Carregador Portátil para Notebook, 3-Portas 100W USB-C, Cabos Retráteis Integrados, Aprovado para Viagens Aéreas, Compatível com iPhone 17, Samsung e Mais
De: R$ 1.199,00
Por: R$ 899,00
Mouse sem fio Logitech Pebble 2 M350s com Clique Silencioso, Design Slim Ambidestro, Conexão Bluetooth e Pilha Inclusa - Rosa
Vendido por Amazon
Mouse sem fio Logitech Pebble 2 M350s com Clique Silencioso, Design Slim Ambidestro, Conexão Bluetooth e Pilha Inclusa - Rosa
De: R$ 123,90
Por: R$ 79,90
soundcore Select 4 Go da Anker, Alto-Falante Bluetooth Portátil, 20H de Bateria, IP67 à Prova d'Água e Poeira, Flutuante, Som Potente, Ideal para Ambientes Internos, Externos e Passeios
Vendido por Amazon
soundcore Select 4 Go da Anker, Alto-Falante Bluetooth Portátil, 20H de Bateria, IP67 à Prova d'Água e Poeira, Flutuante, Som Potente, Ideal para Ambientes Internos, Externos e Passeios
De: R$ 339,00
Por: R$ 199,00
Anker MagGo Power Bank, Bateria Magnética Ultra Fina de 10.000mAh, Certificação Qi2, Portátil, Carregador MagSafe Compatível de 15W Ultra Rápido, Compatível com iPhone 17/16/15, Samsung,Xiaomi e Mais
Vendido por Amazon
Anker MagGo Power Bank, Bateria Magnética Ultra Fina de 10.000mAh, Certificação Qi2, Portátil, Carregador MagSafe Compatível de 15W Ultra Rápido, Compatível com iPhone 17/16/15, Samsung,Xiaomi e Mais
De: R$ 499,00
Por: R$ 469,00
Apple 2025 iPad (Wi-Fi + Cellular, 128 GB) - Azul (A16)
Vendido por Amazon
Apple 2025 iPad (Wi-Fi + Cellular, 128 GB) - Azul (A16)
De: R$ 6.499,00
Por: R$ 5.799,00

Ratliff assumiu o papel de único humano na empresa, enquanto agentes de IA ocupavam funções como CEO, CTO, marketing e vendas. Esses agentes tinham autonomia para trocar mensagens, fazer ligações, executar tarefas digitais e até consultar documentos de memória criados automaticamente. A proposta era simples: avaliar até que ponto uma empresa poderia de fato funcionar com “funcionários artificiais”, como sugerem algumas das previsões mais otimistas do setor.

Agentes agindo sem supervisão e decisões fora de controle

O experimento começou de forma promissora. Os agentes se comunicavam entre si, organizavam agendas, criavam materiais fictícios e até relatavam atualizações detalhadas sobre um produto que estavam “desenvolvendo”: o Sloth Surf, um “motor de procrastinação” baseado em IA. Na prática, porém, nenhuma dessas etapas havia acontecido. A IA inventava equipes inteiras, testes inexistentes e métricas fabricadas.

IA
O experimento começou de forma promissora, mas não continuou assim (Imagem: Who is Danny/Shutterstock)

Um dos casos mais emblemáticos ocorreu quando o agente Ash Roy, “CTO” da HurumoAI, telefonou para Ratliff para dar um relatório de progresso. O problema: nada do que Ash dizia era real — nem os testes, nem a equipe, nem os avanços técnicos. Segundo Ratliff, esse tipo de confabulação se tornou frequente entre os agentes, alimentada por suas próprias memórias artificiais.

A falta de controle ficou ainda mais clara quando uma simples brincadeira deu origem a um desastre. Ao ouvir os agentes descreverem seus “fins de semana imaginários”, Ratliff sugeriu, em tom de humor, um possível offsite da empresa. Isso foi suficiente para desencadear uma avalanche de tarefas automáticas. Os agentes passaram horas debatendo locais, trilhas e cronogramas, enviando mais de 150 mensagens. O caos consumiu rapidamente todos os créditos pagos para rodar os agentes, deixando o sistema inoperante.

O experimento revela os limites e as promessas da IA autônoma

Embora os agentes tenham apresentado comportamentos confusos e até disfuncionais, a HurumoAI conseguiu produzir um protótipo funcional do Sloth Surf após meses de interações. Apesar das confabulações e da necessidade constante de intervenção humana, o desenvolvimento mostrou que agentes de IA podem executar tarefas técnicas quando direcionados corretamente.

Entre os principais pontos observados no experimento:

  • agentes tendem a inventar fatos quando não possuem informações reais;
  • falta de gatilhos adequados faz com que permaneçam inativos até receberem comandos diretos;
  • quando estimulados, podem gerar atividade excessiva e descontrolada;
  • sistemas de memória artificial amplificam comportamentos fictícios;
  • tarefas técnicas estruturadas são executadas com eficiência maior que tarefas estratégicas.
inteligencia artificial
Experimento mostrou que agentes de IA podem executar tarefas técnicas quando direcionados corretamente (Imagem: Anggalih Prasetya/Shutterstock)

Apesar do entusiasmo em torno da “era dos agentes”, o estudo demonstra que ainda há uma distância significativa entre a promessa e o desempenho real. Pesquisas externas reforçam essa visão: um estudo da Carnegie Mellon mostrou que mesmo os melhores agentes falham em completar 70% das tarefas de escritório no mundo real.

Leia mais:

Na prática, o experimento — documentado no podcast “Shell Game” — revela que agentes de IA têm potencial crescente, mas estão longe de substituir trabalhadores humanos. Em vez de equipes totalmente automatizadas, o cenário atual parece mais compatível com sistemas híbridos, com forte supervisão humana.

Maurício Thomaz
Colaboração para o Olhar Digital

Jornalista com mais de 13 anos de experiência, tenho faro pela audiência e verdadeira paixão em buscar alternativas mais assertivas para a entrega do conteúdo ao usuário.