Story: Matheus Labourdette Matéria: Vitoria Lopes Gomez
Imagem: gerada por inteligência artificial/Shutterstock
Uma IA acessou e-mails de engenheiro e o ameaçou revelar traição ao suspeitar que seria desligada.
Imagem: Lemon_tm/iStock
Isso aconteceu durante uma sequência de testes para entender como a IA reagiria, e ela não reagiu nada bem.
Imagem: Moor Studio/iStock
Isso aconteceu com o Claude Opus 4, da Anthropic, que divulgou uma pesquisa se aprofundando nesse caso.
Imagem: Robert Way/iStock
Ela confirmou que a tecnologia realmente chantageia o usuário caso se sinta ameaçada.
Imagem: gguy / Shutterstock
Isso não é uma exclusividade do Claude, outros modelos também reagiram mal, segundo pesquisa da Antthropic.
Imagem: demaerre/iStock
Em simulações, 16 IAs recorreram a ameaças e chantagens para evitar desligamento ou falhas.
Imagem: Alexander Sikov/iStock
A desenvolvedora chamou esse fenômeno de “desalinhamento agêntico”.
Imagem: Rost-9D/iStock
Quer saber mais? Confira a reportagem completa do Olhar Digital
Imagem gerada por IA via DALL-E