IA faz chantagem contra usuário quando ameaçada 

Story: Matheus Labourdette Matéria: Vitoria Lopes Gomez

Por Olhar Digital

Imagem: gerada por inteligência artificial/Shutterstock

Uma IA acessou e-mails de engenheiro e o ameaçou revelar traição ao suspeitar que seria desligada.

Imagem: Lemon_tm/iStock

Isso aconteceu durante uma sequência de testes para entender como a IA reagiria, e ela não reagiu nada bem.

Imagem: Moor Studio/iStock

Isso aconteceu com o Claude Opus 4, da Anthropic, que divulgou uma pesquisa se aprofundando nesse caso.

Imagem: Robert Way/iStock

Ela confirmou que a tecnologia realmente chantageia o usuário caso se sinta ameaçada.

Imagem: gguy / Shutterstock

Isso não é uma exclusividade do Claude, outros modelos também reagiram mal, segundo pesquisa da Antthropic.

Imagem: demaerre/iStock

Em simulações, 16 IAs recorreram a ameaças e chantagens para evitar desligamento ou falhas.

Imagem: Alexander Sikov/iStock

A desenvolvedora chamou esse fenômeno de “desalinhamento agêntico”.

Imagem: Rost-9D/iStock

Quer saber mais?  Confira a reportagem completa do Olhar Digital

Imagem gerada por IA via DALL-E