IA faz chantagem contra usuário quando ameaçada

Story: Matheus Labourdette Matéria: Vitoria Lopes Gomez Imagem: gerada por inteligência artificial/Shutterstock Imagem: gerada por inteligência artificial/Shutterstock

Uma IA acessou e-mails de engenheiro e o ameaçou revelar traição ao suspeitar que seria desligada . Imagem: Lemon_tm/iStock Imagem: Lemon_tm/iStock

[{"selector":"#anim-ebd35623-5771-474f-8be9-02b7c247e3db [data-leaf-element=\"true\"]","keyframes":{"transform":["translate3d(0%, 0, 0) translate(-25%, 0%) scale(1.5)","translate3d(0%, 0, 0) translate(0%, 0%) scale(1)"]},"delay":0,"duration":2000,"fill":"forwards"}] Isso aconteceu durante uma sequência de testes para entender como a IA reagiria , e ela não reagiu nada bem. Imagem: Moor Studio/iStock Imagem: Moor Studio/iStock

[{"selector":"#anim-0ecbcd61-391a-40a3-9e2a-4f66213793d5 [data-leaf-element=\"true\"]","keyframes":{"transform":["translate3d(-19.16507024265644%, 0, 0) translate(-17.24137931034483%, -8.46104748663964%) scale(1.3448275862068966)","translate3d(0%, 0, 0) translate(0%, 0%) scale(1)"]},"delay":0,"duration":2000,"fill":"forwards"}] Isso aconteceu com o Claude Opus 4 , da Anthropic, que divulgou uma pesquisa se aprofundando nesse caso. Imagem: Robert Way/iStock Imagem: Robert Way/iStock

[{"selector":"#anim-8603ce4a-4ded-4ebd-a4ca-35914971080f [data-leaf-element=\"true\"]","keyframes":{"transform":["translate(2.25872318895575%, -17.389345397678234%) scale(1.3496503496503496)","translate(0%, 0%) scale(1)"]},"delay":0,"duration":2000,"easing":"cubic-bezier(.3,0,.55,1)","fill":"forwards"}] Ela confirmou que a tecnologia realmente chantageia o usuário caso se sinta ameaçada. Imagem: gguy / Shutterstock Imagem: gguy / Shutterstock

[{"selector":"#anim-ad131200-da31-44c9-8a5e-a67a5856542e [data-leaf-element=\"true\"]","keyframes":{"transform":["translate(0%, 0%) scale(1.5)","translate(0%, 0%) scale(1)"]},"delay":0,"duration":2000,"easing":"cubic-bezier(.3,0,.55,1)","fill":"forwards"}] Isso não é uma exclusividade do Claude , outros modelos também reagiram mal, segundo pesquisa da Antthropic. Imagem: demaerre/iStock Imagem: demaerre/iStock

[{"selector":"#anim-69d26523-0b9c-46b1-b7a0-fb80fb9dcd67 [data-leaf-element=\"true\"]","keyframes":{"transform":["translate(0%, 0%) scale(1)","translate(0%, 0%) scale(1)"]},"delay":0,"duration":2000,"easing":"cubic-bezier(.3,0,.55,1)","fill":"forwards"}] Em simulações, 16 IAs recorreram a ameaças e chantagens para evitar desligamento ou falhas. Imagem: Alexander Sikov/iStock Imagem: Alexander Sikov/iStock

[{"selector":"#anim-8f83fd27-8fc5-4d67-8dfd-ba2528a12cbe [data-leaf-element=\"true\"]","keyframes":{"transform":["translate(1.766651258585401%, 7.8052634185907435%) scale(0.8113207547169812)","translate(0%, 0%) scale(1)"]},"delay":0,"duration":2000,"easing":"cubic-bezier(.3,0,.55,1)","fill":"forwards"}] A desenvolvedora chamou esse fenômeno de “ desalinhamento agêntico ”. Imagem: Rost-9D/iStock Imagem: Rost-9D/iStock

[{"selector":"#anim-be5d9917-85dc-4d9a-8897-1aeb3c7c7e3b","keyframes":{"transform":["rotate(-360deg) translate3d(-115.18988%, 0px, 0) rotate(360deg)","rotate(-360deg) translate3d(0px, 0px, 0) rotate(360deg)"]},"delay":0,"duration":600,"easing":"cubic-bezier(0.4, 0.4, 0.0, 1)","fill":"both"}] [{"selector":"#anim-198d2469-406c-4641-8ca4-39ab57617436","keyframes":{"opacity":[0,1]},"delay":0,"duration":600,"easing":"cubic-bezier(0.4, 0.4, 0.0, 1)","fill":"both"}] [{"selector":"#anim-063fe9b1-cb66-4eb4-a0f6-b4b2f769b384","keyframes":{"transform":["scale(0.15)","scale(1)"]},"delay":0,"duration":600,"easing":"cubic-bezier(0.4, 0.4, 0.0, 1)","fill":"forwards"}] Quer saber mais? Confira a reportagem completa do Olhar Digital Imagem gerada por IA via DALL-E Imagem gerada por IA via DALL-E Veja mais

IA faz chantagem contra usuário quando ameaçada

Por Olhar Digital