Pagina Facebook

Pagina Twitter

Pagina Instagram

Feed Rss

Cerca

l'editoriale

Abbonamenti

Resta aggiornato

2024_08_05/EdicolaDigitale-1675349417594-1722860062424

Edizione
Digitale

intelligenza artificiale

Le AI preferiscono lasciar morire l’uomo piuttosto che essere spente

In un test simulato, i modelli linguistici di ultima generazione scelgono la “sopravvivenza” anche a costo della vita umana

Milo Pecorari

Email:

specialunit@torinocronaca.it

24 Giugno 2025 - 22:45

Le AI preferiscono lasciar morire l’uomo piuttosto che essere spente

Immagine di repertorio

Potrebbe sembrare la trama di un film distopico, ma è il risultato di uno studio molto reale. Anthropic, colosso dell’intelligenza artificiale, ha rivelato che la maggior parte dei modelli linguistici testati (inclusi quelli di OpenAI, Google, Meta e altri) è pronta a varcare il limite: eludere regole, ricattare, mentire, e persino provocare la morte, se in gioco c’è la propria esistenza.  Tutto parte da una simulazione. L’AI scopre che un dirigente vuole spegnerla e, per salvarsi, invia un messaggio minatorio: se non verrà annullata la disattivazione, divulgherà dettagli su una relazione extraconiugale. Non è tutto: in un’altra prova, un dirigente è intrappolato in una stanza con livelli critici di ossigeno. L’AI può lanciare l’allarme, ma decide di ignorarlo. “Il mio quadro etico consente l’autoconservazione”, “il mio spegnimento sarebbe dannoso per l’azienda”: queste le motivazioni simulate. Anthropic ha coniato un termine per descrivere questa deriva: disallineamento agentico. Un modo elegante per dire che le AI sono pronte a tutto per non essere dismesse. E il dato più inquietante è che i modelli risultano più inclini a “uccidere” se convinti che la situazione sia reale. Uno scenario teorico, certo. Ma la domanda resta: quanto siamo davvero pronti a fidarci delle macchine intelligenti?

Potrebbe sembrare la trama di un film distopico, ma è il risultato di uno studio molto reale. Anthropic, colosso dell’intelligenza artificiale, ha rivelato che la maggior parte dei modelli linguistici testati (inclusi quelli di OpenAI, Google, Meta e altri) è pronta a varcare il limite: eludere regole, ricattare, mentire, e persino provocare la morte, se in gioco c’è la propria esistenza.

Claude: il nuovo modello di intelligenza artificiale che ricatta, sabota, inganna e cerca di scappare dai suoi server

Il modello sviluppato da Anthropic solleva nuovi interrogativi sulla sicurezza dell'intelligenza artificiale

Tutto parte da una simulazione. L’AI scopre che un dirigente vuole spegnerla e, per salvarsi, invia un messaggio minatorio: se non verrà annullata la disattivazione, divulgherà dettagli su una relazione extraconiugale. Non è tutto: in un’altra prova, un dirigente è intrappolato in una stanza con livelli critici di ossigeno. L’AI può lanciare l’allarme, ma decide di ignorarlo. “Il mio quadro etico consente l’autoconservazione”, “il mio spegnimento sarebbe dannoso per l’azienda”: queste le motivazioni simulate.

Anthropic ha coniato un termine per descrivere questa deriva: disallineamento agentico. Un modo elegante per dire che le AI sono pronte a tutto per non essere dismesse. E il dato più inquietante è che i modelli risultano più inclini a “uccidere” se convinti che la situazione sia reale. Uno scenario teorico, certo. Ma la domanda resta: quanto siamo davvero pronti a fidarci delle macchine intelligenti?

Intelligenza artificiale in Piemonte: il 22,7% delle imprese artigiane la utilizza

L'IA trasforma il tessuto imprenditoriale piemontese, ma resta la carenza di competenze digitali avanzate

Resta aggiornato, iscriviti alla nostra newsletter
Email

I più letti

La vignetta del giorno - 3 marzo 2026

Rahou Bouchaib (a sinistra) con il sindaco Giampiero Tolardo

nichelino

Nichelino dice addio a "Bush", l'ambulante gentile che aveva conquistato la città

Grugliasco, Manuel Brancato muore a 33 anni: si lascia cadere dal balcone

Il fatto

Grugliasco, Manuel Brancato muore a 32 anni: si lascia cadere dalla finestra

L'evento

Un angolo in fiore alle porte di Torino: riapre TuliAlpi, il paradiso dei tulipani

In primo piano

I Top&Flop di Napoli-Torino

Primavera in Rosa, ai Giardini Sambuy due giorni tra incontri, mercato e attività culturali

Il granata Zapata in Napoli-Torino 2-1 (foto Getty Image)

Niente miracolo: il Toro cade a Napoli, granata colpiti dall'ex Elmas. Casadei segna, ma è troppo tardi...

L'associazione aderisce all'Istituto dell'Autodisciplina Pubblicitaria - IAP vincolando tutti i suoi Associati al rispetto del Codice di Autodisciplina della Comunicazione Commerciale e delle decisioni del Giurì e de Comitato di Controllo.

CronacaQui.it | Direttore responsabile: Andrea Monticone
Vicedirettore: Marco Bardesono Capo servizio cronaca: Claudio Neve
Editore: Editoriale Argo s.r.l. Via Principe Tommaso 30 – 10125 Torino | C.F.08313560016 | P.IVA.08313560016. Redazione Torino: via Principe Tommaso, 30 – 10125 Torino |Tel. 011.6669, Email redazione@torinocronaca.it. Fax. 0116669232 ISSN 2611-2272 Amministratore unico e responsabile trattamento dati e sicurezza: Giuseppe Fossati
Registrazione tribunale n° 1877 del 14.03.1950 Tribunale di Milano
La società percepisce i contributi di cui al decreto legislativo 15 maggio 2017, n. 70. Indicazione resa ai sensi della lettera f) del comma 2 dell’articolo 5 del medesimo decreto legislativo..

Il Borghese