Un traguardo storico per l’intelligenza artificiale
Nel Marzo 2025, uno studio pubblicato su arXiv dai ricercatori Cameron Jones e Benjamin Bergen dell’Università della California, San Diego, ha registrato un evento senza precedenti nella storia dell’intelligenza artificiale: GPT-4.5 di OpenAI ha superato con successo il Test di Turing, convincendo più frequentemente dei partecipanti umani la platea di giudici umani della propria “umanità”.
Il Test di Turing, ideato nel 1950 da Alan Turing, rappresenta da decenni lo spartiacque per definire se una macchina possa essere considerata “pensante”. Si tratta di una sfida conversazionale in cui un giudice umano interagisce simultaneamente con un essere umano e un’intelligenza artificiale, cercando di identificare chi dei due è umano. Fino ad oggi, nessun sistema artificiale era riuscito a passare in maniera convincente questo classico esperimento di intelligenza computazionale.
GPT-4.5 convince i giudici il 73% delle volte
Nel test condotto dai due studiosi americani, sono stati coinvolti 284 partecipanti con background diversi, tra cui studenti universitari e lavoratori crowd-sourced attraverso la piattaforma Prolific. Ai soggetti è stato chiesto di giudicare l’umanità dei loro interlocutori testuali, senza sapere se stessero parlando con un essere umano o con un’intelligenza artificiale.
Tra i modelli testati vi erano GPT-4.5, GPT-4o, LLaMa-3.1-405B, e persino il celebre chatbot storico ELIZA. I risultati hanno mostrato come GPT-4.5 sia stato identificato come umano nel 73% delle interazioni, superando persino la performance degli umani reali. Al contrario, GPT-4o è stato considerato umano soltanto nel 21% dei casi.
Il ruolo cruciale dei prompt e della personalità simulata
Il successo di GPT-4.5, secondo i ricercatori, è legato anche all’uso di prompt meticolosamente progettati. Il modello è stato istruito per adottare una personalità specifica: introversa, giovane, aggiornata sul gergo e la cultura digitale di Internet. Questa scelta ha reso l’IA particolarmente credibile e relazionabile, tanto da superare in empatia e coerenza narrativa gli interlocutori umani.
Questo risultato evidenzia la notevole flessibilità comportamentale di GPT-4.5, la cui capacità di adattamento a contesti differenti viene interpretata dai ricercatori come indice emergente di intelligenza artificiale avanzata, e non come un semplice trucco linguistico.
Nuove domande etiche, sociali e culturali
L’esperimento ha sollevato interrogativi profondi sull’etica e sulla sicurezza digitale. L’abilità dei modelli linguistici di impersonare in modo convincente esseri umani potrebbe essere sfruttata per scopi pericolosi, come la disinformazione, l’ingegneria sociale, o la manipolazione politica.
Al contempo, la potenza dei nuovi agenti conversazionali apre a opportunità in ambito educativo, terapeutico, e nei servizi digitali personalizzati. Tuttavia, secondo Jones e Bergen, un uso responsabile richiederà regolamentazioni severe e trasparenza nelle applicazioni commerciali.
Infine, i ricercatori riflettono sulle implicazioni culturali: la crescente presenza di interlocutori artificiali realistici potrebbe portare a una rivalutazione del valore delle interazioni autenticamente umane, generando una nuova sensibilità sociale attorno alla comunicazione.
Fonte dello studio: Large Language Models Pass the Turing Test – arXiv, 2025
Tra i primi media internazionali a commentare il risultato figurano testate come MIT Technology Review, Scientific American, New Scientist e Nature Machine Intelligence.