La fisica è una scienza che da secoli affascina e sfida l’intelletto umano. Grandi nomi come Isaac Newton e Albert Einstein hanno lasciato un’impronta indelebile con le loro teorie rivoluzionarie. Oggi, però, siamo di fronte a una svolta epocale: l’intelligenza artificiale (AI) sta entrando nel campo della fisica, aprendo nuove strade per la formulazione di teorie fisiche. I ricercatori del Forschungszentrum Jülich hanno sviluppato un’intelligenza artificiale capace di riconoscere schemi in insiemi di dati complessi e di formulare teorie fisiche, un’impresa storicamente compiuta dai grandi fisici del passato. Questa AI, parte dell’iniziativa “Physics of AI”, semplifica le interazioni complesse nei dati per sviluppare nuove teorie, differenziandosi dagli approcci convenzionali rendendo le teorie spiegabili e radicate nel linguaggio della fisica.
Il processo di creazione di una nuova teoria fisica
La creazione di una nuova teoria fisica è un processo che inizia solitamente con l’osservazione del sistema in esame. I fisici tentano poi di proporre come le diverse componenti del sistema interagiscono tra loro per spiegare il comportamento osservato. Da qui derivano nuove previsioni che vengono messe alla prova. Un esempio noto è la legge della gravitazione di Isaac Newton, che descrive la forza gravitazionale sulla Terra e può essere utilizzata per prevedere con precisione i movimenti di pianeti, lune e comete, nonché le orbite dei satelliti moderni.
Tuttavia, il modo in cui si giunge a tali ipotesi varia sempre. Si può partire da principi generali e dalle equazioni fondamentali della fisica per derivare l’ipotesi, oppure si può optare per un approccio fenomenologico, limitandosi a descrivere le osservazioni il più accuratamente possibile senza spiegarne le cause. La difficoltà sta nel selezionare un buon approccio tra i numerosi possibili, adattarlo se necessario e semplificarlo.
L’approccio innovativo dell’intelligenza artificiale
L’approccio adottato con l’intelligenza artificiale è noto come “fisica per l’apprendimento automatico”. Nel gruppo di lavoro del Forschungszentrum Jülich, si utilizzano metodi della fisica per analizzare e comprendere la complessa funzione di un’intelligenza artificiale.
L’idea rivoluzionaria sviluppata da Claudia Merger del gruppo di ricerca è stata quella di utilizzare prima una rete neurale che impara a mappare con precisione il comportamento complesso osservato su un sistema più semplice. In altre parole, l’AI mira a semplificare tutte le interazioni complesse che osserviamo tra le componenti del sistema. Si utilizza poi il sistema semplificato e si crea una mappatura inversa con l’AI addestrata. Tornando dal sistema semplificato a quello complesso, si sviluppa la nuova teoria. Lungo il percorso di ritorno, le interazioni complesse vengono costruite pezzo per pezzo a partire da quelle semplificate. In definitiva, l’approccio non è quindi così diverso da quello di un fisico, con la differenza che il modo in cui le interazioni vengono assemblate è ora letto dai parametri dell’AI. Questa prospettiva sul mondo – spiegarlo dalle interazioni tra le sue varie parti che seguono determinate leggi – è alla base della fisica, da qui il termine “fisica dell’AI”.
Utilizzo dell’AI in esperimenti concreti
L’AI è stata utilizzata in diverse applicazioni, tra cui l’analisi di un insieme di dati di immagini in bianco e nero con numeri scritti a mano, spesso impiegato nella ricerca quando si lavora con reti neurali. Nel corso della sua tesi di dottorato, Claudia Merger ha indagato come piccole sottostrutture nelle immagini, come i bordi dei numeri, siano composte da interazioni tra pixel. Sono stati identificati gruppi di pixel che tendono ad essere più luminosi insieme e contribuiscono così a formare la forma del bordo del numero.
Il carico computazionale dell’AI
L’uso dell’intelligenza artificiale è un trucco che rende i calcoli possibili in primo luogo. Si raggiunge rapidamente un numero molto elevato di possibili interazioni. Senza utilizzare questo trucco, si potrebbero analizzare solo sistemi molto piccoli. Tuttavia, lo sforzo computazionale coinvolto è ancora elevato, a causa del fatto che ci sono molte possibili interazioni anche in sistemi con molti componenti. Tuttavia, possiamo parametrizzare in modo efficiente queste interazioni in modo da poter ora esaminare sistemi con circa 1.000 componenti interagenti, ovvero aree di immagine con fino a 1.000 pixel. In futuro, dovrebbero essere possibili sistemi ancora più grandi attraverso ulteriori ottimizzazioni.
Differenze rispetto ad altre intelligenze artificiali
Molte intelligenze artificiali mirano ad apprendere una teoria dei dati utilizzati per addestrare l’AI. Tuttavia, le teorie che le AI apprendono di solito non possono essere interpretate. Invece, sono implicitamente nascoste nei parametri dell’AI addestrata. Al contrario, il nostro approccio estrae la teoria appresa e la formula nel linguaggio delle interazioni tra componenti del sistema, che è alla base della fisica. Appartiene quindi al campo dell’AI spiegabile, in particolare alla “fisica dell’AI”, poiché usiamo il linguaggio della fisica per spiegare ciò che l’AI ha appreso. Possiamo utilizzare il linguaggio delle interazioni per costruire un ponte tra il complesso funzionamento interno dell’AI e le teorie che gli esseri umani possono comprendere.