Le proteine, fondamentali per la vita, sono apparse sulla Terra circa 3,7 miliardi di anni fa, evolvendosi nel tempo fino alle forme complesse che conosciamo oggi. Ma cosa accadrebbe se fosse possibile accelerare artificialmente questo processo, simulando milioni di anni di cambiamenti in pochi istanti?
Un team di ricercatori di EvolutionaryScale sostiene di aver ottenuto proprio questo risultato grazie alla potenza dell’intelligenza artificiale (IA), generando il codice per una nuova proteina fluorescente in un modo che, in natura, avrebbe richiesto mezzo miliardo di anni di evoluzione.
Un nuovo approccio alla creazione delle proteine
Le proteine sono composte da lunghe catene di amminoacidi, la cui sequenza determina forma e funzione. Comprendere questa “lingua biologica” e manipolarla artificialmente potrebbe aprire nuove frontiere nella scienza.
Secondo lo studio pubblicato su Science, la base di questo approccio è ESM3, un modello linguistico generativo multimodale sviluppato per interpretare e creare sequenze proteiche. In pratica, funziona in modo simile ai modelli linguistici IA, come ChatGPT, ma invece di generare testi, crea il codice genetico per nuove proteine.
L’addestramento di ESM3 ha incluso 771 miliardi di dati unici, derivati da sequenze e strutture di proteine naturali, oltre a informazioni su proteine sintetiche. L’insieme complessivo dei dati conteneva:
- 3,15 miliardi di sequenze proteiche,
- 236 milioni di strutture proteiche,
- 539 milioni di proteine annotate funzionalmente.
Una volta costruito il modello, i ricercatori hanno voluto testarne le capacità chiedendogli di generare una proteina fluorescente inedita.
Nasce una nuova proteina fluorescente
Fornendo al sistema un modello incompleto, i ricercatori hanno chiesto all’IA di completare la sequenza per una proteina fluorescente. Il risultato è stata una variante mai vista prima della proteina fluorescente verde (GFP), un biomarcatore ampiamente utilizzato nella ricerca biologica.
Questa nuova proteina, chiamata esmGFP, presenta caratteristiche molto diverse rispetto alle versioni naturali. Condivide solo il 53% della sequenza con la proteina naturale più simile, eqFP578, che si trova nell’anemone a punta di bolla. Questo livello di divergenza, secondo gli autori dello studio, corrisponde a circa 500 milioni di anni di evoluzione naturale.
Scetticismo nella comunità scientifica
Non tutti, però, sono convinti che l’IA possa realmente superare i processi naturali. La professoressa Tiffany Taylor dell’Università di Bath, esperta in evoluzione microbica, ha espresso qualche dubbio in un articolo su Live Science. Secondo la studiosa, la biologia evolutiva è un processo complesso e affinato nel tempo, e non è detto che l’IA possa replicarlo perfettamente.
Tuttavia, il potenziale è innegabile. Se il modello ESM3 fosse in grado di generare nuove proteine funzionali, le applicazioni sarebbero straordinarie.
Quali potrebbero essere le applicazioni future?
Sul sito ufficiale di EvolutionaryScale, i ricercatori immaginano un futuro in cui modelli IA come ESM3 possano creare:
- Proteine capaci di catturare il carbonio, con potenziali applicazioni nella lotta ai cambiamenti climatici.
- Enzimi in grado di degradare la plastica, offrendo una soluzione innovativa al problema dell’inquinamento ambientale.
- Nuovi farmaci, progettati con precisione per trattare malattie ancora difficili da curare.
Per il momento, però, la proteina esmGFP esiste solo nel mondo digitale. Il prossimo passo sarà sintetizzarla e testarla in laboratorio per verificare se le sue proprietà teoriche corrispondano alla realtà.
Se questi esperimenti avranno successo, l’uso dell’IA nella progettazione proteica potrebbe rivoluzionare la biotecnologia, la medicina e la bioingegneria, aprendo scenari fino a pochi anni fa impensabili.