L’intelligenza artificiale generativa trasforma la ricerca biologica
L’intelligenza artificiale generativa sta aprendo nuove frontiere nella biologia molecolare, contribuendo a identificare proteine precedentemente invisibili agli strumenti tradizionali. Due innovativi modelli di AI, chiamati InstaNovo e InstaNovo+, stanno rivoluzionando il modo in cui gli scienziati decifrano le strutture proteiche più complesse e sfuggenti.
Il lavoro dei ricercatori, pubblicato oggi su Nature Machine Intelligence, ha dimostrato come questi nuovi strumenti possano aumentare la nostra capacità di comprendere le funzioni cellulari, offrendo potenzialmente nuove vie terapeutiche contro il cancro, chiarendo malattie rare e svelando abilità animali ancora inspiegabili.
Proteine nascoste e biologia non mappata
Se il DNA rappresenta il progetto genetico, le proteine sono ciò che il corpo costruisce realmente. Tuttavia, le versioni effettive prodotte dalle cellule spesso si discostano dallo schema previsto. Molte di queste proteine modificate o “nascoste” sfuggono ai metodi di analisi convenzionali. Ed è proprio qui che l’intelligenza artificiale mostra il suo potenziale, aiutando a interpretare dati complessi della spettrometria di massa con una precisione mai raggiunta prima.
InstaNovo si ispira all’architettura dei modelli trasformatori come GPT-4, e riesce a tradurre i segnali della spettrometria in sequenze di amminoacidi. Queste catene diventano la chiave per identificare nuove proteine e comprenderne l’origine. Il modello gemello, InstaNovo+, opera in maniera simile ai generatori di immagini, rimuovendo progressivamente il rumore digitale e ricostruendo in alta definizione le forme molecolari.
Più proteine scoperte, più domande aperte
Durante le sperimentazioni, InstaNovo ha triplicato il numero di peptidi rilevati rispetto alle tecniche classiche, passando da circa 10.000 a oltre 35.000. Il modello InstaNovo+ è andato ancora oltre, identificandone fino a sei volte di più. Nei test combinati, la capacità di decodifica proteica è aumentata in modo esponenziale, rendendo possibili nuove ipotesi biologiche in contesti precedentemente inesplorati.
Questi strumenti potrebbero, ad esempio, rivelare le proteine renali che permettono ad alcune razze marine di passare da ambienti d’acqua dolce a salmastra. Oppure spiegare i meccanismi con cui il cancro al pancreas induce deperimento muscolare e affaticamento rapido, suggerendo che siano coinvolti peptidi sconosciuti o alterazioni in proteine normalmente funzionali.
Verso un nuovo orizzonte, con cautela
Nonostante l’entusiasmo, i modelli non sono privi di limiti. Il margine di errore, stimato attorno al 5% di falsi positivi, richiede verifica sperimentale e una valutazione costante. Gli studiosi sottolineano che questi strumenti non sostituiscono i metodi tradizionali, ma li completano, rappresentando un potente alleato nella ricerca biomedica avanzata.
Grazie a database sempre più vasti come Proteome Tools, la capacità delle AI di apprendere nuove sequenze e ampliare il panorama proteico potrebbe cambiare per sempre la nostra comprensione di ciò che accade all’interno delle cellule.