La ricerca farmaceutica è in costante evoluzione e, negli ultimi anni, l’intelligenza artificiale (AI) ha iniziato a giocare un ruolo fondamentale in questo campo. Tuttavia, nonostante i rapidi progressi, il funzionamento interno delle applicazioni di machine learning utilizzate nella ricerca sui farmaci rimane spesso oscuro, caratterizzato da una scatola nera” in cui il processo decisionale non è visibile. Un importante passo avanti è stato compiuto dal Prof. Dr. Jürgen Bajorath e dal suo team di esperti in chemoinformatica presso l’Università di Bonn, che hanno sviluppato una tecnica per svelare i meccanismi operativi di alcuni sistemi AI utilizzati nella ricerca farmaceutica.
La scoperta dei meccanismi operativi dell’AI
La ricerca di molecole farmacologicamente attive
La ricerca di nuove sostanze attive per combattere le malattie è un processo complesso e laborioso. Questi composti spesso si legano a proteine, che di solito sono enzimi o recettori che innescano una specifica catena di azioni fisiologiche. In alcuni casi, alcune molecole sono anche destinate a bloccare reazioni indesiderate nel corpo, come una risposta infiammatoria eccessiva. Data l’abbondanza di composti chimici disponibili, la ricerca sembra a prima vista come cercare un ago in un pagliaio. La scoperta di farmaci cerca quindi di utilizzare modelli scientifici per prevedere quali molecole si legheranno meglio alla rispettiva proteina bersaglio e si legheranno fortemente. Questi potenziali candidati farmaci vengono poi indagati più dettagliatamente in studi sperimentali.
L’uso dell’intelligenza artificiale nella scoperta di farmaci
Con l’avanzamento dell’AI, la ricerca sulla scoperta di farmaci ha iniziato a utilizzare sempre più applicazioni di machine learning. Una di queste applicazioni, le ”reti neurali grafiche” (GNN), offre diverse opportunità per tali applicazioni. Sono adattate per prevedere, ad esempio, quanto fortemente una certa molecola si lega a una proteina bersaglio. A tal fine, i modelli GNN vengono addestrati con grafici che rappresentano complessi formati tra proteine e composti chimici (ligandi).
Il funzionamento delle applicazioni AI
I ricercatori hanno analizzato un totale di sei diverse architetture GNN utilizzando il loro metodo appositamente sviluppato “EdgeSHAPer” e una metodologia concettualmente diversa per il confronto. Questi programmi informatici ”esaminano” se i GNN imparano le interazioni più importanti tra un composto e una proteina e quindi prevedono la potenza del ligando, come previsto e anticipato dai ricercatori, o se l’AI arriva alle previsioni in altri modi.
Le implicazioni per la ricerca farmaceutica
La dipendenza dei GNN dai dati di addestramento
I GNN sono molto dipendenti dai dati con cui vengono addestrati. I ricercatori hanno addestrato i sei GNN con grafici estratti da strutture di complessi proteina-ligando, per i quali il modo di azione e la forza di legame dei composti alle loro proteine bersaglio erano già noti dagli esperimenti. I GNN addestrati sono stati poi testati su altri complessi. L’analisi EdgeSHAPer successiva ha reso possibile comprendere come i GNN generassero previsioni apparentemente promettenti.
Il “Clever Hans effect” e le previsioni dei GNN
Secondo le analisi del team di ricerca, tuttavia, i sei GNN essenzialmente non sono riusciti a fare ciò che ci si aspettava da loro. La maggior parte dei GNN ha imparato solo poche interazioni proteina-farmaco e si è concentrata principalmente sui ligandi. Per prevedere la forza di legame di una molecola a una proteina bersaglio, i modelli hanno principalmente “ricordato” molecole chimicamente simili che avevano incontrato durante l’addestramento e i loro dati di legame, indipendentemente dalla proteina bersaglio. Queste somiglianze chimiche apprese hanno quindi determinato essenzialmente le previsioni.
Le opportunità per l’AI nella ricerca farmaceutica
Non è generalmente sostenibile che i GNN imparino interazioni chimiche tra sostanze attive e proteine. Le loro previsioni sono in gran parte sopravvalutate perché previsioni di qualità equivalente possono essere fatte utilizzando conoscenze chimiche e metodi più semplici. Tuttavia, la ricerca offre anche opportunità per l’AI. Due dei modelli GNN esaminati hanno mostrato una chiara tendenza ad imparare più interazioni quando la potenza dei composti di prova aumentava. “Vale la pena dare un’occhiata più da vicino qui”, dice Bajorath. Forse questi GNN potrebbero essere ulteriormente migliorati nella direzione desiderata attraverso rappresentazioni e tecniche di addestramento modificate. Tuttavia, l’assunzione che le quantità fisiche possano essere apprese sulla base di grafici molecolari dovrebbe generalmente essere trattata con cautela. “L’AI non è magia nera”, dice Bajorath.
Infatti, vede la precedente pubblicazione in open access di EdgeSHAPer e altri strumenti di analisi appositamente sviluppati come approcci promettenti per far luce sulla scatola nera dei modelli AI. L’approccio del suo team si concentra attualmente su GNN e nuovi “modelli di linguaggio chimico”.
“Lo sviluppo di metodi per spiegare le previsioni di modelli complessi è un’area importante della ricerca sull’AI. Ci sono anche approcci per altre architetture di rete come i modelli di linguaggio che aiutano a comprendere meglio come il machine learning arriva ai suoi risultati”, dice Bajorath. Si aspetta che presto accadranno cose eccitanti anche nel campo dell’”Explainable AI” presso l’Istituto Lamarr, dove è un PI e Chair of AI in the Life Sciences.