«Per capire come funzionano, devi sapere che aspetto hanno». Con questa frase, il membro del Nobel Committee Johan Åqvist ha chiuso la presentazione di annuncio dei premi per la Chimica 2024, Demis Hassabi, John M. Jumper, e David Baker.
Nel suo messaggio Åqvist ha riassunto decenni di sfide e studi sulle proteine, sulla loro struttura e sulle loro abilità: oggi sappiamo che la forma tridimensionale di una proteina determina la sua capacità di svolgere precisi ruoli all’interno di una cellula. Una proteina che perda la sua struttura è un oggetto incapace di assolvere il proprio compito, inutile o addirittura dannoso.
In biologia molecolare la conoscenza passa per la visualizzazione di queste forme: per decenni la comunità scientifica si è affidata ai raggi X con cui sono state ottenute fotografie dirette delle singole proteine. Il costo del processo, in termini di risorse e tempo, è stato però immane e solo l’avvento dei computer ha cambiato il modo di lavorare in questa disciplina.
Dalla lista alla struttura….
Una cellula monta le proteine usando gli amminoacidi come mattoncini e seguendo le istruzioni provenienti dal materiale genetico: una proteina è quindi una sequenza ordinata di amminoacidi che, una volta completato l’assemblaggio, si organizzano nella corretta forma tridimensionale. Nella sequenza stessa è scritta anche la struttura che la proteina deve acquisire, ma fino a pochi anni fa questa informazione per la comunità scientifica era quasi illeggibile.
Predire una struttura proteica solo dalla lista degli amminoacidi che la compongono è uno sforzo che solo i computer possono reggere, ma con risultati approssimativi: dal 1994 al 2016 gli strumenti computazionali sono lentamente migliorati fino a raggiungere un’accuratezza di circa il 40%, un livello buono, ma di scarsa utilità. Il “problema della predizione” sembrava irrisolvibile.
Con l’avvento delle reti neurali e dell’intelligenza artificiale, lo scenario è cambiato del tutto in breve tempo. Demis Hassabis e John Jumper, CEO e Senior Scientist della società DeepMind, hanno messo in campo le loro competenze multidisciplinari arrivando alla creazione di AlphaFold, un programma di intelligenza artificiale che, sfruttando il database di tutte le proteine conosciute, riesce a ricostruire una struttura dalla sola lista di amminoacidi con una precisione del 90%. Un risultato paragonabile a quelli ottenibili sperimentalmente in laboratorio, che ha messo in crisi anche l’organizzatore di CASP, una competizione aperta a chiunque volesse cimentarsi nella predizione di strutture proteiche: «E adesso?» si è chiesto nel 2020, quando ha dichiarato chiusa la gara e decretato AlphaFold vincitore. Oggi il programma è disponibile per tutti e i suoi risultati sono accessibili a chiunque voglia sapere come siano fatte le proteine del nostro corpo, anche quelle che permettono la lettura di questo articolo.
…e dalla struttura alla lista
David Baker e il suo gruppo di ricerca hanno invece fatto il percorso al contrario e si sono chiesti: perché non disegnare prima una struttura e poi determinare la sequenza di amminoacidi adatta a generarla? In pratica ha creato una nuova disciplina: la progettazione proteica. Nel 2003 il gruppo pubblicò un articolo di ricerca spiegando di aver ipotizzato una struttura inesistente in natura e di aver costruito un algoritmo, denominato Rosetta, che ha restituito una sequenza di 93 amminoacidi. Seguendo le istruzioni del programma, il gruppo ha poi prodotto la proteina e ne ha fotografato la struttura, ottenendo un oggetto quasi identico a quello ipotizzato. Era nata così Top7, la prima proteina 100% artificiale.
Da quel momento, Baker ha dato libero sfogo alla fantasia e ha regalato Rosetta alla comunità scientifica: sono quindi nate decine di proteine artificiali con proprietà e strutture mai viste prima. I campi di applicazione sono sconfinati, dalla medicina alle scienze dei materiali. Magari un giorno indosseremo o toccheremo proteine progettate dal cervello umano in collaborazione con l’intelligenza artificiale.
Alcune considerazioni sparse
La chimica computazionale è una disciplina nata alcuni decenni fa e migliorata andando di pari passo con la crescente potenza di calcolo messa a disposizione dai computer. Molti gruppi di ricerca hanno lavorato dietro le quinte per rendere i calcoli rapidi, efficaci e accurati: queste persone hanno creato un corpus teorico enorme che sorregge tutto l’edificio oggi abitato dagli algoritmi di intelligenza artificiale. Alcune di queste fondamenta sono merito di ricercatori italiani tra i più citati al mondo.
Ogni anno la società Clarivate rilascia una lista di persone che potrebbero ottenere un premio Nobel nel giro di pochi anni: i primi nella lista, e quindi papabili per il 2024, erano Roberto Car e Michele Parrinello, ricercatori che hanno dato enormi contributi alla chimica computazionale. Chi vi scrive ci aveva davvero creduto: c’era una concreta possibilità di rivedere un Nobel per la Chimica in Italia sessantuno anni dopo Giulio Natta. Non è successo e la premiazione per i tool di intelligenza artificiale fa pensare che abbiamo perso anche questo treno.
La chimica biologica è un mondo molto complesso, pieno di eccezioni e di apparenti contraddizioni. Nello spiegare le motivazioni del Nobel 2024 ho dovuto usare semplificazioni che non rendono giustizia a questa complessità: giusto per fare un esempio, il nesso struttura-proprietà è stato messo a dura prova dalla scoperta delle proteine intrinsecamente disordinate (IDP), molecole la cui struttura non è perfettamente definita ma che svolgono in modo eccellente il loro lavoro. AlphaFold riesce comunque a lavorare anche con oggetti tanto complessi e a tratti imprevedibili.
Il Nobel 2024 forse non rende merito a tutta la complessità nascosta nelle scienze della vita, ma riconosce la velocità con cui la conoscenza scientifica sta evolvendo. Velocità che non avremmo mai raggiunto senza l’intelligenza artificiale. Sarà vera gloria? Ai posteri l’ardua sentenza.
Immagine di copertina: © Niklas Elmehed – Nobel Prize Outreach