Il Nobel per la chimica 2024 ai programmi che prevedono la struttura delle proteine

proteine

Con il premio Nobel per la chimica, computer e intelligenze artificiali si confermano i veri vincitori di quest’anno. L’Accademia reale svedese delle scienze ha infatti deciso di premiare tre ricercatori che hanno saputo sfruttare i più moderni strumenti computazionali “per la previsione delle strutture delle proteine”: i due padri di AlphaFold2Demis Hassabis e John M. Jumper, che con la loro creatura sono riusciti a risolvere una delle più grandi sfide della biochimica, cioè come prevedere la struttura tridimensionale di una proteina partendo dalla sequenza di aminoacidi che la compone; e lo scienziato dell’università di Washington David Baker, che grazie al software Rosetta è riuscito per la prima volta di creare nuove proteine mai viste in natura, inferendo la corretta sequenza di aminoacidi necessari a partire dalla struttura tridimensionale che voleva ottenere. Scoperte che promettono di rivoluzionare campi che vanno dalla medicina, alla produzione di sensori e nanomateriali. Vediamo perché.

Una sfida durata 50 anni

Le proteine sono una degli elementi più fondamentali della vita biologica. Sono le molecole che vengono codificate dai geni, e assemblate un mattoncino dopo l’altro nei ribosomi fino a formare lunghe catene di aminoacidi che possono fare un po’ di tutto: diventare muscoli, peli, corna, piume ed esoscheletri, enzimi che catalizzano le reazioni chimiche all’interno del nostro organismo, ormoni, anticorpi.

Per scoprire la struttura tridimensionale delle proteine venne così sviluppata una tecnologia conosciuta come cristallografia a raggi X, fruttata il premio Nobel per la chimica del 1962 ai biologi John Kendrew e Max Perutz. Ed è con questa tecnica che il premio Nobel per la chimica del 1972 Christian Anfinsen ha scoperto che se si fa dispiegare una proteina, riportandola allo stato di semplice catena di aminoacidi, questa torna poi a ripiegarsi nella stessa struttura 3D che aveva in origine, dimostrando così che la struttura tridimensionale dipende unicamente dalla sequenza di aminoacidi. Si aprì così quella che un altro premio Nobel per la chimica (tanta densità di Nobel aiuta a capire l’importanza di questo campo di studi), l’esperto di ribosomi Venkatraman Ramakrishnan, ha definito una “la grande sfida cinquantennale della biologia”: scoprire come determinare la struttura che assumerà una proteina, a partire dalla sequenza di aminoacidi da cui è composta.

Ci pensa l’AI

La cristallografia a raggi X è una tecnica di analisi raffinata, ma è anche lenta, costosa, e non può essere utilizzata con tutte le proteine. E infatti, se le sequenze di dna conosciute e depositate nei database pubblici sono quasi tre miliardi, e le proteine di cui si conosce la sequenza di aminoacidi più di 200 milioni, quelle di cui è stata studiata la struttura tridimensionale non sono più di 200mila. Poterla prevedere partendo semplicemente dagli aminoacidi che la costituiscono fornirebbe quindi uno strumento preziosissimo alla ricerca. E per questo, nel 1994 venne lanciato un progetto, il Critical Assessment of Protein Structure Prediction (Casp), trasformatosi poi in un competizione scientifica, che ogni due anni ha visto gareggiare team di tutto il mondo per provare a indovinare la struttura tridimensionale di alcune proteine (di cui era conosciuta ma ancora non divulgata) basandosi unicamente sulla loro sequenza di aminoacidi.

Per quasi due decenni la competizione non ha visto particolari passi in avanti. Fino all’arrivo di Alphafold, un modello di intelligenza artificiale sviluppato dal creatore di DeepMind (compagnia dedicata allo sviluppo di ai dedicate alla soluzione di videogiochi e giochi da tavolo, comprata da Google nel 2014): Demis Hassabis, personalità eclettica, con un passato da scacchista, un’esperienza decennale nello sviluppo di intelligenze artificiali, e una passione insaziabile per nuove sfide, che aveva trovato proprio nella previsione della struttura delle proteine il nuovo campo in cui mettersi alla prova.

Il primo modello di Alphafold partecipò al Casp nel 2018, raggiungendo un’accuratezza predittiva del 60%, ben superiore alla media della competizione (ferma da tempo intorno al 40%), ma comunque inferiore all’obbiettivo del 90% fissato dagli organizzatori. La storia di Hassabis poteva finire qui, ma è a questo punto che entra in gioco John Jumper, giovane fisico fresco di dottorato, con esperienza nel campo della simulazione digitale delle attività delle proteine.

Unitosi al team di DeepMind nel 2017, Jumper utilizzò la propria esperienza nella simulazione delle dinamiche delle proteine per sviluppare, insieme a Hassabis, Alphafold2, un’intelligenza artificiale che sfruttava un nuovissimo modello di deep learning, noto come trasformatore, che il team di DeepMind ha fatto allenare su un dataset contenente tutte le strutture proteiche e le sequenze di aminoacidi note. Iscritto al Casp nel 2020, Alphafold2 si rivelò un successo rivoluzionario: era in grado di prevedere la sequenza di qualsiasi proteina, con risultati spesso paragonabili per precisione a quelli della cristallografia a raggi X. Dopo 50 anni, la sfida era finalmente conclusa.

Strade parallele

Il terzo premio Nobel per la chimica di quest’anno ha iniziato a lavorare al problema della struttura delle proteine quasi due decenni prima dei suoi co-vincitori. Sulla fine degli anni ‘90, David Baker iniziò a sviluppare un programma per il computer dedicato a prevedere la struttura delle proteine dalla loro sequenza di aminoacidi. Lo battezzò Rosetta, e al suo debutto al Casp nel 1998 ottenne risultati promettenti. Pur continuando a lavorare alla sfida, Baker e il suo team ebbero anche un’altra idea: perché non fare l’inverso, e utilizzare Rosetta per prevedere la sequenza di aminoacidi necessaria per creare una determinata struttura tridimensionale?

In questo modo, si sarebbero potute creare nuove proteine mai viste in precedenza, e dare un impulso notevole al campo del protein design, cioè della produzione di proteine con nuove funzioni, obbiettivo che negli anni ‘90 veniva ancora raggiunto unicamente modificando proteine già esistenti. “Se vuoi costruire un aeroplano, non inizi modificando un uccello – ha avuto modo di spiegare in passato Baker, per rivendicare l’importanza della sua intuizione – piuttosto, cerchi di capire i principi dell’aerodinamica, e con questi costruisci una macchina volante”.

Ed è esattamente quello che hanno fatto i ricercatori di Washington guidati da Baker. Hanno disegnato una proteina con una struttura tridimensionale completamente nuova, e hanno chiesto a Rosetta di prevedere quali aminoacidi potessero produrla. Il programma ha analizzato un database contenente tutte le strutture di proteine conosciute, isolando i frammenti che mostravano somiglianze con quella che voleva ottenere, li ha valutati basandosi sulle conoscenze delle regole che guidano il ripiegamento delle sequenze di aminoacidi, e ha proposto infine la sua ricetta.

Baker ha quindi prodotto un gene che codificava per la sequenza di aminoacidi immaginata da Rosetta, e lo ha inserito in un batterio, in modo che venisse tradotto in una proteina. A quel punto, ha analizzato il risultato con la cristallografia a raggi X, confermando che la nuova proteina, ribattezzata Top7, aveva esattamente la struttura tridimensionale desiderata. Si trattava della prima proteina creata da zero con una struttura mai osservata in natura. Era il 2003, e da allora Baker ha creato molte nuove proteine, e rilasciato il codice di Rosetta in open source, permettendo a moltissimi altri team di ricercatori di tutto il mondo di partecipare alla sua nuova impresa.

Il premio Nobel per la chimica di quest’anno premia quindi i protagonisti di un viaggio che, in realtà, è praticamente ancora agli inizi. Ma che nei prossimi decenni è destinato a rivoluzionare la nostra salute, le tecnologie green, la lotta all’inquinamento, la produzione di nuovi materiali, e chissà cos’altro.

via Wired.it

Credit immagine: Schlenk/Wikipedia