Ha tutta l’aria di una gara, anche se a nessuno piace chiamarla così. La quinta edizione di Casp, o Community Wide Experiment on the Critical Assessment of Protein Structure Prediction, permetterà di stilare una vera e propria classifica tra i vari gruppi di ricerca impegnati in tutto il mondo sul campo della bioinformatica: l’utilizzo, cioè, dei più avanzati strumenti di calcolo per la comprensione delle strutture del vivente. In particolare, Casp ha lo scopo di mettere alla prova i diversi modelli informatici sviluppati per predire, a partire dai geni, la struttura di proteine non ancora note.”Oggi, lo scopo della bioinformatica è interpretare le molte ma confuse informazioni fornite dal sequenziamento del genoma”, ha spiegato a Galileo Anna Tramontano, vice presidente della Società Internazionale di Biologia Computazionale nonché unica presenza italiana nella commissione di valutazione di Casp. “Il progetto Genoma ha lasciato diversi problemi aperti: il primo è, naturalmente, trovare i geni. Il secondo è capire la funzione della proteina codificata dal gene. Il terzo, per certi versi il più importante, è comprendere il meccanismo in base a al quale la proteina esercita quella funzione. Ci serve capire non solo cosa fa, ma soprattutto come lo fa. E sappiamo che fondamentalmente lo fa perché ha una certa forma”. La struttura di una proteina, il modo in cui si organizza nello spazio, è cioè fondamentale nel determinarne la funzione. Arrivare a comprendere il codice che lega l’informazione genetica alla effettiva struttura delle proteine significherebbe poter intervenire più efficacemente su di esse. Per esempio, riuscire a progettarne di nuove per specifici scopi. Negli ultimi anni sono stati sviluppati diversi algoritmi informatici per prevedere la struttura di proteine di cui si conosce solo il gene che le codifica. Resta però da verificarne l’affidabilità. Nel 1994 è nata così l’idea di effettuare un vero e proprio test “cieco”: prima si chiede ai biochimici sperimentali di indicare su quali proteine stanno lavorando, molecole di cui si conosce la sequenza, e di cui molto probabilmente verrà scoperta la struttura nel giro di poco tempo. Dopodiché si danno ‘in pasto’ queste proteine ai bioinformatici, che hanno un paio di mesi per predirne la struttura. Poi una commissione valuta i risultati, li confronta con le strutture effettive trovate (si spera) nel frattempo dagli sperimentali. In questo modo si individuano i metodi su cui vale la pena continuare a lavorare. È nato così Casp che dal ’94 si è svolto ogni due anni.”Ci sono tre filosofie possibili dietro ai diversi modelli informatici”, spiega ancora Tramontano, che è anche docente di biochimica all’Università “La Sapienza”. “Ci si può basare su criteri chimico-fisici, e cercare tra tutte le strutture possibili quella a minore energia. Oppure si possono utilizzare criteri evolutivi: se due proteine hanno un progenitore comune, avranno probabilmente una somiglianza strutturale. Quindi, se una ‘nuova’ proteina assomiglia in qualche modo, nella sequenza dei geni, a una già nota, dovrebbe assomigliarle anche nella struttura. L’ultimo metodo, il più recente, si basa sul fatto che tra tutte le strutture possibili le proteine sembrano preferirne alcune: i modelli limitano quindi la ricerca solo a determinate strutture cercando quella a minore energia”.La prima fase, quella di predizione, di Casp5 si è chiusa il 31 agosto scorso: 215 gruppi di ricerca hanno presentato circa 28 mila modelli di proteine. Ora è in corso la valutazione, e dall’1° al 5 dicembre si terrà a Monterey, in California, una conferenza in cui saranno illustrati i risultati, che saranno pubblicati sulla rivista Proteins. Il compito della ricercatrice italiana è tutt’altro che facile: “Il problema è che le previsioni non sono mai completamente giuste o completamente sbagliate. C’è una gamma di risultati intermedi. E sul lavoro di valutazione c’è molta pressione, perché negli Usa l’assegnazione di fondi ai gruppi di ricerca dipende anche dai risultati conseguiti qui. Si crea anche il rischio che qualche gruppo rinunci a tentare soluzioni particolarmente ardite e potenzialmente interessanti proprio per non rischiare una valutazione bassa”. D’altronde, conclude la ricercatrice italiana, Casp è quanto mai necessario, ora che per la modellizzazione delle proteine esistono diversi server automatici accessibili in Rete. Questi strumenti possono essere utilizzati anche da chi non è esperto di informatica, ed è fondamentale, prima che diventino strumenti di uso comune tra i ricercatori, accertarne la validità.