Cos’è il folding proteico e quali operazioni esegue il programma di f@h?
1. COS'E' IL FOLDING PROTEICO
Le proteine sono dei composti organici molto complessi, che vengono sintetizzati dagli organismi viventi (animali e piante) utilizzando una serie di “mattoncini elementari” chiamati “amminoacidi”. Gli amminoacidi che formano le proteine sono 20 in totale.
Le funzioni svolte dalle proteine sono talmente numerose, che elencarle e discuterle tutte richiederebbe un libro di centinaia di pagine. Riassumendo, possiamo dire che hanno 2 funzioni principali:
1.Funzione strutturale : le proteine costituiscono il materiale strutturale di cui sono formati i capelli, le unghie, la pelle, gli artigli degli animali (alfa e beta-cheratine), i tessuti connettivi come i tendini (collagene) ed i nostri muscoli (miosina e actina).
2.Funzioni regolatorie e di trasporto: gli enzimi, che regolano i processi metabolici del nostro corpo, sono tutti delle proteine. L’insulina, l’ormone che regola il metabolismo del glucosio e che viene somministrato ai diabetici, è anch’esso una proteina. Emogoblina e Miogoblina sono le proteine responsabili del trasporto dell’ossigeno nel sangue e nei tessuti. Anche gli anticorpi, che hanno il compito di difendere il nostro organismo dalle aggressioni esterne, sono delle proteine.
Le proteine vengono sintetizzate a partire dal DNA, che contiene al suo interno tutte le informazioni necessarie per creare la corretta sequenza di amminoacidi che formerà la proteina.
La successione di amminoacidi all’interno di una proteina costituisce la
struttura primaria. Gli amminoacidi che formano le proteine sono solo 20, ma questi si possono ripetere più volte lungo la catena. Proteine di piccole dimensioni contengono un centinaio di amminoacidi, mentre le proteine più grandi contengono fino a 10.000 – 20.000 amminoacidi.
Ecco una rappresentazione schematica della struttura primaria di una proteina, in cui ogni pallina corrisponde ad un amminoacido.
Veniamo adesso al nocciolo della questione, ovvero quello di cui si occupa concretamente il progetto Folding@Home.
Affinché una proteina svolga correttamente le funzioni per cui è stata sintetizzata, non deve essere rispettata solo la struttura primaria, ma anche la sua struttura secondaria, terziaria e quaternaria.
La
struttura secondaria è una struttura spaziale regolare e ripetitiva, può essere di 2 diversi tipi: α-elica (in cui la catena proteica si avvolge come una vite) e foglietto pieghettato β (in cui la catena proteica assume una struttra planare)
La
struttura terziaria riguarda la disposizione delle alfa eliche e dei foglietti beta in strutture ancor più complesse chiamate “domini” o "subunità".
In figura vediamo un esempio di struttura terziaria. Evidenziate in rosso le alfa-eliche e in giallo i foglietti beta.
La
struttura quaternaria è la disposizione spaziale di ciascuna subunità. In figura, è mostrata la disposizione spaziale delle 4 subunità (alfa1, alfa2, beta1, beta2) che formano l’emoglobina umana.
Conoscere la sequenza amminoacidica di una proteina (la struttura primaria) ci dice ben poco circa le sue funzioni, infatti per svolgere correttamente le proprie funzioni, le proteine devono assumere una corretta disposizione tridimensionale (la struttura secondaria, terziaria e quaternaria di cui abbiamo appena parlato). Il processo di avvolgimento delle proteine in una struttura tridimensionale organizzata e regolare, viene chiamato
folding (dall’inglese TO FOLD = piegare).
Si ritiene che malattie come il morbo di Alzheimer, il morbo di Parkinson, il morbo della mucca pazza (noto anche come BSE = encefalopatia spongiforme bovina) e molti tipi di cancro, siano il risultato di un processo non corretto di folding delle proteine (
misfolding).
La conclusione a cui si è pervenuti è che:
IL CORRETTO AVVOLGIMENTO (FOLDING) DI UNA PROTEINA È CRITICO PER IL CORRETTO FUNZIONAMENTO DELLA PROTEINA STESSA.
Per comprendere come le proteine possono avvolgersi, è necessario effettuare delle simulazioni al computer, utilizzando programmi specifici. Credo che F@H utilizzi il software GROMACS. Potete verificare questo aprendo il file
logfile_01.txt che si trova nella cartella
C:\Documents and Settings\NOME UTENTE\Dati applicazioni\Folding@home-x86\work. Leggerete la dicitura:
Folding@Home Gromacs Core Version 1.90 (March 8, 2006)
Se si considera che il numero di amminoacidi presenti in ogni proteina è dell’ordine di [FONT="]
100 – 10.000 [/FONT](vedi
struttura primaria), è facile capire queste enormi molecole (macromolecole) possono avvolgersi in un numero enorme di modi differenti!!
2. QUALI OPERAZIONI ESEGUE IL PROGRAMMA DI F@H?
Ogni qual volta avviate F@H, il vostro computer esegue una serie di calcoli atti a
simulare il modo in cui una proteina può avvolgersi, tenendo conto di tutte le forze interatomiche che si stabiliscono tra le centinaia di migliaia di atomi che formano la proteina (abbiamo detto che le proteine più grandi hanno un numero di amminoacidi dell’ordine 10.000 – 20.000, ma ogni amminoacido è formato da circa 10-20 atomi, quindi il conto è presto fatto!).
In definitiva,
F@H È UNA SIMULAZIONE VIA SOFTWARE DELLA STRUTTURA SECONDARIA, TERZIARIA E PRIMARIA DI ALCUNE PROTEINE COINVOLTE IN MALATTIE COME ALZHEIMER, PARKINSON, CANCRO, ecc....
Per complicare ulteriormente le cose, ricordate che le proteine non sono isolate, ma negli organismi viventi si trovano circondate da molecole di acqua (
ambiente acquoso), quindi una simulazione che abbia senso deve tener conto anche delle interazioni tra le molecole di acqua e la proteina. Infine, ogni simulazione deve tenere conto della
temperatura. Una proteina può avvolgersi in una determinata maniera a 20°C, ma può avvolgersi in maniera completamente differente a 30°C o a 35°C. Conclusione: al variare della temperatura, il folding della proteina varia di conseguenza.
Adesso, dovreste aver capito come mai anche un velocissimo processore N-core lanciato a 6 GHz, impiega tante ore per effettuare questi calcoli: la mole di lavoro richiesta per una
simulazione completa e
accurata è davvero impressionante!