Bookshelf
Solo quando la struttura del DNA è stata scoperta nei primi anni 50 è diventato chiaro come l’informazione ereditaria nelle cellule è codificata nella sequenza di nucleotidi del DNA. Il progresso da allora è stato sorprendente. Cinquant’anni dopo, abbiamo sequenze complete del genoma di molti organismi, compreso l’uomo, e conosciamo quindi la quantità massima di informazioni che è necessaria per produrre un organismo complesso come noi. I limiti dell’informazione ereditaria necessaria per la vita vincolano le caratteristiche biochimiche e strutturali delle cellule e rendono chiaro che la biologia non è infinitamente complessa.
In questo capitolo, spieghiamo come le cellule decodificano e utilizzano le informazioni nei loro genomi. Vedremo che si è imparato molto su come le istruzioni genetiche scritte in un alfabeto di sole quattro “lettere” – i quattro diversi nucleotidi del DNA – dirigono la formazione di un batterio, di una mosca della frutta o di un uomo. Tuttavia, abbiamo ancora molto da scoprire su come l’informazione immagazzinata nel genoma di un organismo produce anche il più semplice batterio unicellulare con 500 geni, per non parlare di come dirige lo sviluppo di un uomo con circa 30.000 geni. Rimane un’enorme quantità di ignoranza; molte sfide affascinanti attendono quindi la prossima generazione di biologi cellulari.
I problemi che le cellule devono affrontare nel decodificare i genomi possono essere apprezzati considerando una piccola porzione del genoma del moscerino della frutta Drosophila melanogaster (Figura 6-1). Molte delle informazioni codificate nel DNA presenti in questo e in altri genomi sono usate per specificare l’ordine lineare – la sequenza degli aminoacidi per ogni proteina prodotta dall’organismo. Come descritto nel Capitolo 3, la sequenza degli aminoacidi detta a sua volta il modo in cui ogni proteina si ripiega per dare una molecola con una forma e una chimica particolari. Quando una particolare proteina viene prodotta dalla cellula, la regione corrispondente del genoma deve quindi essere accuratamente decodificata. Ulteriori informazioni codificate nel DNA del genoma specificano esattamente quando nella vita di un organismo e in quali tipi di cellule ogni gene deve essere espresso in proteine. Poiché le proteine sono i principali costituenti delle cellule, la decodifica del genoma determina non solo la dimensione, la forma, le proprietà biochimiche e il comportamento delle cellule, ma anche le caratteristiche distintive di ogni specie sulla Terra.
Figura 6-1
Rappresentazione schematica di una parte del cromosoma 2 del genoma del moscerino della frutta Drosophila melanogaster. . Questa figura rappresenta circa il 3% del genoma totale di Drosophila, organizzato come sei segmenti contigui. Come riassunto nella chiave, il simbolico (più…)
Si potrebbe prevedere che le informazioni presenti nei genomi siano disposte in modo ordinato, come un dizionario o un elenco telefonico. Anche se i genomi di alcuni batteri sembrano abbastanza ben organizzati, i genomi della maggior parte degli organismi multicellulari, come il nostro esempio di Drosophila, sono sorprendentemente disordinati. Piccoli pezzi di DNA codificante (cioè il DNA che codifica per le proteine) sono intervallati da grandi blocchi di DNA apparentemente senza senso. Alcune sezioni del genoma contengono molti geni e altre mancano del tutto di geni. Le proteine che lavorano a stretto contatto l’una con l’altra nella cellula spesso hanno i loro geni situati su cromosomi diversi, e i geni adiacenti tipicamente codificano proteine che hanno poco a che fare l’una con l’altra nella cellula. Decodificare i genomi non è quindi una cosa semplice. Anche con l’aiuto di potenti computer, è ancora difficile per i ricercatori localizzare definitivamente l’inizio e la fine dei geni nelle sequenze di DNA di genomi complessi, tanto meno prevedere quando ogni gene è espresso nella vita dell’organismo. Anche se la sequenza del DNA del genoma umano è nota, ci vorrà probabilmente almeno un decennio per identificare ogni gene e determinare la precisa sequenza di aminoacidi della proteina che produce. Eppure le cellule del nostro corpo lo fanno migliaia di volte al secondo.
Il DNA nei genomi non dirige direttamente la sintesi delle proteine, ma usa invece l’RNA come molecola intermediaria. Quando la cellula ha bisogno di una particolare proteina, la sequenza nucleotidica della porzione appropriata della molecola di DNA immensamente lunga in un cromosoma viene prima copiata in RNA (un processo chiamato trascrizione). Sono queste copie RNA di segmenti del DNA che vengono usate direttamente come modelli per dirigere la sintesi della proteina (un processo chiamato traduzione). Il flusso di informazioni genetiche nelle cellule è quindi da DNA a RNA a proteine (Figura 6-2). Tutte le cellule, dai batteri agli esseri umani, esprimono le loro informazioni genetiche in questo modo – un principio così fondamentale da essere definito il dogma centrale della biologia molecolare.
Figura 6-2
Il percorso dal DNA alle proteine. Il flusso di informazioni genetiche dal DNA all’RNA (trascrizione) e dall’RNA alle proteine (traduzione) avviene in tutte le cellule viventi.
Nonostante l’universalità del dogma centrale, ci sono importanti variazioni nel modo in cui l’informazione passa dal DNA alle proteine. La principale di queste è che i trascritti di RNA nelle cellule eucariotiche sono soggetti a una serie di fasi di elaborazione nel nucleo, compreso lo splicing dell’RNA, prima di poter uscire dal nucleo ed essere tradotti in proteine. Queste fasi di elaborazione possono cambiare criticamente il “significato” di una molecola di RNA e sono quindi cruciali per capire come le cellule eucariotiche leggono il genoma. Infine, anche se in questo capitolo ci concentriamo sulla produzione delle proteine codificate dal genoma, vediamo che per alcuni geni l’RNA è il prodotto finale. Come le proteine, molti di questi RNA si piegano in precise strutture tridimensionali che hanno ruoli strutturali e catalitici nella cellula.
Iniziamo questo capitolo con il primo passo nella decodifica di un genoma: il processo di trascrizione con cui una molecola di RNA viene prodotta dal DNA di un gene. Seguiamo poi il destino di questa molecola di RNA attraverso la cellula, finendo quando si è formata una molecola proteica correttamente piegata. Alla fine del capitolo, consideriamo come l’attuale, abbastanza complesso, schema di immagazzinamento delle informazioni, trascrizione e traduzione possa essere sorto da sistemi più semplici nelle prime fasi dell’evoluzione cellulare.