Kirjahylly
Vain kun DNA:n rakenne löydettiin 1950-luvun alussa, kävi selväksi, miten solujen perimätieto koodataan DNA:n nukleotidijärjestykseen. Sen jälkeen tapahtunut kehitys on ollut hämmästyttävää. Viisikymmentä vuotta myöhemmin meillä on täydelliset perimän sekvenssit monista organismeista, myös ihmisestä, ja tiedämme näin ollen sen tiedon enimmäismäärän, joka tarvitaan kaltaisemme monimutkaisen organismin tuottamiseen. Elämään tarvittavan perinnöllisen informaation rajat rajoittavat solujen biokemiallisia ja rakenteellisia ominaisuuksia ja tekevät selväksi, että biologia ei ole äärettömän monimutkaista.
Tässä luvussa selitetään, miten solut purkavat ja käyttävät genomissaan olevaa informaatiota. Näemme, että on opittu paljon siitä, miten vain neljän ”kirjaimen” aakkosiin – DNA:n neljään eri nukleotidiin – kirjoitetut geneettiset ohjeet ohjaavat bakteerin, hedelmäkärpäsen tai ihmisen muodostumista. Meillä on kuitenkin vielä paljon selvitettävää siitä, miten organismin perimään tallennettu tieto tuottaa yksinkertaisimmankin yksisoluisen bakteerin, jossa on 500 geeniä, puhumattakaan siitä, miten se ohjaa ihmisen kehitystä, jossa on noin 30 000 geeniä. Tietämättömyyttä on vielä valtavasti; monet kiehtovat haasteet odottavat siis seuraavan sukupolven solubiologeja.
Solujen kohtaamia ongelmia genomien purkamisessa voidaan ymmärtää tarkastelemalla pientä osaa hedelmäkärpäsen Drosophila melanogasterin genomista (kuva 6-1). Suuri osa tässä ja muissa genomeissa olevasta DNA-koodatusta informaatiosta käytetään määrittelemään lineaarinen järjestys – aminohappojen järjestys – jokaista organismin tuottamaa proteiinia varten. Kuten luvussa 3 kuvattiin, aminohapposekvenssi puolestaan määrää, miten kukin proteiini taittuu muodoltaan ja kemialliselta koostumukseltaan erityiseksi molekyyliksi. Kun solu valmistaa tiettyä proteiinia, genomin vastaava alue on siksi purettava tarkasti. Genomin DNA:han koodatut lisätiedot määrittelevät tarkalleen, milloin elimistön elämässä ja missä solutyypeissä kunkin geenin on tarkoitus ilmentyä proteiiniksi. Koska proteiinit ovat solujen pääkomponentteja, genomin dekoodaus määrittää solujen koon, muodon, biokemiallisten ominaisuuksien ja käyttäytymisen lisäksi myös jokaisen maapallolla elävän lajin erityispiirteet.
Kuva 6-1
Kaavamainen kuvaus osasta kromosomia 2 hedelmäkärpäsen Drosophila melanogasterin genomista. . Tämä kuva edustaa noin 3 % Drosophilan koko genomista, joka on järjestetty kuudeksi vierekkäiseksi segmentiksi. Kuten avaimessa on esitetty, symbolinen (lisää…)
Olisi voinut olettaa, että genomissa oleva informaatio olisi järjestetty järjestelmällisesti muistuttaen sanakirjaa tai puhelinluetteloa. Vaikka joidenkin bakteerien genomit näyttävät melko hyvin järjestetyiltä, useimpien monisoluisten eliöiden, kuten esimerkkimme Drosophilan, genomit ovat yllättävän epäjärjestyksessä. Pienet koodaavan DNA:n (eli proteiineja koodaavan DNA:n) palaset ovat sekaisin suurten, näennäisesti merkityksettömien DNA-lohkojen kanssa. Joissakin perimän osissa on paljon geenejä, ja toisista puuttuvat geenit kokonaan. Proteiinien, jotka toimivat solussa tiiviisti yhdessä, geenit sijaitsevat usein eri kromosomeissa, ja vierekkäiset geenit koodaavat tyypillisesti proteiineja, joilla on solussa vain vähän tekemistä toistensa kanssa. Genomien purkaminen ei siis ole yksinkertainen asia. Jopa tehokkaiden tietokoneiden avulla tutkijoiden on edelleen vaikea paikantaa lopullisesti geenien alkua ja loppua monimutkaisten genomien DNA-sekvensseissä, saati sitten ennustaa, milloin kukin geeni ilmenee organismin elämässä. Vaikka ihmisen perimän DNA-sekvenssi tunnetaan, kestää todennäköisesti ainakin vuosikymmen, ennen kuin ihmiset pystyvät tunnistamaan jokaisen geenin ja määrittämään sen tuottaman proteiinin tarkan aminohapposekvenssin. Silti kehomme solut tekevät tämän tuhansia kertoja sekunnissa.
Geenien DNA ei itse ohjaa proteiinisynteesiä, vaan käyttää RNA:ta välittäjänä. Kun solu tarvitsee tiettyä proteiinia, kromosomissa olevan valtavan pitkän DNA-molekyylin sopivan osan nukleotidisekvenssi kopioidaan ensin RNA:ksi (prosessia kutsutaan transkriptioksi). Näitä DNA:n osien RNA-kopioita käytetään suoraan malleina, jotka ohjaavat proteiinin synteesiä (prosessia kutsutaan translaatioksi). Geneettinen informaatio kulkee soluissa siis DNA:sta RNA:sta proteiiniin (kuva 6-2). Kaikki solut bakteereista ihmisiin ilmaisevat geneettisen informaationsa tällä tavoin – periaate on niin perustavanlaatuinen, että sitä kutsutaan molekyylibiologian keskeiseksi dogmaksi.
Kuva 6-2
Kulkutie DNA:sta proteiiniksi. Geneettisen informaation kulku DNA:sta RNA:ksi (transkriptio) ja RNA:sta proteiiniksi (translaatio) tapahtuu kaikissa elävissä soluissa.
Keskeisen opinkappaleen yleispätevyydestä huolimatta informaation kulussa DNA:sta proteiiniin on merkittäviä eroja. Tärkein näistä on se, että eukaryoottisten solujen RNA-transkripteihin kohdistuu useita prosessointivaiheita ytimessä, mukaan lukien RNA:n pilkkominen, ennen kuin ne saavat poistua ytimestä ja kääntyä proteiiniksi. Nämä prosessointivaiheet voivat muuttaa ratkaisevasti RNA-molekyylin ”merkitystä”, ja siksi ne ovat ratkaisevan tärkeitä ymmärrettäessä, miten eukaryoottiset solut lukevat genomia. Vaikka keskitymme tässä luvussa genomin koodaamien proteiinien tuotantoon, näemme, että joidenkin geenien kohdalla RNA on lopputuote. Proteiinien tavoin monet näistä RNA:ista taittuvat täsmällisiksi kolmiulotteisiksi rakenteiksi, joilla on rakenteellisia ja katalyyttisiä tehtäviä solussa.
Aloitamme tämän luvun genomin dekoodauksen ensimmäisellä vaiheella: transkriptioprosessilla, jossa geenin DNA:sta tuotetaan RNA-molekyyli. Seuraamme sitten tämän RNA-molekyylin kohtaloa solun läpi ja päätämme sen, kun oikein taitettu proteiinimolekyyli on muodostunut. Luvun lopussa pohdimme, miten nykyinen, varsin monimutkainen tiedon tallentamisen, transkription ja translaation järjestelmä on voinut syntyä yksinkertaisemmista järjestelmistä solujen evoluution varhaisimmissa vaiheissa.