Bookshelf
Det var først, da DNA’s struktur blev opdaget i begyndelsen af 1950’erne, at det blev klart, hvordan den arvelige information i cellerne er kodet i DNA’s sekvens af nukleotider. Siden da har fremskridtene været forbløffende. Halvtreds år senere har vi komplette genomsekvenser for mange organismer, herunder mennesker, og vi kender derfor den maksimale mængde information, der er nødvendig for at frembringe en kompleks organisme som os selv. Grænserne for den arvelige information, der er nødvendig for liv, begrænser cellernes biokemiske og strukturelle egenskaber og gør det klart, at biologien ikke er uendelig kompleks.
I dette kapitel forklarer vi, hvordan celler afkoder og bruger informationen i deres genomer. Vi vil se, at man har lært meget om, hvordan de genetiske instruktioner, der er skrevet i et alfabet bestående af blot fire “bogstaver” – de fire forskellige nukleotider i DNA – styrer dannelsen af en bakterie, en frugtflue eller et menneske. Ikke desto mindre har vi stadig meget at opdage om, hvordan den information, der er lagret i en organismes genom, frembringer selv den enkleste encellede bakterie med 500 gener, for slet ikke at tale om, hvordan den styrer udviklingen af et menneske med ca. 30.000 gener. Der er stadig en enorm mængde uvidenhed tilbage; mange fascinerende udfordringer venter derfor på den næste generation af cellebiologer.
De problemer, som cellerne står over for i forbindelse med afkodning af genomer, kan forstås ved at betragte en lille del af genomet hos frugtfluen Drosophila melanogaster (figur 6-1). En stor del af den DNA-kodede information, der findes i dette og andre genomer, bruges til at specificere den lineære rækkefølge – sekvensen – af aminosyrer til hvert protein, som organismen laver. Som beskrevet i kapitel 3 dikterer aminosyresekvensen igen, hvordan hvert protein foldes for at give et molekyle med en karakteristisk form og kemi. Når et bestemt protein fremstilles af cellen, skal den tilsvarende region i genomet derfor afkodes nøjagtigt. Yderligere information, der er kodet i genomets DNA, angiver præcis, hvornår i en organismes liv og i hvilke celletyper hvert gen skal udtrykkes til protein. Da proteiner er cellernes vigtigste bestanddele, bestemmer afkodningen af genomet ikke blot cellernes størrelse, form, biokemiske egenskaber og adfærd, men også de særlige kendetegn ved hver enkelt art på Jorden.
Figur 6-1
Skematisk afbildning af en del af kromosom 2 fra frugtfluen Drosophila melanogaster’s genom. . Denne figur repræsenterer ca. 3 % af det samlede Drosophila-genom, arrangeret som seks sammenhængende segmenter. Som opsummeret i nøglen er den symbolske (mere…)
Man kunne have forudsagt, at den information, der findes i genomerne, ville være ordnet på en ordentlig måde, som ligner en ordbog eller en telefonbog. Selv om genomerne i nogle bakterier synes at være ret velorganiserede, er genomerne i de fleste flercellede organismer, som f.eks. vores Drosophila-eksempel, overraskende uordentlige. Små bidder af kodende DNA (dvs. DNA, der koder for proteiner) er spredt ud over store blokke af tilsyneladende meningsløs DNA. Nogle dele af genomet indeholder mange gener, mens andre dele helt mangler gener. Proteiner, der arbejder tæt sammen i cellen, har ofte deres gener placeret på forskellige kromosomer, og nabogener koder typisk for proteiner, der ikke har meget med hinanden at gøre i cellen. Afkodning af genomer er derfor ikke nogen enkel sag. Selv ved hjælp af kraftige computere er det stadig vanskeligt for forskerne at lokalisere genernes begyndelse og slutning i DNA-sekvenserne i komplekse genomer og endnu mindre at forudsige, hvornår de enkelte gener kommer til udtryk i organismens liv. Selv om DNA-sekvensen af det menneskelige genom er kendt, vil det sandsynligvis tage mindst et årti at identificere hvert enkelt gen og bestemme den præcise aminosyresekvens for det protein, som det producerer, før mennesker kan identificere det. Alligevel gør cellerne i vores krop dette tusindvis af gange i sekundet.
DNA’et i genomerne styrer ikke selv proteinsyntesen, men bruger i stedet RNA som et mellemliggende molekyle. Når cellen har brug for et bestemt protein, kopieres nukleotidsekvensen i den relevante del af det enormt lange DNA-molekyle i et kromosom først til RNA (en proces, der kaldes transkription). Det er disse RNA-kopier af DNA-segmenter, der anvendes direkte som skabeloner til at lede syntesen af proteinet (en proces, der kaldes translation). Strømmen af genetisk information i cellerne går derfor fra DNA til RNA til protein (figur 6-2). Alle celler, fra bakterier til mennesker, udtrykker deres genetiske information på denne måde – et princip, der er så grundlæggende, at det betegnes som det centrale dogme i molekylærbiologien.
Figur 6-2
Vejledningen fra DNA til protein. Strømmen af genetisk information fra DNA til RNA (transkription) og fra RNA til protein (translation) finder sted i alle levende celler.
På trods af det centrale dogmes universalitet er der vigtige variationer i den måde, hvorpå informationen flyder fra DNA til protein. Den vigtigste af disse er, at RNA-transskriptioner i eucaryote celler er underlagt en række behandlingstrin i kernen, herunder RNA-splejsning, før de får lov til at forlade kernen og blive oversat til protein. Disse behandlingstrin kan ændre et RNA-molekyls “betydning” på afgørende vis og er derfor afgørende for at forstå, hvordan eucaryote celler læser genomet. Endelig kan vi, selv om vi i dette kapitel fokuserer på produktionen af de proteiner, som genomet koder for, se, at for nogle gener er RNA det endelige produkt. Ligesom proteiner folder mange af disse RNA’er sig i præcise tredimensionelle strukturer, der har strukturelle og katalytiske roller i cellen.
Vi begynder dette kapitel med det første skridt i afkodningen af et genom: transkriptionsprocessen, hvorved et RNA-molekyle produceres fra et gens DNA. Vi følger derefter dette RNA-molekyls skæbne gennem cellen og slutter, når et korrekt foldet proteinmolekyle er blevet dannet. I slutningen af kapitlet overvejer vi, hvordan det nuværende, ret komplekse system af informationslagring, transkription og oversættelse kan være opstået af enklere systemer i de tidligste stadier af den cellulære evolution.