Estante
Só quando a estrutura do DNA foi descoberta no início dos anos 50 é que ficou claro como a informação hereditária nas células é codificada na sequência de nucleótidos do DNA. O progresso desde então tem sido espantoso. Cinquenta anos depois, temos sequências genómicas completas para muitos organismos, incluindo humanos, e portanto sabemos a quantidade máxima de informação que é necessária para produzir um organismo complexo como nós. Os limites da informação hereditária necessária para a vida limitam as características bioquímicas e estruturais das células e deixam claro que a biologia não é infinitamente complexa.
Neste capítulo, explicamos como as células decodificam e usam a informação em seus genomas. Veremos que muito já foi aprendido sobre como as instruções genéticas escritas em um alfabeto de apenas quatro “letras” – os quatro diferentes nucleotídeos no DNA – direcionam a formação de uma bactéria, uma mosca da fruta ou um humano. No entanto, ainda temos muito a descobrir sobre como a informação armazenada no genoma de um organismo produz mesmo a mais simples bactéria unicelular com 500 genes, e muito menos sobre como ela dirige o desenvolvimento de um humano com aproximadamente 30.000 genes. Uma enorme quantidade de ignorância permanece; muitos desafios fascinantes esperam, portanto, a próxima geração de biólogos celulares.
Os problemas que as células enfrentam na descodificação dos genomas podem ser apreciados considerando uma pequena porção do genoma da mosca da fruta Drosophila melanogaster (Figura 6-1). Muita da informação codificada com DNA presente neste e em outros genomas é usada para especificar a ordem linear – a seqüência de aminoácidos para cada proteína que o organismo produz. Como descrito no Capítulo 3, a sequência de aminoácidos, por sua vez, dita como cada proteína dobra para dar uma molécula com uma forma e química distintas. Quando uma determinada proteína é feita pela célula, a região correspondente do genoma deve, portanto, ser descodificada com precisão. Informações adicionais codificadas no DNA do genoma especificam exatamente quando na vida de um organismo e em que tipos celulares cada gene deve ser expresso em proteína. Como as proteínas são os principais constituintes das células, a decodificação do genoma determina não apenas o tamanho, forma, propriedades bioquímicas e comportamento das células, mas também as características distintivas de cada espécie na Terra.
Figure 6-1
Representação esquemática de uma porção do cromossomo 2 do genoma da mosca da fruta Drosophila melanogaster. . Este número representa aproximadamente 3% do genoma total de Drosophila, dispostos em seis segmentos contíguos. Como resumido na chave, o simbólico (mais…)
Uma pessoa poderia ter previsto que a informação presente nos genomas seria disposta de forma ordenada, assemelhando-se a um dicionário ou a uma lista telefónica. Embora os genomas de algumas bactérias pareçam bastante bem organizados, os genomas da maioria dos organismos multicelulares, como o nosso exemplo de Drosophila, são surpreendentemente desordenados. Pequenos pedaços de DNA codificador (ou seja, DNA que codifica as proteínas) são intercalados com grandes blocos de DNA aparentemente sem sentido. Algumas secções do genoma contêm muitos genes e outras carecem de genes no seu conjunto. Proteínas que trabalham próximas umas das outras na célula frequentemente têm seus genes localizados em cromossomos diferentes, e genes adjacentes tipicamente codificam proteínas que têm pouco a ver umas com as outras na célula. A descodificação dos genomas não é, portanto, uma questão simples. Mesmo com a ajuda de computadores poderosos, ainda é difícil para os pesquisadores localizar definitivamente o início e o fim dos genes nas sequências de DNA de genomas complexos, muito menos prever quando cada gene é expresso na vida do organismo. Embora a seqüência de DNA do genoma humano seja conhecida, provavelmente levará pelo menos uma década para que os humanos identifiquem cada gene e determinem a seqüência precisa de aminoácidos da proteína que ele produz. No entanto as células do nosso corpo fazem isso milhares de vezes por segundo.
O DNA nos genomas não direciona a síntese protéica em si, mas usa o RNA como uma molécula intermediária. Quando a célula precisa de uma determinada proteína, a seqüência nucleotídica da porção apropriada da molécula de DNA imensamente longa em um cromossomo é primeiro copiada para o RNA (um processo chamado transcrição). São estas cópias de RNA de segmentos do DNA que são usadas diretamente como modelos para direcionar a síntese da proteína (um processo chamado de tradução). O fluxo de informação genética nas células é, portanto, do DNA para o RNA para a proteína (Figura 6-2). Todas as células, desde bactérias até seres humanos, expressam sua informação genética desta forma – um princípio tão fundamental que é denominado o dogma central da biologia molecular.
Figure 6-2
O caminho do DNA para a proteína. O fluxo de informação genética do DNA para o RNA (transcrição) e do RNA para a proteína (tradução) ocorre em todas as células vivas.
Apesar da universalidade do dogma central, existem variações importantes na forma como a informação flui do DNA para a proteína. O principal delas é que as transcrições do RNA em células eucarióticas estão sujeitas a uma série de etapas de processamento no núcleo, incluindo a emenda do RNA, antes que seja permitida a saída do núcleo e a sua tradução em proteínas. Essas etapas de processamento podem mudar criticamente o “significado” de uma molécula de RNA e, portanto, são cruciais para entender como as células eucarióticas lêem o genoma. Finalmente, embora nos concentremos na produção das proteínas codificadas pelo genoma neste capítulo, vemos que para alguns genes o RNA é o produto final. Como as proteínas, muitos destes RNAs dobram em estruturas tridimensionais precisas que têm papéis estruturais e catalíticos na célula.
Começamos este capítulo com o primeiro passo na decodificação de um genoma: o processo de transcrição pelo qual uma molécula de RNA é produzida a partir do DNA de um gene. Seguimos então o destino desta molécula de RNA através da célula, terminando quando uma molécula de proteína corretamente dobrada tiver sido formada. No final do capítulo, consideramos como o esquema atual, bastante complexo, de armazenamento de informação, transcrição e tradução pode ter surgido a partir de sistemas mais simples nos estágios iniciais da evolução celular.