home
sabelotodo
logo
entrar
comentario
colaborar


El código en el ADN

Los patrones hereditarios de Mendel habían establecido con claridad que los organismos que nacen reciben de los padres lo que él llamó "factores" (y que ahora conocemos como genes) que determinan los rasgos de la nueva vida. Ante este hecho innegable los investigadores se dieron a la tarea de averiguar donde estaban "almacenados" tales genes y el resultado de las investigaciones arrojó que la molécula en la que estaba contenida la información genética era el ácido desoxirribonucleico o ADN alojado en el interior de cada célula en los organismos procariotas o dentro del núcleo celular en los eucariotas. Faltaba, para completar el rompecabezas, la respuesta a la pregunta ¿cómo los genes descritos por Mendel se relacionan con el ADN?

La primera pista en el asunto surge como una especulación en 1902 del médico británico Archibald Garrod que trabajaba con uno de los primeros genetistas mendelianos, su coterráneo William Bateson. Este galeno había observado que algunas enfermedades en sus pacientes parecían ser más comunes en ciertas familias, y del análisis de los ancestros de los miembros de estas familias pudo darse cuenta que algunas de tales enfermedades se comportaban como si fueran el resultado de alelos recesivos surgidos de cambios en la información hereditaria en alguno de los miembros ancestrales de esas familias.

Entre las varias enfermedades analizadas por Garrod estaba la alcaptonuria en la que los pacientes contienen en su orina el ácido homogentísico, una sustancia que se oxida rápidamente al exponerse al aire y se torna negra, dándole ese mismo color a la orina. Como en el individuo normal este ácido se descompone en sustancias más simples, Garrod asumió que en los pacientes con alcaptonuria no debía existir la enzima que lleva a cabo la descomposición, y además especuló que en otras enfermedades heredadas, el factor desencadenante debía ser el mismo, la falta o deficiencia de una enzima.

Las evidencias indicadas por Garrod no tardaron en convertirse en la creencia de que la información contenida en los cromosomas del ADN sirve para producir enzimas especificas. Tal creencia se mantuvo como especulación más o menos fundada hasta 1941 fecha en la cual un grupo de experimentos sostenidos por los genetistas George Beadle y Edward Tatum proporcionaron la evidencia definitiva.

Beadle y Tatum tomaron como modelo para sus experimentos el moho del pan Neurospora, un hongo que puede crecer en cultivo usando un medio formado por una mezcla de sustancias simples y conocidas. Los investigadores expusieron las esporas del hongo a rayos X con la esperanza de que la alta energía de estos rayos ocasionara daños en el ADN de algunas de ellas que condujeran a la falta de habilidad para la síntesis de sustancias que eran esenciales para su crecimiento normal. Para probar si esto había ocurrido tomaron las esporas irradiadas y las cultivaron en un medio con todos los nutrientes que necesitaban para crecer hasta que las poblaciones de hongos se establecieran. Luego, tomaron esporas de las poblaciones establecidas y las colocaron a crecer en un medio carente de sustancias que normalmente el moho crea, es decir, en un medio con aquellas sustancias mínimas que permitían crecer a las esporas naturales. Se esperaba que las esporas que hubieran perdido la capacidad de sintetizar sustancias necesarias para el crecimiento no podrían sobrevivir en el medio mínimo, y así fue. Por este método los investigadores lograron identificar y aislar varias cepas de Neurospora con deficiencias de crecimiento.

Para determinar cuáles sustancias los organismos con deficiencias de crecimiento no podían sintetizar fueron suplementando el medio mínimo en que se encontraban con diversos agentes químicos en un intento por encontrar alguno de estos agentes que permitiera a los mutantes crecer, y con ello localizar con exactitud la naturaleza de la deficiencia bioquímica.

Una de las sustancias agregadas que permitió crecer a varias cepas deficientes fue la arginina, (uno de los amino ácidos que forma parte de las proteínas naturales) y que se abrevia como arg. Al analizar los cromosomas de los organismos deficientes Beadle y Tatum lograron detectar que las mutaciones (cambios en el cromosoma) se localizaban en tres zonas del cromosoma.

La ruta bioquímica de síntesis de la arginina

figura 1
Figura 1. Vía bioquímica de la producción de la arginina.

La arginina se sintetiza partiendo del glutamato (un amino ácido que los organismos normalmente pueden sintetizar partiendo de otros compuestos) utilizando una serie de cuatro eventos enzimáticos que van generando compuestos intermedios como se muestra en la figura 1. Cada uno de los eventos está catalizado por una de las enzimas que en la figura 1 están denominadas con letras de la E a la H.

Para cada enzima de la ruta bioquímica de síntesis de la arginina, Beadle y Tatum pudieron aislar una cepa mutante con una forma defectuosa de esa enzima, y la mutación siempre estaba localizada en uno o unos pocos sitios específicos del cromosoma, y más importante aun, ellos determinaron que era un sitio diferente para cada enzima. Por lo tanto, cada uno de los mutantes examinados tenía el defecto en una de la enzimas causado por una mutación en un sitio individual del cromosoma. De este hecho Beadle y Tatum concluyeron que los genes se comportan como unidades funcionales dentro del ADN y producen sus efectos al especificar la estructura de enzimas, y que cada uno de los genes codifica la estructura de una enzima. Ellos llamaron a este vínculo la hipótesis de un gen/una enzima. Como muchas enzimas contienen múltiples sub-unidades de proteínas (polipéptidos), y cada una de las cuales está codificada por un gen, la hipótesis a venido a llamarse un gen/un polipéptido.

Toda la gran diversidad de procesos bioquímicos en los seres vivos están catalizados por enzimas, estas sustancias median la producción de los ácidos nucleicos, las proteínas, los carbohidratos y los lípidos, de modo que al codificar la estructura de las enzimas y de otras proteínas, el ADN especifica la estructura del organismo en su conjunto. Como veremos más adelante al describir como funcionan los genes, la simple relación un gen/un polipéptido no aplica para todos los casos.

Las proteínas son complejas


Los experimentos de Beadle y Tatum establecieron claramente el vínculo entre los genes y la síntesis de proteínas, pero la forma en la que se llevaba a cabo el proceso era desconocida, ¿qué tipo de código contenían los genes que podía especificar una sustancia tan compleja como una proteína? La complejidad de las proteínas era tal que su estructura parecía ser imposible de determinar.

Más de 10 años después del establecimiento de la hipótesis de un gen/una enzima, el bioquímico inglés Frederick Sanger en 1953, después de varios años de trabajo dio un giro al asunto al anunciar que había desentrañado la secuencia completa de amino ácidos en la proteína insulina, una hormona pequeña. Esta primera determinación de la secuencia de amino ácidos en una proteína fue radicalmente importante debido a que mostraba que las proteínas tenían una secuencia definida de amino ácidos, esto es, cada molécula de insulina siempre estaba formada por la misma secuencia de amino ácidos. Los trabajos de Sanger pronto condujeron a la determinación de la secuencia de otras proteínas con lo que quedó claro que todas las enzimas, y el resto de las proteínas, son cadenas de amino ácidos arreglados en un orden definido. Esta "regularidad" en la estructura indica que para especificar una proteína en particular solo se debe contar con un código que establezca un listado ordenado de amino ácidos.

Esta "lista" está implícita en el orden en que están colocados los nucleótidos en una región particular del cromosoma. Y a la secuencia de nucleótidos que determinan la secuencia de amino ácidos que dan lugar a una proteína se le llama un gen. Aunque la mayoría de los genes codifican proteínas o sub-unidades de proteínas, algunos están consagrados a producir formas especiales de ARN, las que a su vez, con frecuencia, participan en la síntesis de proteínas.

Pero aun faltan dos cuestiones cruciales por definir, la primera es: ¿dónde se producen la proteínas? y la segunda: ¿cómo es que el orden de los nucleótidos en la molécula de ADN tiene codificada la información que especifica el orden de los amino ácidos para un polipéptido?

La fábrica de las proteínas

Experimentos llevados a cabo usando amino ácidos marcados con radio actividad en un medio en el que se han colocado células por breve tiempo han permitido a estas tomar tales amino ácidos e incorporarlos a las proteínas que fabrican. Cuando se detecta en que lugar aparecen primero las proteínas radioactivas en la célula se observa que no es en el núcleo, donde se encuentra el ADN, si no en el citoplasma en unos grandes agregados de ARN-proteínas llamados ribosomas.

Los ribosomas constituyen las "fábricas" de proteínas y su estructura es sumamente compleja y compuesta por dos sub-unidades, una pequeña y otra grande cada una de las cuales esta a su vez formada por proteínas y ARN. La sub-unidad pequeña tiene unas 20 proteínas y una hebra de ARN, mientras que la grande contiene más de 30 proteínas y dos hebras de ARN.

El tipo de ARN "nativo" del ribosoma se denomina ARN ribosómico o ARNr y proporciona el sitio donde se ensamblan los polipéptidos durante su síntesis. Además del ARNr, en la célula pueden estar otros dos tipos de ARN vinculados al ribosoma:

1.- El ARN de transferencia o transporte (ARNt): encargado de transportar los amino ácidos hasta el ribosoma para su uso en la confección de polipéptidos, y además ubicar cada uno de los amino ácidos en el lugar adecuado en la cadena polipéptida en crecimiento.

2.-El ARN mensajero (ARNm): que son moléculas de ARN formadas por largas cadenas que pueden considerarse a groso modo como copias o transcripciones de secciones del ADN, y que viajan al ribosoma para dictar con exactitud cuales amino ácidos y en qué orden se ensamblan en una proteína.

¿Cómo el ADN especifica el orden de amino ácidos en los polipéptidos?

Comencemos por decir que todos los organismos, desde los más simples hasta los más complejos, utilizan el mismo mecanismo básico para "leer" y expresar los genes como proteínas. Este mecanismo básico es tan fundamental para la vida que comúnmente se le denomina el dogma central. En este mecanismo la información pasa primero de los genes (ADN) a una copia en ARN de los genes y luego esta copia de ARN dirige la síntesis de las proteínas al dictar la secuencia de amino ácidos de la cadena proteica.

Si tratamos de describir resumidamente el dogma central podemos decir que está formado por dos etapas principales:

1.- La transcripción: que es la primera fase de la transferencia, como secuencia de amino ácidos en las proteínas, de la secuencia de nucleótidos en los genes. En ella se produce una copia de los genes a ARNm, es decir, la información contenida en el ADN como una secuencia de nucleótidos se transcribe a una secuencia de nucleótidos en ARN.

2.- La traducción: en esta segunda etapa se transfiere la información trascripta en el ARNm a la proteína durante la síntesis de esta en el ribosoma. Ahora la secuencia de nucleótidos en el ARN se traduce a secuencia de amino ácidos en el polipéptido.

Echemos una mirada ahora con más detalles al dogma central, pero antes de hacerlo necesitamos saber como está formado el código genético.

El código genético

Francis Crick y su equipo de investigadores en 1961, a través de una serie de experimentos, sacaron de la "oscuridad" el código genético en uno de los resultados más trascendentales de la ciencia. Ellos razonaron que lo más probable era que el código genético consistiera en una serie de bloques de información que llamaron codones, cada uno de los cuales era correspondiente a uno de los amino ácidos en el código que conduce a la proteína. Yendo más allá, sostuvieron la hipótesis de que la información en el codón probablemente estaba formada por la secuencia de tres nucleótidos y que esta era la que especificaba un amino ácido en particular. El número tres surge de un razonamiento relativamente simple: la secuencia no podía ser de dos nucleótidos debido a que la cantidad de combinaciones que podían lograrse usando parejas de los cuatro nucleótidos del ADN (G, C, T, y A) o del ARN (G, C, U, y A) era de 16 (42), mientras los amino ácidos diferentes que usualmente forman las proteínas son 20. Pero si el código incluía una secuencia de tres nucleótidos, entonces la cantidad de combinaciones era de 43 = 64, cantidad más que suficiente para especificar los 20 amino ácidos.


Si asumimos como cierto que la unidad en el código genético es un triplete de nucleótidos (codón), el primer nucleótido leíble o nucleótido de inicio en un gen define como se lee el primer codón y los subsiguientes, estableciendo con ello lo que se conoce como marco de lectura. Por ejemplo, la secuencia de nucleótidos GGGAAACCC si se lee partiendo de la primera posición contiene los codones GGG, AAA y CCC; si se lee partiendo de la segunda posición entonces contiene los codones GGA y AAC; pero si se lee partiendo de la tercera posición los codones son GAA y ACC. Lo que implica, según la hipótesis de Crick, que la secuencia de amino ácidos en la proteína resultante puede ser diferente de acuerdo al marco de lectura utilizado, e incluso, que condujera a codones incompletos sin sentido, no representativos de algún amino ácido. De la misma forma podía ser posible, que alternativamente a la lectura continua de los nucleótidos, existiera otra forma de lectura con nucleótidos "separadores" entre los codones en similitud a los espacios que se colocan entre las palabras de una frase.

Para buscar la respuesta a estas inquietudes, en sus experimentos Crick y sus colegas usaron sustancias químicas para eliminar uno, dos, o tres nucleótidos en la molécula de ADN de un virus. Cuando se eliminaban uno o dos nucleótidos cercanos en el ADN, los mutantes producidos no generaban proteínas funcionales debido a que al eliminar un nucleótido (o dos cercanos) se desplaza el marco de lectura y los codones que se leen en el gen a continuación de las eliminaciones no codifican para alguno de lo amino ácidos de la proteína en cuestión. Sin embargo, cuando se eliminaban tres nucleótidos el marco de lectura correcto se restablecía y la secuencia a partir de las eliminaciones podían trascribirse adecuadamente. Ellos obtuvieron los mismos resultados cuando agregaban uno, dos o tres nucleótidos al ADN. Estos resultados no pudieron haberse obtenido si los codones estaban separados por nucleótidos que funcionaran como signos de puntuación. La conclusión final a la que llegaron los investigadores fue que:

El código genético se lee en incrementos consistentes de tres nucleótidos y que tal lectura se hace de forma continua sin signos separadores entre las unidades de tres nucleótidos.

La situación descrita se ilustra a continuación en las figuras 2 y 3. Para elaborar las figuras 2 y 3 hemos utilizado un símil entre un presunto gen y una frase formada por palabras de tres letras que representan los codones del gen. La frase en cuestión es "Ese día dar pan con sal del mar les fue mal" y en ella cada palabra de tres letras tiene un sentido literal cierto y representa un codón que puede codificar un amino ácido que forma parte de la proteína especificada por el gen.

figuira 2

Figura 2. Aquí se representa la hipoteis 1 en la que no se usan signos de puntuación (nucleótidos separadores de los codones).


figura 3

Figura 3. Hipótesis 2 la misma frase con el uso de signos de puntuación representados por la letra azul B
.

En la figura 2 aparece el "gen" con todos los codones escritos de forma continua sin puntuación separadora y por lo tanto de esa misma forma se transcriben al ARNm; por su parte, en la figura 3 se ha colocado un nucleótido que representa el separador entre los codones y que no se copia al ARNm según la segunda hipótesis. El separador es un nucleótido que hemos representado como B y marcado en azul.

Analicemos cada figura por separado:

Figura 2: Note en la parte alta de la figura 2 que se ha eliminado solo un nucleótido, el marcado como R. Esta eliminación desplaza el marco de lectura, y los codones quedan entonces como se muestra, todos los posteriores a la eliminación indican palabras sin sentido. En la parte baja de la misma figura se han eliminado tres nucleótidos, el R el N y el A, y la situación cambia radicalmente, solo pierden el sentido las palabras contenidas entre las eliminaciones, pero a continuación de ellas se restablece el marco de lectura correcto y las próximas palabras tienen sentido. En resumen, el código genético que define el amino ácido que se agrega a la cadena que forma la proteína es un triplete de nucleótidos leídos de forma continua en el gen.

Figura 3: En esta figura se ha colocado una B representativa cada tres letras (un codón) del presunto signo de puntuación que no se lee. Si se elimina un nucleótido, el R, como se muestra en la parte alta de la figura, de la misma forma que antes las palabras posteriores a la eliminación pierden el sentido al desplazarse el marco de lectura, ahora otros nucleótidos diferentes al B se convierten en los signos de puntuación al quedar ubicados cada tres letras, y el nucleótido B entra a formar parte de las nuevas palabras generadas. Si analizamos la parte baja de la figura 3 en la que se han eliminado tres nucleótidos la situación no se arregla como en la figura 2, y de todas formas las palabras posteriores a las eliminaciones son también sin sentido. La conclusión a la que se llega en la figura 3 es que no pueden existir signos de puntuación entre las palabras (codones) de modo que los codones se leen de forma continua sin pausas entre los nucleótidos.

Se descifra el código genético

Muy pronto, después de los trabajos de Crick, en el plazo de un año, otros investigadores tuvieron éxito en la determinación de cuales amino ácidos se especificaban en cada unidad de tres nucleótidos:

1.- Marshall Niremberg descubre en 1961 que el triplete UUU especifica el amino ácido fenilalanina.

2.- En 1964 el mismo Niremberg junto a Philip Leder determina las especificaciones de amino ácidos de otras 47 de las 64 combinaciones de tripletes.

3.- Por último Har Gobind Khorana descifra los 17 restantes tripletes, de modo que todas las 64 combinaciones posibles quedan resueltas y el código genético estaba completo (tabla 1).

Tabla 1. El código genético

Primer
nucleótido

Segundo
nucleótido

Tercer
nucleótido


U



U

C

A

G

UUU
Fenilalanina
UCU
Serina
UAU
Tirosina
UGU
Cisteína
UUC
Fenilalanina
UCC
Serina
UAC
Tirosina
UGC
Cisteína
UUA
Leucina
UCA
Serina
UAA
Parar1
UGA
Parar1
UUG
Leucina
UCG
Serina
UAG
Parar1
UGG
Triptófano

U
C
A
G
C



CUU
Leucina
CCU
Prolina
CAU
Histidina
CGU
Arginina
CUC
Leucina
CCC
Prolina
CAC
Histidina
CGC
Arginina
CUA
Leucina
CCA
Prolina
CAA
Glutamina
CGA
Arginina
CUG
Leucina
CCG
Prolina
CAG
Glutamina
CGG
Arginina
U
C
A
G
A



AUU
Isoleucina
ACU
Treonina
AAU
Asparagina
AGU
Serina
AUC
Isoleucina
ACC
Treonina AAC
Asparagina
AGC
serina
AUA
Isoleucina
ACA
Treonina AAA
Licina
AGA
Arginina
AUG
Metionina; Inicio2 ACG
Treonina AAG
Licina
AGG
Arginina
U
C
A
G
G



GUU
Valina
GCU
Alanina
GAU
Aspartato
GGU
Glicina
GUC
Valina
GCC
Alanina GAC
Aspartato
GGC
Glicina
GUA
Valina
GCA
Alanina GAA
Glutamato
GGA
Glicina
GUG
Valina GCG
Alanina GAG
Glutamato
GGG
Glicina
U
C
A
G
1 Estos codones no codifican para algún amino ácido, su función es la de indicar el lugar donde termina la lectura del gen.
2 Este codón además de codificar para el amino ácido metionina, sirve como señal del lugar donde comienza la lectura del gen.

El mismo código para todos

El código genético mostrado en la tabla 1 ha sido encontrado igual en casi todos los organismos, y esta universalidad es una evidencia más de que todos los seres vivos comparten un mismo patrimonio evolutivo. Debido a que el código genético es universal, lo mismo una bacteria que un ser humano interpretan de la misma manera y traducen a la misma proteína una secuencia de nucleótidos (codones) contenidos en un gen. De tal hecho se desprende que si transferimos un gen de un organismo a otro, el ARNm del nuevo anfitrión puede sin dificultad dirigir la elaboración de la proteína funcional codificada en el gen, y esta cualidad es crucial para muchos de los avances en ingeniería genética al poder producir muchas bio-sustancias utilizando este método. Por ejemplo, la insulina del mercado denominada insulina humana, usada para controlar la diabetes, se manufactura en diminutas fábricas logradas al implantar genes humanos en bacterias, las cuales pueden producir grandes cantidades de esta proteína.

Lo universal no es tan universal


La determinación de que casi todos los organismos vivos utilizan el mismo código genético hizo que esto se hiciera muy familiar a los biólogos, los que contaban con un código "aplicable a todo", sin embargo, lo universal no era tan universal. En 1979 un grupo de investigadores se dan a la tarea de determinar el código genético de los orgánulos que poseen su propio ADN y encontraron una sorpresa. En el código genético utilizado por las mitocondrias de los mamíferos el codón UGA, que normalmente se interpreta como "fin del gen", se lee como el amino ácido triptófano; UGA se lee como metionina en lugar de isoleucina; y AGA y AGG se leen como "fin del gen" en lugar de arginina. Asimismo, se han encontrado otras diferencias menores con respecto al código universal en los genomas (conjunto de genes) de los cloroplastos y ciertos tipos de protistas.

El proceso de producción de polipéptidos

La expresión de los genes comienza con la generación de una copia en ARN de la secuencia del ADN que contiene el código del gen y que se denomina transcripción como ya hemos apuntado arriba, luego en una segunda etapa la información trascripta al ARN se convierte en una secuencia de amino ácidos que forman el polipéptido lo que se conoce como traducción. En esta parte del artículo describiremos algunos detalles de ambos procesos.

Transcripción

Nos enfocaremos primero en los organismos procariotas cuyo proceso general está mejor entendido.

Transcripción en procariotas

La transcripción de la secuencia de nucleótidos del ADN al ARN está gobernada por la enzima ARN polimerasa que es grande y compleja estructuralmente, y contiene 5 sub-unidades. Dos sub-unidades α se unen a proteínas reguladoras, una sub-unidad β' se enlaza con la plantilla de ADN, una sub-unidad β se ancla a las sub-unidades de nucleósidos? del ARN, y una sub-unidad σ que reconoce el punto de inicio de la copia denominado promotor e inicia la síntesis. Durante la transcripción solo se transcribe (se copia) uno de los cordones del ADN, denominado cordón plantilla o cordón molde mientras el otro cordón, llamado cordón codificador, le permite a la ARN polimerasa durante la síntesis del ARN "leer"  las bases complementarias de este cordón codificador para agregarlas a la molécula de ARN en formación hasta terminar una copia del cordón plantilla con la secuencia complementaria de nucleótidos, aunque en el ARN la timina contenida en el ADN se sustituye por uracilo.

figura 4
Figura 4. Iniciación de la transcripción por
la sub-unidad
σ.

En los procariotas, la hebra de ARN crece agregando ribonucleótidos al extremo 3' de la cadena, trabajo que ejecuta la polimerasa sin necesidad de cebador (a diferencia con la réplica del ADN), de modo que la cadena crece en la dirección 5' a 3' de la misma forma que en la réplica del ADN.

Para comenzar la transcripción, la ARN polimerasa se une a lugares específicos en el cordón codificador del ADN que se les llama promotores, los que son una secuencia de nucleótidos corta cuya auto-transcripción no se ejecuta por la ARN polimerasa. Uno de estos lugares promotores en una gran parte de las bacterias está formada por dos secuencias de seis bases: una TTGACA ubicada 35 nucleótidos más adelante del sitio de comienzo de la transcripción (llamada secuencia −35) y otra TATAAT, localizada 10 nucleótidos adelante de la posición en la que arranca la transcripción (llamada secuencia −10). Vea la figura 4 superior.

Aunque en realidad el proceso de transcripción sucede de forma continua, resulta práctico para la explicación y comprensión dividirlo en diferentes etapas como se describe a continuación.

Iniciación

En los procariotas, una sub-unidad de la ARN polimerasa, la  σ, reconoce la secuencia −10 en el promotor y ancla allí a la ARN polimerasa sin tener que desenrollar la hélice de ADN. Después que se realiza la primera etapa de unión al promotor, la ARN polimerasa inicia la transcripción comenzando por desenrollar una región de una longitud de unos 17 pares de bases de la hélice de ADN (figura 4 inferior) preparando de esta forma el camino para ensamblar la cadena de ARN.

Elongación

La elongación es el proceso de crecimiento de la cadena de nucleótidos que van conformando al ARNm producto de la transcripción del ADN.

figura 5
Figura 5. Esquema de la burbuja de transcripción.

En los procariotas, la transcripción de la cadena de ARNm usualmente comienza con ATP o GTP, uno de ambos constituye el extremo 5' de la cadena, la que crece en la dirección 5' a 3' a medida que se agregan ribonucleótidos. La región que incluye ARN polimerasa, ADN, y ARN en crecimiento se conoce como burbuja de transcripción, en plena referencia a la "burbuja" que representa la zona de la hélice de ADN que ha sido desenvuelta (vea la figura 5).

Durante al transcripción, las primeras 12 bases incluidas en el cordón de ARN que se sintetiza forman una hélice temporal con el cordón plantilla de ADN para estabilizar la posición del extremo 3' del ARN y con ello mantenerlo interactuando con los nuevos ribonucleótidos que se incorporan a la cadena. La hélice híbrida que se forma de ADN-ARN va rotando a medida que se incorporan los ribonucelótidos para que el extremo 3' esté siempre en la zona de catálisis.

La burbuja de transcripción de desplaza a lo largo del ADN bacterial a una tasa constante (unos 50 nucleótidos por segundo), de esta forma el tramo formado del cordón de ARN se va quedando fuera de la burbuja. Cuando la burbuja adelanta, el ADN saliente se rebobina a medida que abandona la burbuja.

Terminación

El crecimiento de la cadena de ARN se logra a expensas de la formación de enlaces fofodiéster que unen a los nucleótidos uno tras otro (vea el artículo Estructura del ADN) y esta formación cesa cuando se encuentra una secuencia que funciona como "parar" al final del gen, provocando que se disocie la hélice híbrida ADN-ARN dentro de la burbuja, se libere la ARN polimerasa del ADN y que se rebobine el ADN que está dentro de la burbuja haciendo que esta desaparezca. Son variadas las secuencias que indican parar, la más simple es una serie de pares de bases G-C seguidas de una serie de pares de bases A-T.

Transcripción en eucariotas

Aunque en esencia la transcripción en los organismos eucariotas es la misma que en los procariotas descritos anteriormente, existen varias diferencias importantes que consideraremos a continuación. Tenga presente que el proceso de transcripción se realiza en este caso dentro del núcleo de la célula.

Diferencias catalíticas

La primera diferencia a considerar es que en los eucariotas no es una sola, si no son tres, las ARN polimerasas presentes en el núcleo que participan, y que se distinguen tanto en estructura como en funcionalidad.

La ARN polimerasa I: está especializada en transcribir ARNr (ARN ribosómico) y reconoce a los promotores que son únicos a esa enzima.

La ARN polimerasa II: se especializa en producir ARNm y algunos otros ARN pequeños del núcleo.

La ARN polimerasa III: que transcribe ARNt (ARN de transporte) y otros ARN pequeños y también tiene sitios promotores específicos.

Diferencias en los promotores y la iniciación

Los promotores en los organismos eucariotas son bastante diferentes a los procariotas, por ejemplo, la ARN polimerasa I al parecer utiliza promotores que son específicos para cada especie y por ello no se puede hablar en términos generales de estos promotores. Una situación algo similar sucede con la ARN polimerasa III cuyos promotores son internos al gen en sí mismo.

La única polimerasa en la cual los promotores recuerdan a los de los procariotas es la polimerasa II, aunque sus promotores son los más complejos de entre las tres polimerasas, probablemente como reflejo de la enorme diversidad de genes que transcribe esta enzima. Un promotor importante para la polimerasa II contiene el núcleo llamado caja TATA (similar a la secuencia del promotor −10 de los procariotas). El inicio de la transcripción transcurre de forma resumida a través de las etapas siguientes:

1.- Un factor de transcripción reconoce y se une a la secuencia de la caja TATA que es parte del corazón del promotor.

2.- Luego se atraen a esta unión otros factores de transcripción y con ello se da inicio a la formación del complejo de transcripción.

3.- Finalmente, la ARN polimerasa II se asocia con los factores de transcripción y con el ADN para dar terminación al complejo de transcripción y la transcripción comienza.

Modificaciones posteriores a la transcripción

Otras diferencias importantes entre la transcripción de los procariotas y los eucariotas se producen después que la ARN polimerasa II ha hecho su trabajo de transcripción del ARNm y antes de que se exporte ya maduro al exterior del núcleo. Las modificaciones que se hacen al ARNm entre la transcripción en el núcleo y su exportación al citoplasma son principalmente:

1.- Se coloca la tapa 5': los eucariotas agregan una estructura especial al extremo 5' del ARNm. Esta estructura se conoce como tapa 5'  y consiste en la adición de GTP metilado al grupo fosfato (PO4) 5' inicial del ARN. El enlace formado 5' a 5' no se encuentra en ninguna otra estructura y es típica de esta tapa 5'. La tapa se agrega cuando la transcripción se está realizando aun. La función de la tapa 5' es la de proteger el extremo 5' del ARNm de la degradación y también está involucrada en el proceso de traducción (figura 6).

2.- Se agrega la cola poli-A 3': Una diferencia notable entre la transcripción de procariotas y eucariotas es que el extremo final del ARNm en los eucariotas no es el extremo que ha resultado del trabajo de la ARN polimerasa II. La transcripción eucariota se secciona en un sitio específico, usualmente con una secuencia AAUAAA que no es el final de la transcripción y otra enzima, la poli-A polimerasa agrega a continuación de este corte una serie de adeninas residuales (unas 200) que se conocen como la cola poli-A 3'.  La cola poli-A parece jugar un papel en el aumento de la estabilidad del ARN (figura 6).


figura 6

Figura 6. Modificaciones posteriores a la transcripción en los eucariotas.



 
Una tercera y trascendental diferencia se refiere al hecho de que la transcripción del gen en los procariotas se hace por un método de "corte y empalme" para dar lugar al ARNm terminado. Esto se tratará con detalles al final del artículo.

Traducción

figura 7
Figura 7. Las dos sub-unidades del
ribosoma
.

Como se ha mencionado antes, la traducción resulta ser el proceso que da lugar al polipéptido en el ribosoma partiendo del código contenido en el ARNm. También mencionábamos que el ribosoma está compuesto por dos sub-unidades, una pequeña y otra grande. Para iniciarse la traducción la sub-unidad pequeña ese acopla en una depresión existente en la superficie de la sub-unidad grande, con lo que queda listo el ribosoma para comenzar a "trabajar". En este conjunto ribosomal se pueden distinguir tres sitios específicos denominados A, P y E (figura 7) que juegan un rol clave en la síntesis de las proteínas como veremos más adelante.

De manera simplificada pero que facilita la comprensión, podemos considerar la síntesis de las proteínas en el ribosoma equivalente a una cadena industrial de ensamblaje. Aquí el ARN ribosómico (ARNr) funciona como la linea de montaje proporcionando el lugar donde se realiza el trabajo de unir todos los elementos para formar el producto; el ARN mensajero (ARNm) trae consigo las especificaciones técnicas que permiten acoplar las partes en el orden y lugar correcto; y el ARN de transporte (ARNt) representa a los obreros que son en definitiva los que colocan las piezas en su sitio y las aseguran allí. De la misma forma que en una cadena de montaje, en la que son necesarios diversos dispositivos y herramientas para poder ejecutar el trabajo, en el ensamblaje de los polipéptidos participan una serie de enzimas y factores químicos indispensables para el éxito de la empresa.

Traducción en los organismos procariotas

La traducción en los procariotas comienza cuando la porción inicial del ARNm se une al ARNr en el ribosoma y se ubica de forma tal que solo uno a la vez de sus codones es "visible" en la zona de síntesis de polipéptidos. A este codón expuesto del ARNm se enlaza una molécula de ARNt que tiene la secuencia complementaria de los tres nucleótidos del codón expuesto, y por ello se denomina anticodón. El ARNt acoplado trae consigo el amino ácido específico al código del codón del ARNm y no otro amino ácido. Resultado de este enlace codón-anticodón, se adiciona a la cadena del polipéptido en crecimiento ese amino ácido específico. A medida que el ARNm se deplaza por el ribosoma, sucesivos codones del ARNm van quedando expuestos y una serie de moléculas de ARNt van transportando y agregando los amino ácidos adecuados en el extremo creciente de la cadena polipéptida. Pero evidentemente no se puede comenzar a edificar el polipéptido partiendo de cualquier codón del ANRm ya que de ser así la proteína resultante podría resultar truncada y no funcional. En su lugar la señal de "comenzar" la brinda un codón de secuencia AUG (que también codifica para el amino ácido metionina). El ribosoma comúnmente utiliza el primer codón AUG que encuentra como la señal de comenzar la traducción. Pero ¿y el final de la traducción? El ARNt no tiene codones complementarios para 3 de los 64 codones: UAA, UAG, y UGA y estos codones resultan ser los codones de terminación o codones de parada funcionando como señal de "parar" dentro del mensaje del ARNm y por ello marcan el final de la cadena polipéptida.

Aunque son 64 los codones diferentes que pueden aparecer en el ARNm, solo existen 45 tipos diferentes de moléculas ARNt y no 64, una para cada codón. La explicación de esta diferencia se desprende de la tabla 1, en ella se puede ver que en diferentes casos, codones distintos codifican para el mismo amino ácido, de modo que ciertos tipos de ARNt pueden reconocer a más de un triplete de nucleótidos (codones), pero siempre agregan a la cadena el mismo amino ácido.

La anexión y transporte de un amino ácido específico por cada ARNt está mediada por enzimas activadoras conocidas como aminoacil ARNt sintetasas, de las que existe una por cada uno de los 20 amino ácidos comunes. Cada una de estas enzimas se corresponde con la secuencia específica del anticodón en la molécula del ARNt y al mismo tiempo a uno de los amino ácidos. La correspondencia de algunas de estas enzimas es con solo uno de los anticodones y por tanto con solo una molécula de ARNt, mientras otras enzimas pueden reconocer dos, tres, cuatro o seis moléculas diferentes de ARNt cada una con un anticodón diferente, pero todos codifican para el mismo amino ácido.

La traducción procariota más de cerca

Al igual que como hicimos en la transcripción, dividiremos el proceso general continuo de la traducción en etapas.

Iniciación

La iniciación en los procariotas (figura 8) comienza al unirse una molécula de un ARNt especial que porta una sustancia conocida como N-formilmetionina (una forma modificada químicamente del amino ácido metionina) que se representa como ARNtfMet a la sub-unidad pequeña del ribosoma, lo que da comienzo a la formación del complejo de iniciación. Ciertas proteínas conocidas como factores de iniciación ubican el ARNtfMet en la superficie del ribosoma en el sitio P que es donde se forman los enlaces péptidos (de ahí la P) que unen los amino ácidos de la futura cadena protéica. En las proximidades del sitio P se forman dos nuevos sitios: el sitio A donde se anclarán los sucesivos ARNt portadores de los amino ácidos subsiguientes, y el sitio E que es donde los ARNt, después de haber aportado sus amino ácidos al polipéptido en formación abandonan el ribosoma (lo de E proviene de la palabra exit que en inglés significa salida). Cuando se ha completado la formación de los sitios P, A y E el complejo de iniciación estará listo.








Figura 8. Formación del complejo de iniciación.

Por otro lado, otros factores de iniciación guían al complejo de iniciación para que se una al anticodón AUG (señal de comienzo de la traducción) del ARNm. La unión en el lugar adecuado entre el complejo de iniciación y el ARNm es decisiva para obtener la posición correcta del ARNm y con ello el marco de lectura apropiado, logrando de este modo que se lean adecuadamente todos los tripletes de nucleótidos sucesivos del ARNm como codones. De la misma forma, es muy importante que el complejo se una con el comienzo de la molécula de ARNm para garantizar que todo el gen transcrito sea traducido. Para lograr este último propósito, en los procariotas, la molécula de ARNm está marcada al comienzo con lo que le llama secuencia líder, que es complementaria a una secuencia de la molécula de ARNr en el ribosoma, lo que asegura que el ARNm sea leído desde el principio.

La iniciación en los eucariotas es similar diferenciándose en dos cuestiones principales:

1.- En los eucariotas el amino ácido de iniciación es metionina en lugar de N-formilmetionina.

2.- El complejo de iniciación es mucho más complicado que el de los procariotas.

Elongación

Una vez elaborado y puesto a punto en el lugar correcto el complejo de iniciación, la unidad grande del ribosoma se agrega, exponiendo el codón adyacente al AUG unido al ARNtfMet del ARNm, con lo que este queda en posición para interactuar con otra molécula de ARNt portadora de amino ácido (figura 9a).








(a)

(b)

(c)

(d)
Figura 9. Esquema del proceso de elongación

A tal codón expuesto se une un ARNt con el triplete complementario asistido por los factores de elongación en el sitio A (figura 9b). El nuevo ARNt que se une al ribosoma coloca su amino ácido justo adyacente al amino ácido inicial (N-formilmetionina) que aun se mantiene ligado a su ARNt anclado al ribosoma. Ambos amino ácidos desarrollan una reacción química catalizada por la unidad grande del ribosoma, en esta reacción la N-formilmetionina inicial se libera de su ARNt y se enlaza al segundo amino ácido a través de un enlace péptido (figura 9c). A partir de aquí se irán agregando nuevos amino ácidos a esta pareja inicial en el proceso que se conoce como translocación.

Translocación


Cuando se forma el enlace péptido entre los dos primeros amino ácidos el ribosoma se desplaza o translocaliza al próximo triplete de nucleótidos, es decir avanza tres nucleótidos en la cadena del ARNm en la dirección 5' a 3' asistido por otros factores de elongación (figura 9d). Al producirse este avance, el ARNt inicial ya vacío llega hasta el sitio E donde es expulsado, y el segundo ARNt con su respectivo amino ácido se mueve hasta el sitio P, con lo que el próximo codón del ARNm queda expuesto en el sitio A. El nuevo codón expuesto es reconocido por otro ARNt con el triplete complementario y portante de un tercer amino ácido formándose una nueva unión en el sitio A codón-anticodón. El tercer amino ácido que llega se coloca igual que antes adyacente a la cadena creciente y esta por una catálisis igual a la anterior se transfiere al nuevo amino ácido alargando la cadena en una unidad. Los desplazamientos subsiguientes del ribosoma a lo largo del ARNm repiten el proceso descrito y la cadena polipéptida se va alargando.

Terminación

El alargamiento de la cadena se sigue realizando por la vía descrita hasta que llega un codón de terminación que no se une a ningún ARNt ya que no existen tales con los tripletes complementarios a los codones de terminación, sin embargo, el codón de terminación si es reconocido por los factores de liberación, proteínas que liberan el nuevo polipéptido formado del ribosoma.

Corte y empalme del ARNm eucariota

Como se describió más arriba en la transcripción y traducción de los genes existe colinealidad entre el gen y la proteína que define, esto es, la secuencia de las bases en el gen corresponde con la de las bases en el ARNm y esta a su vez con la secuencia de amino ácidos en la proteína. Pero cuando hablamos de genes eucariotas esta colinealidad en ocasiones se pierde y los genes tienen secuencias que no están presentes ni en el ARNm ni en la proteína, lo que significa que secciones del gen se "ignoran" y no se transcriben, es decir, son genes interrumpidos. A las secuencias intermedias del gen que no resultan codificadas en el ARNm se les conoce como intrones y las que se codifican como exones (figura 10a). Esta cualidad del gen eucariota representa una diferencia radical con el procariota. De todas formas se mantiene la colinealidad durante la traducción del ARNm eucariota a la proteína, aunque tal colinealidad pueda, como hemos dicho, no existir con el gen.

figura 10
Figura 10. Esquema del proceso de corte  empalme eucariota.

Ahora salta la pregunta ¿cómo es que los organismos eucarotas pueden producir el ARNm que es una molécula continua si del gen solo se toman ciertas secuencias, exones, separados unos de otros por los intrones?. La respuesta es que el ARNm producto de la transcripción primaria, que es colineal con todo el gen, además de agregarle la cola poli-A 3' y la tapa 5' (figura 10b) se le recortan y desechan los intrones y luego se reempalma para formar el ARNm maduro que se exporta del núcleo al citoplasma (figura 10c).

A este último proceso se le llama empalme del ARN y en él los contactos entre intrones y exones se detectan por las llamadas ribonucleoproteínas nucleares pequeñas (abreviadas como snRNP del inglés small nuclear ribonucleoprotein) presentes en el núcleo. Esos "snurps" (así es como se pronuncia) se aglomeran juntos en la zona de contacto exón-intrón para formar el complejo llamado empalmosoma o espliceosoma que es el que ejecuta el trabajo de hacer los cortes en las fronteras exón-intrón, eliminar los intrones y empalmar los exones adyacentes para dar continuidad a la molécula de ARNm.

La cantidad de intrones y exones, así como su tamaño en los genes no responde a ninguna regla, algunos genes no tienen intrones mientras otros pueden tener hasta 50. La medida de los exones va desde unos pocos nucleótidos hasta 7500 y de la misma forma sucede con los intrones. No hay consenso entre los biólogos en la explicación de la existencia de los intrones y su origen evolutivo.

Una importante consecuencia del proceso de corte y empalme es la gran complejidad de la expresión de los genes eucariotas. Un único ARNm  primario transcrito puede ser empalmado de diferentes formas por la inclusión de distintos juegos de exones y con ello producir ARNm diferentes partiendo del mismo gen. Esta variabilidad se conoce como empalme alternativo y explica hechos como el de que solo unos 30 000 genes presentes en el genoma humano pueden codificar para unos 120 000 ARNs y sus respectivas proteínas producto de la traducción que han sido reportadas en la células.



Otros temas de biología aquí.
Para ir al índice general del portal aquí.