Las redundancias del código genético van teniendo su explicación
( Creces, 2009 )
En el código genético para identificar cada uno de los 20 aminoácidos existen codones alternativos, de modo que si en una de las bases de un codón se produce una mutación, no se traduciría esta en una enfermedad. Pero ahora parece que esos codones no son tan alternativos, ya que la normal utilización de ellos muestra sesgos que sugieren que las preferencias son justificadas. Así comienza a aclararse que las llamadas "mutaciones silenciosas", pueden ser también causantes de enfermedades.
Es la molécula del DNA la que guarda el programa de la vida y la que transmite la información genética de padres a hijos y que hace que los hijos se asemejen a sus padres. Para que se llegue a cumplir el mensaje contenido en el DNA, se necesita codificar miles de proteínas diferentes que deberán ir desempeñando armónicamente diversas funciones a lo largo de la vida. Es que son las proteínas las responsables de todos los procesos que deben ocurrir en el interior de cada una de las células, hasta llegar a dar forma y funcionalidad a un organismo multicelular maduro. Sus funciones son múltiples y muy variadas, desde catalizar las reacciones bioquímicas necesarias para la vida, como también llegar a formar las estructuras básicas de las células y tejidos, coordinar la acción del conjunto a nivel celular y tisular, e incluso estar atentas para reconocer los mas diversos organismos agresores externos y estructurar las defensas contra ellos. El mensaje contenido en el DNA guarda las instrucciones necesarias para codificar todas las proteínas que se requieren para que se lleve a efecto la vida celular.
El DNA es una doble molécula gigante formada por dos hebras unidas de modo que se asemeja a una escalera de cuerdas retorcidas (figura 1), donde los escalones están formados por bases químicas. Dos purinas unidas entre si (adenina y guanina) y dos pirimidinas (citosina y timina), que se suceden en diferentes secuencias, constituyendo el código (código genético) capaz de seleccionar y estructurar la cadena de los 20 aminoácidos diferentes, constitutivos de las proteínas. En la especie humana, se estima que para desarrollar el programa de la vida se requiere de la codificación y síntesis de aproximadamente 100.000 proteínas diferentes. Para ello, trozos de la molécula de DNA forman genes, unidades que guardan la información para codificar cada una de las proteínas requeridas.
En otras palabras, las instrucciones contenidas en el DNA, mediante cuatro letras (adenina, guanina, citosina y timina), debe transmitir el mensaje con toda exactitud, transfiriéndolo al lenguaje que requieren los 20 aminoácidos que van a constituir las 100.000 proteínas necesarias para la estructuración y funcionalidad del organismo humano. El conjunto del proceso de transferencia de información, es el que ha sido llamado "código genético". Contempla desde el sistema de las cuatro letras del DNA, y su posterior transferencia al código requerido para seleccionar cada uno de los 20 aminoácidos diferentes que son necesarios para formar la cadena de cada una de las 100.000 proteínas.
El proceso de expresar un gene, se inicia separándose la doble hebra de DNA para que la maquinaria celular transcriba la secuencia de nucleótidos insertos en una de las hebras, a otra molécula, que se va formando con las mismas bases, salvo que el nucleótido "timina" se reemplaza por el nucleótido "uracilo". Esta última se ha llamado RNA de trascripción. En un paso más adelante este es editado en una forma mas breve, descartando varios trozos de RNA que no se incluyen (intrones), dejando sólo el trozo definitivo que va a migrar hacia los ribosomas (extrones), lugar en que se sintetizan las proteínas (Menos genes pero mas eficientes). Una vez listo este último, por el hecho de llevar el mensaje hasta el ribosoma, se le ha llamado RNA mensajero (mRNA). Allí, en la medida que el mRNA se pone en contacto con el ribosoma, aparece un nuevo RNA que es más pequeño, llamado RNA de transferencia (tRNA) que engancha en forma codificada el aminoácido respectivo. Cada tRNA ha reconocido un amino ácido específico por una secuencia de tres nucleótidos (codón). Cuando el tRNA se encuentra su mRNA correspondiente, el ribosoma agrega el aminoácido correspondiente a la cadena de la proteína en formación, (figura 2). (El código genético)
Es decir, el código que usan las células para transferir el lenguaje de su DNA y RNA al lenguaje de los aminoácidos, que son las unidades constitutivas de las proteínas, requiere de un pequeño RNA intermedio, llamado de transferencia (tRNA). Todos los genes y su respectivo mRNA, están organizados en palabras de tres letras, llamadas codones, que identifican el aminoácido correspondiente. Es el tRNA, el que en el extremo opuesto posee las tres letras que identifican al aminoácido respectivo y lo entrega en el ribosoma de modo que se va agregando a la cadena de la proteína en formación, (figura 2).
Pero este código es "redundante", es decir, cada aminoácido tiene varios codones que potencialmente pueden engancharlo. Ello sucede porque en base a las cuatro letras de DNA (adenina, guanina, citosina y uracilo), se pueden formar 64 codones de tres letras. De estos 64, tres codones se utilizan como señales para detener la trascripción. Pero todavía quedan 61 codones para sólo 20 aminoácidos. De ello se infiere que varios codones identifican un mismo aminoácido. Así por ejemplo, todos los codones que comienzan con GG (GGA, GGC, GGG, GGU) captan el aminoácido glicina. En este caso se trata de cuatro codones que en definitiva son sinónimos (figura 3). Al existir codones sinónimos para cada aminoácido, puede suceder que una mutación, a pesar de afectar a un nucleótido de uno de los codones, no necesariamente altere la estructura de la proteína, ya que existen codones sinónimos que salvarían las circunstancias. Al no alterar la estructura de la proteína, tampoco produciría enfermedad (Progreso en la genética de las enfermedades). Por ello, a estas mutaciones que se producen en algún codón sinónimo, se las ha llamado "mutaciones silenciosas".
Pero las mutaciones silenciosas pueden producir enfermedades
Fue solo recientemente, en 1980, que se pudo evidenciar que las mutaciones silenciosas, al menos en bacterias y levaduras, podían también afectar la formación de proteínas. En ese tiempo un descubrimiento clave fue que los genes de esos organismos no utilizaban los codones sinónimos en igual proporción. Cuando por ejemplo, la bacteria Escherichia coli identifica el aminoácido asparragina, el codón AAC aparece en su DNA con mucha más frecuencia que el AAT. Pronto se hizo evidente la razón de esta selección en el uso de codones: "es que las células emplean preferentemente ciertos codones porque el codón seleccionado potencia el ritmo y acuciosidad que requiere la síntesis proteica".
A su vez sucede que los codones sinónimos de una determinado tRNA, no están en el interior de la célula la misma abundancia. Lo que es mas importante es que el gene que tiene más codones coincidentes con los del tRNA, van a transferir más rápido el mensaje. La mayor concentración de determinados tRNA, hará más probable que estos estén presentes en el momento en que se necesiten, maximizando la acuciosidad y rapidez de la traducción. De este modo, la célula tiene una buena razón para no usar en forma igualitaria todos los codones sinónimos. En las bacterias y levaduras, los genes que codifican las proteínas más abundantes, tienen las mayores alternativas de codones y tienen la posibilidad de elegir los tRNA más comunes, o que mejor coinciden para la síntesis proteica.
Las observaciones posteriores de otros organismos, incluyendo plantas, moscas y gusanos, revelaron las mismas tendencias. Cuando una diversidad tan grande de especies emplean esta técnica para mejorar su eficiencia, era también probable que la misma tendencia ocurra en los mamíferos. Efectivamente, al analizar los genes de mamíferos se encontró la misma tendencia de favorecer determinados codones. Por razones que no están claras, el genoma de los mamíferos se organiza en grandes bloques sesgados, en que predominan los contenidos de determinados nucleótidos. Algunas regiones son ricas en bases guanina (G) y citosina (C), mientras que otras son ricas en adenina (A) y timina (T). Como resultado de ello, los genes ubicados en las regiones ricas en GC del genoma, tienden a tener muchos codones que contienen estas bases. Es cierto que nuestros genes muestran una tendencia a usar ciertos codones, pero a diferencia de los organismos simples, no parecía tan evidente que la razón fuera lograr la optimización de la síntesis proteica, por lo que se llegó a pensar que las mutaciones silenciosas en humanos no se traducían en enfermedades. Pero ha sido en estos últimos años que se ha ido comprobando que también en humanos se producen "mutaciones silenciosas" ya que a pesar de existir codones homólogos, si se podrían alterar la estructura de proteínas ya que en determinadas circunstancias no serían tan homólogos, o mas bien, no estaría tan a mano su disponibilidad y por ende podrían traducirse en una enfermedad.
A que nivel se produciría la alteración
La interferencia en la síntesis proteica puede producirse desde la trascripción del DNA, hasta cuando el mRNA logra la síntesis de la proteína. Esta puede producirse en la etapa en que se edita el RNA mensajero definitivo, durante el proceso que se va desprendiendo de regiones del RNA de transcripción que no van a ser codificadas. El proceso se asemeja a lo que hace un editor de películas, que después de tener todo el material filmado, comienza a cortar trozos no deseados y a empalmar los que le interesan. En la misma forma el RNA de trascripción, comienza a desprenderse de trozos, llamados "natrones", para empalmar (splicing) sólo los trozos que verdaderamente se van a codificar para la selección de aminoácidos, los trozos llamados "extrones", llegando así a constituir el mRNA definitivo correspondiente al gene (Menos genes pero más eficientes). Los genes humanos son especialmente ricos en intrones, de modo que como promedio cada gene tiene ocho largos intrones de los que debe deshacerse, dejando sólo los extrones. Para ello necesita saber muy bien donde comienza y donde termina cada uno de los intrones no deseados.
Durante los últimos años se ha llagado a saber que junto a los exones existen también secuencias de bases que indican precisamente donde se debe cortar para remover los intrones. Se llaman "potenciadores de empalmes de exones" (exonic splicing enhancer o, ESE), y son secuencias cortas de tres a ocho nucleótidos que se instalan cerca del extremo de los exones. Ellos definen el punto donde debe actuar la maquinaria del empalme. Esta necesidad podría explicar la preferencia de ciertos nucleótidos en los genes humanos. Aunque los codones GGA y GGG, que codifican la glicina, pueden aparecer en los ESE, pero puede ser el segundo codón el que actúa como un potenciador más potente, que lleva a un más eficiente empalme. Por una mutación puede cambiar una base del codón sinónimo por otra, llegando de este modo a una inadecuada remoción del intron y en consecuencia afectar el cambio de un aminoácido, lo que en definitiva puede llega a producir un defecto en la síntesis proteica.
Muchas enfermedades se han producido por errores durante el proceso de edición. Uno de ellos es el que Francisco Baralle, del Centro Internacional de Ingeniería Genética y Biotecnología, ha encontrado mutaciones silenciosas que afectan a la "proteína reguladora de la transmembrana", causante de la fibrosas mística del páncreas. Al igual que a esta, a más de cincuenta enfermedades genéticas se les atribuye como causa directa o indirecta, mutaciones silenciosas que se producirían por alteraciones de la edición del RNA, que al cambiar un aminoácido, llegarían a afectar la producción de la proteína respectiva (tabla 1).
Pero no es esta la única etapa donde se pueden producir mutaciones silenciosas que afecten a las proteínas. Puede el problema estar en la siguiente etapa, que tiene que ver con que el mRNA ya formado se puede doblar en forma demasiado compleja. Contrariamente a lo que muchos textos de estudio muestran el mRNA como una cinta cuando va abandonando el núcleo para dirigirse al ribosoma, la realidad es que sale doblado sobre si mismo, ya que algunos pares de nucleótidos son complementarios y se pueden unir en complicadas estructuras. Es en realidad la forma en que se dobla el mRNA, lo que determina su estabilidad y ello afecta la velocidad de la translación del mensaje. Una mutación silenciosa puede crear una arquitectura muy enredada del mRNA, dificultando la translación del mensaje, lo que también afectaría la estructura de la proteína. Es así como debido a ello también se han descrito varias enfermedades. Una de ellas es la que afecta al gene receptor de dopamina D2, que codifica una proteína receptora de superficie celular que detecta al neuroreceptor dopamina, y como consecuencia se degradaría más rápido que lo normal. De este modo la proteína codificada se traduciría en enfermedades que se expresen en varias alteraciones cognitivas.
En ocasiones se ha observado formas de mRNA dramáticamente diferentes a las secuencias típicas, lo que dificulta la codificación del mensaje por dificultades del desenredo, llegándose a alterar la secuencia amino acidita en la proteína, (figura 4).
Todas estas nuevas investigaciones confirman lo que ya tantas veces hemos ido observando, que la naturaleza no complica las cosas fabricando codones redundantes como simples repuestos. Lo que se ha llamado codones sinónimos no son tales, ya que no es inocuo su indistintivo uso. Se avanza, pero aun falta mucho por comprender como se va desarrollando el programa de la vida.
Para más antecedentes:
Chamary, J.V, y Lawrence D. Hurst. The Prince of Silent Mutation. Scientific American Junio 2009, pág. 46.
Wang G.S, y Cooper T.A. Splicing in Disease: Disruption of Splicing Code and the Decoding Machinery. Nature Reviews Genetics, vol 8, No 10, pag. 749, Octubre 2007
Andrea G. Nackley y cois. Human Catechol-O-Methytransferase Haplotypes Modulate Protein Expresson by Altering mRNA Secunday Struckture. Science vol. 314, pag. 1930, Diciembre 2006.