Menos genes pero mas eficientes
( Creces, Marzo 2005 )
El antiguo axioma de "un gene una proteína" no explica todo. Ahora hay que aceptar que a partir de un gene se pueden derivar múltiples proteínas.
Antes que se terminara de secuenciar el genoma humano los investigadores especializados en el tema trataban de predecir cuantos genes podrían constituirlo ("Cuántos genes hay en el genoma humano"). Partiendo del dogma ya aceptado que cada gene codificaba una proteína específica, al presumir que en el organismo humano deberían existir 100.000 proteínas diferentes, deberían entonces también existir 100.000 genes. Pero no todos aceptaban este dogma.
Ya se sabía que el genoma de la lombriz de tierra (Caenorhabditis elegants) debía tener 19.000 genes. También se conocía el genoma de algunos vegetales, como el maíz, que contenía 40.000 genes. Con todos estos antecedentes y viendo que el organismo humano era muchísimo mas complejo que la humilde lombriz o el grano de maíz, muchos pensaron que en él deberían existir por lo menos unos 150.000 genes.
Cuando después de algunos meses se completó el borrador del genoma humano, la sorpresa para muchos fue grande. Los especialistas secuenciadores afirmaron que nuestro genoma estaba constituido por no más de 35.000 genes. Esto iba contra todo lo establecido hasta ese entonces. Pero mayor fue aún la sorpresa, cuando se publicó la secuencia definitiva del genoma, ya en limpio, ¡el número total de genes no era mayor de 25.000! Desde entonces se ha tenido que comenzar a replantear totalmente los conceptos. Es cierto que nuestro organismo es mucho más complejo que la lombriz de tierra o el grano de maíz, por lo que hay que aceptar que la complejidad no esta dada por él número de genes. Lo que esta en pie es que las proteínas del organismo humano son aproximadamente 100.000 y que cada una debe sintetizarse de acuerdo a la información que contiene el DNA. Aceptando estas dos premisas como ciertas, hay que concluir que de alguna forma cada gene se les arregla para codificar la estructura de dos o más proteínas.
Un determinado gene se las ha debido arreglar para armar la secuencia de las bases en cada gene, en dos o más formas para ser capaz de llegar a sintetizar varias proteínas partiendo de un mismo gene. Así en distintas circunstancias, un mismo gene podría codificar varias proteínas diferentes.
Si se compara el genoma humano con los de otros organismos, se puede concluir que especies más simples pueden tener igual o más genes que organismos más complejos. Lo que se ha podido comprobar es que la mayor complejidad de un organismo superior no esta dada por el mayor numero de genes, sino por la mayor versatilidad de sus genes que han adquirido la capacidad de codificar diversas proteínas, según sea la necesidad. Más aún, dentro de un mismo organismo, las células constituyentes de un determinado tejido pueden también modificar el número de proteínas necesarias en relación a otros tejidos, según sean las funciones específicas de cada órgano. Esta misma versatilidad de los genes a nivel de los diferentes tejidos, permitiría que teniendo cada célula del organismo un número similar de genes, cada tejido logre una determinada complejidad en sus funciones.
Es así como se ha ido comprobando que la prevalencia de diversas alternativas de edición de los genes humanos puede explicar la creciente complejidad del organismo. Se estima que tres cuartos de todos los genes humanos, poseen la capacidad de alternativas de reedición de dos o más proteínas. Probablemente éste, y no el mayor número de genes, ha sido el mecanismo evolutivo que ha llevado a una mayor complejidad de las especies. Con este nuevo enfoque, las febriles investigaciones recientes ya están permitiendo comenzar a comprender que la existencia de fallas en este proceso de reordenar las bases de un mismo gene puede llevar a la aparición de diversos tipos de cánceres, como también a diversas enfermedades metabólicas. Es muy probable que más adelante estos mismos nuevos conocimientos puedan llagar a tener usos terapéuticos.
Como funciona el sistema
Hace ya más de 25 años que se descubrió por primera vez que un mismo gene podía llegar a inducir la formación de varias proteínas diferentes. Pero como sucede muchas veces, este hallazgo no concordaba con el dogma establecido en ese entonces, por lo que el hecho se interpretó como una rareza y se olvidó. Ha sido ahora, cuando se ha podido comparar los genomas de distintas especies, que se ha tenido que replantear el dogma y volver a analizar con otra mirada lo que antes ya se había descubierto.
Pero no todo hay que cambiarlo. Del antiguo dogma, se mantienen en pie sus principios básicos. Es decir, el genoma, mediante un código de cuatro letras (cuatro nucleótidos), contiene toda la información necesaria para llegar a constituir y mantener un organismo ("El código genético"). La larga molécula de DNA, estructurada en una doble hebra, esta muy bien empaquetada en el interior de los cromosomas, que a su vez están en el interior del núcleo de las células. Cuando llega el momento que esta debe expresar su mensaje genético (genes), se abre la doble hebra para que se copie la secuencia de sus bases en otra molécula prima hermana; el "RNA mensajero". Llamado así porque su función es la de transportar la información desde el núcleo al citoplasma para que allí sea leída y se traduzca finalmente en la síntesis de una proteína. Pero antes que parta el mensajero, debe someterse a un proceso preliminar de edición (purificación) del mensaje.
Es así como en el año 1977, Phillip Sharp del Massachusetts Institute of Techhology, junto con Richard Roberts del New England Biolab, descubrieron que la trascripción del mensaje al RNA requiere de una previa limpieza, consistente en separar partes del mensaje que no debe ser llevado por el RNA mensajero. El proceso se ha llamado "splicing" (empalme), y consiste en que se retiran porciones importantes del mensaje que ya se había trascrito al RNA primario (“Genes, genoma y enfermedad”). Estas porciones de DNA que se retiran y que no se transcriben, se han llamado "intrones", mientras que las que se transcriben al RNA mensajero, formando un mensaje coherente, se han llamado "extrones". Queda así entonces constituido el RNA definitivo que llevará el mensaje al citoplasma. Se puede entender este proceso como un texto de libro que tenga distintos capítulos y que algunos de ellos no sean necesarios. El editor retira esos capítulos no necesarios y deja sólo los necesarios de modo que se mantenga una secuencia editora que tenga cohesión.
En 1980 Randolph Wall de la Universidad de California en Los Angeles, descubrió que estos procedimientos básicos de empalme, en que todos los intrones se descartan y todos los exones siempre terminan copiándose en el RNA mensajero, no es cierto. En ocasiones la maquinaria celular puede decidir que se va a imprimir en el RNA y bien puede que se retire un exón, o que se deje sin retirar un intrón, o bien que se retiren o agreguen trozos de estos. Esta capacidad de variar la edición definitiva que se inscribe en el RNA mensajero definitivo, da una tremenda posibilidad para producir variaciones dentro de una proteína que pueden tener distintas funciones. Ello es lo que en definitiva permite que un mismo gene pueda codificar dos o más proteínas diferentes (figura 1).
Posteriormente, en el año 1984, Tom Maniatis, Michael Ghreen y otros colaboradores de la Universidad de Harvard desarrollaron una tecnología que les permitió llegar a describir la compleja maquinaria molecular que realiza este procedimiento de cortes de intrones y agregados de extrones hasta llegar a la edición definitiva del RNA mensajero. El proceso de empalme, que va ensamblando exones e intrones o trozos de él, es muy complejo y es coordinado por un grupo de enzimas o proteínas cuyas estructuras y detalles de cómo y cuándo actúan hasta llegar a constituir un RNA mensajero definitivo, está aun está en pleno estudio.
En los organismos unicelulares los procesos de empalme de intrones son pocos y además los intrones contienen pocos nucleótidos (menos de 500 cada uno). Pero en la medida que se progresa en la escala evolutiva de las especies, el genoma se va expandiendo, los intrones se multiplican y también se expanden. Con ello paralelamente se va complicando la maquinaria molecular que regula el proceso de empalme. Así por ejemplo, en el genoma humano, un gene que codifica una proteína tiene una longitud promedio de 28.000 nucleótidos con 8.8 exones de promedio, que separan 7.8 exones. Estos exones son relativamente cortos, con un promedio de 120 nucleótidos, mientras que un intrón puede tener una longitud entre 100 a 100.000 nucleótidos.
En la especie humana, el tamaño y cantidad de intrones (es la especie que tiene el más alto número de intrones por gene) plantea un interesante aspecto. Es tanta la cantidad de intrones y son estos tan largos, que una alta proporción de las calorías que ingerimos cada día se gastan en realizar estos procesos de empalme (splicing) de intrones, como también como los procesos que se requieren para la mantención y reparación constante de ellos, para llegar en definitiva a un RNA mensajero definitivo, mucho más corto. Se trata de un proceso caro y muy riesgoso. Es así como el sistema puede causar costosos errores en el ordenamiento de estos intrones y extrones. Cada corte y cada ligazón realizada en el pre-RNA tienen un riesgo de error en la trascripción, lo que puede llevar a la síntesis de una proteína defectuosa, que en definitiva puede llegar a provocar un trastorno metabólico y una enfermedad o despertar un cáncer. Parece raro que la naturaleza haya conservado este sistema tan costoso y riesgoso.
Ventajas y alternativas
Generando más de un tipo de DNA mensajero, se puede codificar más de una proteína por gene, y es ello lo que le ha permitido al ser humano producir más de 100.000 proteínas diferentes, sin tener que mantener un stock de 100.000 genes. Como promedio, cada uno de nuestros genes produce alrededor de tres RNA mensajeros diferentes. Con todo, no se explica la presencia de tantos intrones, ni tampoco su amplitud entre los genes, hasta el punto de que sólo el 1 al 2% del genoma esta constituido por exones.
Ello ha constituido un dilema al que muchos investigadores han tratado de encontrar explicación. Pero otro dilema ha complicado más las cosas. El hecho es que en año 2002 se conoció el genoma de la rata, que tenía más o menos igual cantidad de genes que los seres humanos. Según los cálculos evolutivos, las ratas y los primates (y por lo tanto el homínido) derivan de un ancestro común que habría vivido hace 100 millones de años. A partir de esa fecha se habría separado para seguir vías evolutivas diferentes. Sin embargo, el examen comparativo de los genomas señala que los monos, los humanos y las ratas, conservamos mas o menos el mismo número de exones e intrones. No sólo eso, sino que también se conserva la mayor parte de las secuencias de los nucleótidos dentro de sus exones. La pregunta que cabe es: ¿Qué es entonces lo que nos hace tan diferentes a nosotros de las ratas?
Recientemente Christopher Lee y Barmak Modrek de U.C.L.A, comunicaron que al comparar los exones de las ratas con los de los humanos, encuentran que un cuarto de ellos es diferente y específico para cada especie, ya sea para los humanos o para las ratas. Aquí estaría la diferencia, ya que estos exones diferentes tienen la potencialidad de crear proteínas específicas y diferentes para cada especie, las que serían responsables de la diversificación que se ha ido produciendo entre ambas especies. Es decir, un grupo de alternativas de empalmes de exones son específico para humanos (humanos y monos) y allí estaría la progresiva diferenciación que se ha ido produciendo entre las ratas y los primates.
Como nacen los intrones
Con estos hallazgos, ha nacido el interés de saber cómo nace un exón. Al conocer su génesis se ha comenzado a entender las ventajas de preservar los intrones en general y se justifica que se hayan mantenido, a lo largo de la evolución, aun cuando esa carga de intrones signifique un enorme costo energético.
Los exones específicos de primates derivan de elementos genéticos móviles,llamados Alus, que pertenecen a una gran clase de elementos conocidos como "retrotransposones" (La creciente complejidad del programa genético). Son secuencias cortas de DNA, cuya función parece ser la de generar copias de si mismo y luego reinsertarlas dentro del genoma en posiciones aleatorias, apareciendo como pequeños genomas parásitos. Los retrotransposones se encuentran casi en todos los genomas de las diferentes especies y han tenido una profunda influencia al contribuir a la expansión genómica que acompaña a la evolución de los organismos multicelulares. Casi la mitad del genoma humano esta echo de elementos transferibles, entre los cuales los Alus parecen ser los más abundantes.
Los elementos Alus tienen una longitud de sólo 300 nucleótidos con una secuencia distintiva que termina en una "cola poli-A". Nuestro genoma contienen alrededor de 1.4 millones de copias de Alus y muchos de estos elementos Alus están continuamente multiplicándose e insertándose en nuevas ubicaciones dentro del genoma a un ritmo de una nueva inserción por cada 100 a 200 nacimientos humanos.
Por mucho tiempo los Alus fueron considerados como basura dentro del genoma, pero ahora último están comenzando a ser respetados por los genetistas al comprobar que la inserción puede expandir la capacidad de generar proteínas génicas. Alrededor de un 5% de los exones alternativos empalmados en el genoma humano, contienen una secuencia de Alus. La mayor parte de estos exones se generan cuando el elemento Alus "salta" dentro de un intron de un gene, y normalmente su inserción no tiene ninguna consecuencia negativa para el primate, ya que la mayor parte de los intrones se descartan en el proceso de empalmar. Sin embargo, a través de las subsecuentes mutaciones los elementos Alus pueden transformar el intron en que han estado insertos, en una secuencia de información genética, "un nuevo exon". De esta forma un intron pasaría a ser reconocido como exón por el sistema molecular de ensamblajes (spliceosoma).
Los elementos Alus se encuentran sólo en primates y por lo tanto también en los humanos. Es aquí donde dieron nacimiento a través de empalmes alternativos, a nuevas proteínas, permitiendo así divergir muchos cientos de años atrás, a los primates de otras especies de mamíferos (las ratas por ejemplo). Sabemos que los humanos comparten el 99% de su genoma con el chimpancé, pero es a los elementos Alus a los que les debemos ser diferentes a ellos. Estudios recientes han mostrado que los genes humanos son casi idénticos a los del chimpancé y que ambos producen esencialmente las mismas proteínas en los mismos tejidos, excepto en partes del cerebro, donde son más activos ciertos genes humanos y otros generan proteínas significativamente diferentes a través de modificaciones del sistema de empalmes (splice), durante la trascripción.
Según Gil Ast (que ha estado estudiando la forma en que actúan estos Alus), en el genoma humano existirían aproximadamente 500.000 de estos elementos Alus localizados dentro de los intrones, y 25.000 de ellos podrían llegar a ser nuevos exones, induciendo mutaciones en un solo punto. De esta forma las secuencias Alu tienen el potencial de continuar enriqueciendo el stock de información genética, válida para producir nuevas proteínas humanas.
(Gil Ast: "The Alternative Genome", Scientific American, Abril 2005, pp.38-47).