Genomas secuenciados
El genoma humano es el genoma del Homo sapiens, es decir, la secuencia de ADN contenida en 23 pares de cromosomas en el núcleode cada célula humana diploide.
De los 23 pares, 22 son cromosomas autosómicos y un par determinante del sexo (dos cromosomas X en mujeres y uno X y uno Y en varones). El genoma haploide (es decir, con una sola representación de cada par) tiene una longitud total aproximada de 3200 millones de pares de bases de ADN (3200 Mb) que contienen unos 20 000-25 000 genes1 (las estimaciones más recientes apuntan a unos 20 500). De las 3200 Mb unas 2950 Mb corresponden a eucromatina y unas 250 Mb a heterocromatina. El Proyecto Genoma Humanoprodujo una secuencia de referencia del genoma humano eucromático, usado en todo el mundo en las ciencias biomédicas.- ...........................................................:https://es.wikipedia.org/w/index.php?title=Especial:Libro&bookcmd=download&collection_id=01e21101d22e24088277ec0db6f6abbc6644e2d7&writer=rdf2latex&return_to=Genoma+humano
¿Qué es el genoma?
Diez billones de células, cada una con 46 cromosomas. |
De manera muy general, se dice que el genoma es todo el ADN de un organismo, incluidos sus genes, unos treinta mil en el caso de los humanos (hasta hace poco se pensaba que eran sobre ochenta mil).
Al decir "todo el ADN" de un organismo se tiende a pensar en "el ADN de todas las células" (sumadas) del organismo, lo cual es cierto, pero con una salvedad, el ADN de todas ellas es el mismo, por lo tanto, en cada célula está contenido el genoma.
Con excepción de los glóbulos rojos, los cuáles no tienen núcleo, el genoma humano está localizado en el núcleo de cada célula diploide del cuerpo.
Los humanos poseemos diez billones de células. Cada célula tiene un núcleo en el que se almacena la información genética en 46 cromosomasorganizados en 23 pares de cromosomas y que constituyen lo que se conoce como el genoma humano.
Ver: PSU: Biología; Pregunta 06_2006(2)
Dentro de cada cromosoma hay un número determinado de genes, unos que generan proteínas y otros que regulan distintos procesos. El cromosoma desplegado muestra una doble hilera de ADN en forma helicoidal.
En cada hilera se disponen las cuatro bases de información genética: adenina, citosina, guanina y timina que se identifican con sus letras iniciales (A, C, G y T), sin orden preestablecido y se combinan con las de la otra hilera. La distribución diferencia unos genes de otros, y las variaciones en la frecuencia, a unas personas de otras.
En cuanto se descubre el orden y de qué forma se combinan se produce la secuenciación. Se estimaba que el genoma humano comprende unos 3.200 millones de secuencias base.
Un cromosoma. |
Proyecto Genoma humano
No fue sino hasta 1956 que se conoció el número correcto de cromosomas humanos. A través de su representación gráfica —esto es un cariotipo— se puede determinar el número, tamaño y forma de los cromosomas e identificar los pares homólogos (cada uno formado por dos cromátidas hermanas unidas en sus centrómeros).
Los cromosomas tienen distintos largos y son ordenados de mayor a menor para su numeración, y su tinción permite advertir bandas claras y oscuras alternativamente.
El Proyecto Genoma Humano es una investigación internacional que busca seleccionar un modelo de organismo humano por medio del mapeo de la secuencia de su ADN. Se inició oficialmente en 1990 como un programa de quince años con el que se pretendía registrar los, hasta ese momento supuestos, ochenta mil genes que codifican la información necesaria para construir y mantener la vida.
Los objetivos del Proyecto fueron:
• Identificar los aproximadamente cien mil genes humanos en el ADN. (Se pensaba que ese era el número de genes).
• Determinar la secuencia de tres billones de bases químicas que conforman el ADN.
• Acumular la información en bases de datos.
• Desarrollar de modo rápido y eficiente tecnologías de secuenciación.
• Desarrollar herramientas para análisis de datos.
• Dirigir las cuestiones éticas, legales y sociales que se derivan del proyecto.
A partir de este proyecto se han suscitado análisis éticos, legales, sociales y humanos que han ido más allá de la investigación científica propiamente dicha.
James Watson y Francis Crick descubrieron la estructura de la doble hélice del ADN. |
El propósito inicial fue dotar al mundo de herramientas trascendentales e innovadoras para el tratamiento y prevención de enfermedades.
En realidad, ya se sabe que muchos caracteres son determinados por varios genes actuando en forma conjunta, y afectados cada uno de ellos y/o el conjunto por otros genes que inhiben o inducen su expresión y gradúan la frecuencia de tal manifestación; a ello debe sumársele la acción del medio ambiente (espacio y tiempo) que condiciona, él mismo, la expresión génica. No obstante, algunos secretos se han develado y permanentemente siguen haciéndolo.
Estado de la investigación
Los rápidos avances tecnológicos aceleraron los tiempos y la fecha final (14 de abril de 2003), dos años antes de lo previsto, coincidió con el quincuagésimo aniversario del descubrimiento de la estructura de la doble hélice del ADN por James D. Watson y Francis Crack (1953).
De este modo, se ha logrado el mapeo casi completo del ADN, el genoma humano está completo y el Proyecto Genoma Humano, finalizado. Un boceto del genoma se había anunciado el 6 de abril de 2001 con gran fanfarria en la Casa Blanca. Pero en ese momento sólo se había descifrado algo más del noventa por ciento.
El anuncio marcó el fin de una aventura científica que comenzó en octubre de 1990 y se pensó llevaría quince años. Watson, que se transformó en el primer director del Proyecto Genoma Humano en los Institutos Nacionales de Salud de los Estados Unidos, se encontraba presente en una conferencia para celebrar la ocasión. El había perseguido esa meta, dijo, sabiendo que la enfermedad de un familiar nunca sería tratable hasta que "entendamos el programa humano para la salud y la enfermedad".
Ahora, el consorcio internacional de centros de secuenciación del genoma produjo una secuencia extensa y altamente exacta de lostres mil cien millones de unidades de ADN que componen el genoma y rellenó todos los lugares en blanco. Los datos, que abren una nueva era de la medicina, serán de libre acceso en los bancos de datos genéticos.
Otros genomas, también. |
El primer boceto contenía la mayoría de los genes humanos y era útil para los investigadores que buscaban un gen en especial. Pero los biólogos insistieron en que frecuentemente tenían que hacer más secuenciación en las regiones del ADN en que estaban interesados.
Ahora, la versión completa es mucho más exacta y puede utilizarse directamente. Los genes y otros importantes elementos del genoma están casi todos en su posición correcta, un requerimiento vital para los investigadores que intentan localizar un gen que contribuye a una determinada enfermedad.
Los científicos alabaron al Proyecto Genoma Humano por haber continuado trabajando duro durante tres años más y producir un recurso de enorme valor para la investigación. Pero varios subrayaron que, incluso si el proyecto está completo, el genoma no lo está. Las partes del genoma que todavía faltan son de menor importancia, pero muchos biólogos quisieran verlas secuenciadas antes de poner el punto final.
Cuando el boceto del genoma humano fue presentado, el consorcio de científicos lo llamó el libro de la vida, y a cada cromosoma un capítulo. En la edición publicada ayer, pequeñas secciones del comienzo, medio y final están en blanco, junto con alrededor de cuatrocientos párrafos cuyos textos faltan, a pesar de que el largo de los párrafos faltantes es conocido.
El doctor Francis Collins, director del centro del genoma humano de los Institutos Nacionales de Salud de los Estados Unidos, dijo que la tarea se había cumplido y que el Proyecto Genoma Humano sería disuelto. La era de la secuenciación en gran escala del ADN había terminado, afirmó, a pesar de que los proyectos de investigación continuarían desarrollando tecnología para llenar los espacios faltantes.
El doctor Huntington F. Willard, experto en el cromosoma X, de la Universidad Duke, dijo que la secuencia actual del genoma era un "logro trascendente", pero que no se debería declarar el "trabajo completo" hasta que lo estuviera. Por su parte, el doctor Evan Eichler, biólogo computacional de la Universidad Case Western, afirmó que "para la gran mayoría de los usuarios, éste es, de hecho, el final". Pero, como Willard, dijo que el trabajo en el genoma debería continuar hasta que cada base estuviera en su lugar. La tarea podría llevar entre diez y veinte años.
Nicholas Wade, “The New York Times” – “La Nación”
La gran sorpresa
Las bases de la infomación genética. |
El número de genes ha sido precisamente la gran sorpresa que se ha llevado la comunidad científica: entre treinta mil y cuarenta mil, muy lejos de las cifras que hace tan sólo unos meses se barajaban de entre 80.000 y 140.000. Lo que significa que el ser humano posee sólo 13.000 genes más que una animal mucho más simple, como la mosca drosóphila. Y del chimpancé y otros primates nos separan alrededor de uno por ciento de los genes.
Según la revista Nature, grandes tramos del genoma humano parecen haber sido virus, al tiempo que genes que codifican un mínimo de 223 proteínas pueden proceder de bacterias. Así, el genoma humano sería el resultado de una mezcla primigenia de virus y genes de bacterias.
Al comparar el genoma humano con los genomas de la drosóphila o una lombriz, se ha visto que las diferencias esenciales entre los tres tienen que ver con la regulación del desarrollo, la función neuronal, la hemostasis, las reacciones inmunes adquiridas y la complejidad citoesquelética.
El inesperadamente bajo número de genes facilitará, por otra parte, su estudio en detalle, y simplificará el proceso de determinación del componente genético de enfermedades como el cáncer o el Alzheimer, según el profesor de Genética de la Facultad de Biología de la Universidad de Valencia, Manuel Pérez Alonso.
Respecto a las diferencias entre los seres humanos, el estudio del genoma se ha realizado a partir del material genético de cinco personas, dos hombres y tres mujeres: dos caucasianas, una negra, una asiática y una hispano-mexicana.
Se ha comprobado que los seres humanos, independientemente de su raza, comparten el 99,99 por ciento de los genes. Un humano de otro se diferencia tan sólo en 1.250 bases, de un total de más de tres mil millones, cerca del 0,01 por ciento, con lo que personas de diferente raza pueden ser más similares genéticamente que dos individuos de la misma etnia.
Ilustración explicativa. |
Hasta el 97 por ciento del ADN no contiene genes, o son muy pocos, con lo que, aparentemente, parecen inútiles a la hora de codificar proteínas. Es lo que se denomina ADN basura, y podría desempeñar una función importante en la trasmisión de información entre genes.
Por otra parte, más de un tercio del genoma (35,3 por ciento) contiene secuencias repetidas. Hecho del que no se conoce bien la función. El cromosoma 19, por ejemplo, es repetitivo en el 57 por ciento.
Implicancias del Proyecto Genoma Humano y la ingeniería genética
Un segundo objetivo a alcanzar por el Proyecto Genoma Humano es orientar toda la investigación genética en beneficio de la humanidad, logrando un diagnóstico precoz y eventualmente la curación de las enfermedades llamadas hereditarias y otras, como el cáncer, que quizás guardan relaciones menos claras con los genes.
Todo ello mediante la terapia génica, que tiene cuatro acepciones: la somática (tratamiento de las células enfermas), la germinal (para evitar la trasmisión hereditaria de enfermedades), la perfectiva (manipula los genes para mejorar ciertas características) y la eugénica (que busca mejorar cualidades complejas del individuo, tales como la inteligencia). Además, la ingeniería genética permite la creación de productos transgénicos, por modificación del ADN de organismos de diferentes especies (soldando partes de cada uno) que dan origen a una molécula recombinante que luego logra multiplicarse.
Respecto del diagnóstico precoz de enfermedades, a través de sondas de ADN y anticuerpos monoclonados En la actualidad existen laboratorios privados en diferentes partes del mundo que efectúan de rutina el aislamiento de mutaciones genéticas asociadas a cáncer.
Aunque los resultados de las pruebas para detectar mutaciones asociadas a cáncer son todavía imprecisos, se ha determinado con toda claridad que existen familias con cáncer de mama hereditarios que presentan el gen BRCAI, que determina el 85 por ciento de posibilidades de padecer cáncer de mama y el 45 por ciento para el cáncer de ovario.
Estudios similares se están realizando en cáncer de colon y de próstata, así como para enfermedades neurológicas degenerativas (distrofia muscular, corea de Huntington, enfermedad de Alzheimer), trastornos cardio-vasculares y, por supuesto, SIDA.
Código genético, ¿símil con un código de barras? |
En el ámbito de la terapia génica farmacológica, destacan los siguientes hallazgos:
• Una nueva generación de vacunas: bacterias o virus con un gen activo extirpado, que permite producir reacciones moderadas de inmunidad. Ya ha salido al mercado una para la hepatitis B y se trabaja en vacunas para la malaria, encefalitis y, por supuesto, Sidas.
• Fármacos obtenidos de manipulación genética, tales como la insulina, la hormona del crecimiento y el Interferón.
&b ull; Desarrollo en el campo de la neurobiología molecular de los neurotransmisores, para posible uso en enfermedades psíquicas.
• Obtención de activadores tisulares, tales como el t-PA ("tissue Plasmigen Activator") activador de los plasmígenos que puede ayudar en la evolución del infarto.
• Los anticuerpos monoclonados, además de su uso en diagnóstico, pueden ser usados en enfermedades infecciosas, al poder ser dirigidos a zonas específicas del organismo.
De más está decir las implicancias sociales, políticas, legales y —particularmente— éticas, que éstas y otras líneas de investigación podrían tener en la actitud de las personas, que verían la posibilidad de extirparse órganos sanos ante la posibilidad cierta de contraer cáncer en algún momento de su vida, o, peor aún, experimentarían la oscura expectativa de que se les diagnostique una condición de esa naturaleza sin poder hacer más que esperar su aparición, con las fatídicas consecuencias previsibles. Junto con esto, la utilización comercial de estos hallazgos constituye un tema no resuelto y altamente desestabilizador para la necesaria cooperación internacional que se requiere.
Estructura del genoma humano y la variación inter-individual
El genoma humano nuclear tiene un tamaño aproximado de 3.200 Mb (megabases), es decir tres mil doscientos millones de pares de bases. Esta cifra total incluye unas 2.950 Mb de eucromatina y unas 250 Mb de heterocromatina (formada, como veremos, por ADN satélite). Esta cifra se refiere al genoma haploide, de manera que las células somáticas (diploides) contienen el doble.
Figura 1.5: este cuadro explicativo muestra una visión general de los distintos tipos de secuencias que constituyen el genoma humano.
Una primera clasificación del genoma humano distingue, por un lado, los genes y secuencias relacionadas con genes (exones, intrones, regiones no traducidas que contienen elementos reguladores, etc), y por otro todo el ADN que está entre los genes, llamado ADN extragénico o “de relleno” y que no codifica ninguna proteína ni contiene ningún elemento funcional. Curiosamente, la mayor parte del genoma humano (un 70%) está formada por este último, de forma que sólo un 30% del genoma humano incluye secuencias relacionadas con genes. Lo más sorprendente es que de este 30% sólo un 5% está constituído por ADN codificante (exones), siendo el resto ADN no-codificante asociado a genes. Por tanto, resulta que sólo un 1,5-2% del total del genoma humano es ADN codificante. El ADN extragénico está formado, sobre todo, por los componentes repetitivos del genoma humano que se explicarán más adelante, aunque también hay secuencias únicas o en bajo número de copia.
Desde la publicación del primer borrador del Genoma Humano en febrero de 2001, podemos dar unos valores promedio estimados a partir de los datos publicados:
- Se estima que el genoma humano contiene en torno a los 20.000 - 25.000 genes.
- Alrededor de un 50% del genoma humano está constituido por ADN repetitivo.
- Se puede estimar la densidad media de genes es de 1 gen cada 100 kb, aunque existen regiones ricas en genes (algunas zonas del cromosoma 19, por ejemplo) y otras regiones que son muy pobres en genes (como el cromosoma Y). Por tanto, se puede deducir una frecuencia media de 10 genes por cada Mb de secuencia.
- El tamaño promedio de un gen humano es de 20-30 kb, aunque hay grandes diferencias de unos genes a otros.
- El número de exones que forman un gen es muy variable (desde genes que tienen un solo exón hasta algunos genes con 100 exones ó más), pero podemos establecer un valor promedio de 7-8 exones por gen.
- El tamaño medio de un exón es de 150 nucleótidos. Por lo que respecta a los intrones, en cambio, existe una enorme variabilidad de tamaños, y no es infrecuente encontrar en casi todos los genes algún intrón de gran tamaño.
- El tamaño medio de un ARNm es de 1,8-2,2 kb incluyendo las regiones no-traducidas flanqueantes. La longitud media de una región codificante es de 1,4 kb.
Una de las características más evidentes del borrador de nuestro genoma es suheterogeneidad. En efecto, la secuencia no es uniforme, sino que muchas de sus características (riqueza en C+G frente a A+T, riqueza en genes, etc) se distribuyen heterogéneamente, con regiones de gran abundancia flanqueadas por regiones en que esos parámetros son más escasos. Así por ejemplo, el contenido medio de G+C del genoma humano es del 41%, menor de lo teóricamente esperado. Además, si el genoma se divide en "ventanas" de 20 kb se observan regiones con valores muy alejados del promedio, con una dispersión 15 veces mayor de lo que sería esperable si la distribución fuese uniforme. La distribución de %G+C de estas ventanas no se ajusta a una distribución normal, sino que está desviada hacia valores bajos.
Además, se ha comprobado que los genes tienden a concentrarse en las ventanas más ricas en G+C. Esto se conocía ya de antiguo, y de hecho se había acuñado el términoisocoro para designar las regiones genómicas que son homogéneas en cuanto al contenido en G+C y que pueden separarse mediante gradientes de densidad. Se distinguen isocoros L eisocoros H, según su contenido en G+C sea bajo (Low) ó alto (High), y dentro de cada isocoro hay varios subgrupos. La tabla que se presenta a continuación resume algunas características importantes de los distintos isocoros:
Isocoro | % GC | % del genoma | Contenido Genes % | Mb ADN | Densidad de genes |
L1 | 38 | 30 | 48 | 1,860 | 1 cada 130 kb |
L2 | 41 | 32 | |||
H1 | 44 | 19 | 27 | 870 | 1 cada 100 kb |
H2 | 49 | 10 | |||
H3 | 53 | 9 | 25 | 270 | 1 cada 35 kb |
Como puede apreciarse, existe una relación directa entre el contenido de una región genómica en nucleótidos G+C y su riqueza en genes. Es decir, hay en el genoma humano unas regiones con mayor riqueza de genes, regiones que a su vez son las que tienen un mayor porcentaje de nucleótidos G+C.
Otro hallazgo inesperado en nuestro genoma ha sido la presencia de mayor número de duplicaciones del que se había estimado hasta entonces. De hecho, el análisis muestra alrededor de un 5% de duplicaciones segmentarias, definidas como dos ó más segmentos cromosómicos >1 kb con >90% de identidad de secuencia; dicho nivel de homología corresponde a una antigüedad de unos 40 millones de años. Las duplicaciones intracromosómicas (las copias están en el mismo cromosoma) tienen un tamaño medio de unas 100 kb, mientras que las duplicaciones intercromosómicas (entre cromosomas distintos) son más pequeñas (10-50 kb). Las duplicaciones segmentarias son más frecuentes en regiones centroméricas y cerca de los telómeros (donde pueden llegar a constituir un 25% de la secuencia). Los centrómeros, en concreto, están flanqueados por regiones ricas en duplicaciones intercromosómicas procedentes de regiones eucromáticas de otros cromosomas, que se han ido transponiendo a zonas pericentroméricas a una velocidad de 6-7 eventos por millón de años durante la evolución de primates. Las duplicaciones intracromosómicas pueden dar lugar a alteraciones genómicas, como veremos en un Tema posterior.
Figura 1.6: el video ilustra la estructura de los distintos tipos de duplicaciones segmentarias que aparecen en el genoma humano, con un ejemplo de la región pericentromérica del cromosoma 7.
Además de las duplicaciones segmentarias, se ha visto que hay muchas otras regiones relativamente grandes del genoma que están en distinto número de copia en personas diferentes. Por tanto, constituyen un tipo de polimorfismo, de ahí que se denominen LCV(Large-scale Copy number Variations), CNP (Copy Number Polymorphisms) o CNV (Copy Number Variants), que es el nombre más utilizado en la actualidad. Una característica de todas estas regiones es que están flanqueadas por duplicaciones segmentarias, y esto hace pensar que la variación en el número de copias es el resultado de reordenaciones entre esos elementos flanqueantes. En los últimos años, las nuevas tecnologías han permitido elaborar un catálogo bastante exhaustivo de estas variantes, con más de ocho mil regiones tipo CNV que comprenden en total casi un 4% de la secuencia del genoma humano. Dos personas tomadas al azar tendrán diferencias en más de mil CNV, lo que supone una gran fuente de variabilidad genética inter-individual ya que cada una de esas regiones incluye uno o más genes. Estudios recientes han asociado alguna de estas variantes con la susceptibilidad a desarrollar enfermedades, especialmente de tipo neurológico. Por ejemplo, en 2011 se vio que las personas con una duplicación de una región del cromosoma 7 tienen un riesgo 15 veces superior de desarrollar esquizofrenia que las personas sin esa variante. Otro estudio, realizado sobre más de 15.000 niños con discapacidades congénitas, demostró que hasta un15% de estas patologías es atribuible a un número anormal de copias de una región genómica. Es previsible que en los próximos años se sigan descubriendo CNV que confieren un alto riesgo de padecer una enfermedad común.
El análisis de la secuencia también ha mostrado la alta cantidad de pseudogenes que hay en el genoma humano. Como su nombre indica, los pseudogenes son versiones “incorrectas” de genes, que contienen diversos tipos de mutaciones y habitualmente no se transcriben. Se dividen en pseudogenes no procesados y pseudogenes procesados. Los primeros son copias de un gen, habitualmente originadas por duplicación del gen original y posteriores mutaciones que hacen que la copia pierda su capacidad codificante. Contienen exones e intrones, pero que carecen de promotor y habitualmente tienen codones de parada prematuros. En cambio, los pseudogenes procesados son copias del ARN mensajero de un gen, que se ha retrotranscrito e insertado en otra posición del genoma (de ahí que se denominen también retropseudogenes). No tienen intrones, y tampoco tienen capacidad codificante por la ausencia de promotor y por la presencia de codones de parada. Se han identificado unos 11.000 pseudogenes en el genoma humano, de los que la mayor parte (unos 8.000) son pseudogenes procesados. En total, se estima que el número de pseudogenes en nuestro genoma puede llegar a unos 20.000. De todas formas, todos los pseudogenes detectados se originan a partir de tan sólo unos 2.500 genes funcionales, de modo que la mayor parte de los genes no tienen ningún pseudogen en el genoma.
Figura 1.7: el video muestra esquemáticamente la estructura de los distintos tipos depseudogenes que aparecen en el genoma humano.
Recientemente se han encontrado 481 segmentos >200 pares de bases totalmente conservados (100% de identidad sin gaps) en rergiones ortólogas de humano, rata y ratón, y la gran mayoría están también conservados en pollo y perro (95 and 99% de identidad, respectivamente). Muchas también están conservadas en pez. Estos "elementos ultraconservados" se solapan con exones de genes implicados en el procesamiento de ARN, y también son abundantes en intrones de genes relacionados con el desarrollo o con la regulación de la transcripción. Junto con las más de 5000 secuencias >100 nucleótidos que están totalmente conservadas en los 3 mamíferos secuenciados, estos fragmentos constituyen una nueva clase de elementos genéticos cuya función está por determinar, pero el hecho de que están más conservados que las proteínas indica que deben jugar algún papel importante.
También es importante dedicar unas líneas a describir la presencia de genes que dan lugar a microARN. Como es sabido, el estudio del mecanismo de interferencia de ARN ha llevado a la identificación de ARN interferentes endógenos en los genomas de eucariotas, incluido el genoma humano. Estos ARN se denominan microARN (miARN) y se transcriben a partir de genes con un promotor de ARN-polimerasa II. Estos genes tienen un segmento palindrómico, de modo que el ARNm primario forma un pri-miARN que contiene una horquilla de ARN bicatenario; este pri-miARNm es procesado dentro del núcleo de la célula por una ARNasa tipo III llamada DROSHA y esto da lugar a un pre-miARN, una ARN bicatenario con forma de horquilla de unos 70 nucleótidos de tamaño. El pre-miARN sale del núcleo y es procesado en el citoplasma por Dicer, originando un miARN de unos 22 nucleótidos. Éste entra a formar parte del complejo RISC (denominado miRISC para los miARN) y regula la expresión de genes diana mediante degradación de sus mensajeros o por represión de la traducción. Actualmente se han identificado más de 300 genes de miARN en el genoma humano, y se calcula que puede haber en torno a 500. La mayoría de estos genes se localizan en intrones de genes codificantes, y además están bastante conservados en primates. Dado que cada uno de estos miARN puede regular la expresión de varios genes diana, se estima que hasta un 20-30% de todos los genes del genoma humano pueden estar regulados por miARN, lo que les confiere una extraordinaria importancia.
La secuenciación del genoma humano ha permitido también estudiar la variación genética inter-individual, es decir, las diferencias genéticas que están en la base de las diferencias fenotípicas entre individuos. Esto tiene gran relevancia médica, porque muchas de estas variantes pueden ser también causa de la distinta susceptibilidad a desarrollar enfermedades o la diferente respuesta a fármacos que tienen personas distintas. Uno de los tipos más importantes de variabilidad genética es el constituido por los cambios en un nucleótido de la secuencia, conocidos ?como hemos visto? con el nombre de SNP. Uno de los objetivos del PROYECTO GENOMA HUMANO era el estudio de la diversidad genética, y esto ha cristalizado en otro proyecto internacional denominado Proyecto HapMap que se propone precisamente identificar los SNP más frecuentes en el genoma humano en individuos de diferentes grupos étnicos. En octubre de 2005, el Proyecto Hapmap publicó un primer mapa que contiene 1.007.329 SNP con una distancia media entre ellos de 5 kb, con una frecuencia del alelo más frecuente igual ó superior al 5% (es decir, presentes en al menos el 5% de la población). Todos estos SNP fueron genotipados en 269 individuos de cuatro grupos raciales: 90 de raza yoruba, de Nigeria; 90 caucasianos de Utah; 45 de raza han, de China; y 44 japoneses. La segunda fase de este Proyecto, publicada en 2007, genotipo casi tres millones de SNPs en esta misma muestra. En la fase III, concluida en 2009, se genotiparon 1,6 millones de SNPs en 1184 individuos de 11 poblaciones distintas de todo el planeta. La inspección de estos mapas permite hacerse una idea de la variación existente en el genoma, tanto entre individuos como entre distintos grupos geográficos. Además, estos datos han permitido comprobar que esta variación se agrupa en bloques, de modo que todos los SNP de un mismo bloque se heredan juntos. En un capítulo posterior veremos la importancia de estos bloques para estudiar la asociación de SNP concretos con la susceptibilidad a padecer enfermedades.
Figura 1.8: Como se muestra en este video, los alelos de SNP cercanos están a menudo en desequilibrio de ligamiento y forman haplotipos que se heredan en bloque.Estos bloques haplotípicos tienen gran importancia para entender la estructura del genoma humano en distintas poblaciones, identificar genes relacionados con enfermedades complejas y detectar regiones genómicas de asociadas con distintos rasgos fenotípicos.
Finalmente, se ha catalogado también otro tipo de variación consistente en polimorfismos de inserción/deleción pequeños (de tamaños entre 1 nucleótido a 10 kb). Se han detectado varios cientos de miles, y se estima que en total hay alrededor de 1,5 millones de estos polimorfimos en el genoma humano. Aunque se distribuyen por todo el genoma, se ha visto que en algunas regiones son especialmente frecuentes. Muchos de ellos están dentro de genes, y pueden causar alteraciones cuando afectan al promotor o a la región codificante (exones).
Los últimos años han presenciado una revolución en las tecnologías de secuenciación, lo que ha permitido comenzar proyectos para leer la secuencia de genomas completos de muchas personas. El proyecto internacional más importante, en este sentido, se llama 1000 Genomes, y ya está dando sus primeros frutos. En 2010 se publicaron los primeros resultados de este proyecto, en el que se secuenciaron 179 genomas de 4 poblaciones distintas. Según estos datos, cada persona es portadora de unos 3 millos de variantes genéticas, de las cuales diez mil son potencialmente patogénicas, afectando en promedio a 250 genes. Además, 60 de esas variantes han sido previamente asociadas con alguna enfermedad.
No hay comentarios:
Publicar un comentario