martes, 31 de marzo de 2015

genética


CÓDIGO GENÉTICO: CARACTERÍSTICAS Y DESCIFRAMIENTO
Una vez que Crick (1958) propuso la Hipótesis de la Secuencia ("existe una relación entre la ordenación lineal de nucleótidos en el ADN y la ordenación lineal de aminoácidos en los polipéptidos"), la comunidad científica la admitió y se plantearon dos preguntas:
  • ¿Existe algún código o clave que permite pasar de la secuencia de nucleótidos en el ADN a la secuencia de aminoácidos en las proteínas?
  • ¿Cómo se convierte la información contenida en la secuencia de ADN en una estructura química de proteína?
La primera pregunta conlleva el estudio del desciframiento del código genético y el estudio de sus características. La segunda pregunta consiste en el estudio de los procesos genéticos de la síntesis de proteínas: la transcripción y la traducción.
CARACTERÍSTICAS DEL CÓDIGO GENÉTICO
Las características del código genético fueron establecidas experimentalmente por Fancis Crick, Sydney Brenner y colaboradores en 1961. Las principales características del código genético son las siguientes:
Francis CrickSydney Brenner
CÓDIGO ORGANIZADO EN TRIPLETES O CODONES
Si cada nucleótido determinara un aminoácido, solamente podríamos codificar cuatro aminoácidos diferentes ya que en el ADN solamente hay cuatro nucleótidos distintos. Cifra muy inferior a los 20 aminoácidos distintos que existen.
Si cada dos nucleótidos codificarán un aminoácido, el número total de dinucleótidos distintos que podríamos conseguir con los cuatro nucleótidos diferentes (A, G, T y C) serían variaciones con repetición de cuatro elementos tomados de dos en dos VR4,2 = 42 = 16. Por tanto, tendríamos solamente 16 dinucleótidos diferentes, cifra inferior al número de aminoácidos distintos que existen (20).
Si cada grupo de tres nucleótidos determina un aminoácido. Teniendo en cuenta que existen cuatro nucleótidos diferentes (A, G, T y C), el número de grupos de tres nucleótidos distintos que se pueden obtener son variaciones con repetición de cuatro elementos (los cuatro nucleótidos) tomados de tres en tres: VR4,3 = 43 = 64. Por consiguiente, existe un total de 64 tripletes diferentes, cifra más que suficiente para codificar los 20 aminoácidos distintos.
El CÓDIGO GENÉTICO ES DEGENERADO
Como hemos dicho anteriormente existen 64 tripletes distintos y 20 aminoácidos diferentes, de manera que un aminoácido puede venir codificado por más de un codón. Este tipo de código se denomina degenerado. Wittmann (1962) induciendo sustituciones de bases por desaminación con nitritos, realizó sustituciones de C por U y de A por G en el ARN del virus del mosaico del tabaco (TMV), demostrando que la serina y la isoleucina estaban determinadas por más de un triplete.
Las moléculas encargadas de transportar los aminoácidos hasta el ribosoma y de reconocer los codones del ARN mensajero durante el proceso de traducción son los ARN transferentes (ARN-t). Los ARN-t tienen una estructura en forma de hoja de trébol  con varios sitios funcionales:
  • Extremo 3': lugar de unión al aminoácido (contiene siempre la secuencia ACC).
  • Lazo dihidrouracilo (DHU): lugar de unión a la aminoacil ARN-t sintetasa o enzimas encargadas de unir una aminoácido a su correspondiente ARN-t.
  • Lazo de T ψ C: lugar de enlace al ribosoma.
  • Lazo del anticodón: lugar de reconocimiento de los codones del mensajero.
Normalmente el ARN-t adopta una estructura de hoja de trébol plegada en forma de L o forma de boomerang.
Estructura ARN transferente
Estructura ARN transferente
Estructura ARN transferente
Los ARN-t suelen presentar bases nitrogenadas poco frecuentes como son la pseudouridina (ψ), metilguanosina (mG), dimetilguanosina (m2G), metilinosina (mI) y dihidrouridina (DHU, UH2).
El que realiza el reconocimiento del codón correspondiente del ARN-m es el anticodón del ARN-t y no el aminoácido. Mediante un experimento se demostró que era posible transformar el cisteinil-ARN-t mediante tratamiento con hidruro de níquel en alanil-ARN-t. Este tratamiento convierte la cisteína en alanina. De esta manera se consiguió un ARN-t específico de cisteina que en lugar de llevar unida cisteina llevaba unida alanina. Cuando se empleo este ARN-t híbrido para sintetizar proteínas se pudo comprobar que en el lugar en el que debía aparecer cisteina en la secuencia del polipéptido aparecía alanina. Por tanto, el que llevaba a cabo el reconocimiento del codón del ARN-m era el anticodón del ARN-t y no el aminoácido.
La degeneración de l código se explica teniendo en cuenta dos motivos:
  • Algunos aminoácidos pueden ser transportados por distintas especies moleculares (tipos) de ARN transferentes (ARN-t) que contienen distintos anticodones.
  • Algunas especies moleculares de ARN-t pueden incorporar su aminoácido específico en respuesta a varios codones, de manera que poseen un anticodón que es capaz de emparejarse con varios codones diferentes. Este emparejamiento permisivo se denomina Flexibilidad de la 3ª base del anticodón o tambaleo.
Flexibilidad de la 3º base del anticodón, tambaleo: La tercera base del anticodón, la que ocupa la posición 5' no está especialmente confinada de forma que en algunos casos puede emparejarse con distintas bases del codón. En la siguiente gráfica se observa que cuando en la posición 5' del anticodón hay una G, esta guanina puede emparejarse con un uracilo (U) de la posición 3' del codón o con una citosina (C).
Flexibilidad de la tercera base del anticodón, tambaleo
En la siguiente tabla se indican los emparejamientos codón-anticodón permitidos por la regla del tambaleo:
Emparejamientos codón-anticodón permitidos
Extremo 5' del anticodón (ARN-t)Extremo 3' del codón (ARN-m)
GU o C
Csólo G
Asólo U
UA o G
IU, C o A
En la siguiente tabla se indican tres ARN-t de serina que pueden leer cada uno de ellos dos codones diferentes en el ARN-m. Estos tres ARN-t se denominan isoaceptores porque se unen (aceptan) al mismo aminoácido pero están codificados por genes distintos.
CodónARN-tAnticodón
UCU y UCCARN-tSer1AGG + tambaleo
UCA y UCGARN-tSer2AGU + tambaleo
AGU y AGCARN-tSer3UGG + tambaleo
EL CÓDIGO GENÉTICO ES NO SOLAPADO O SIN SUPERPOSICIONES
Un nucleótido solamente forma parte de un triplete y, por consiguiente, no forma parte de varios tripletes, lo que indica que el código genético no presenta superposiciones. Por tanto, el código es no solapado. Wittmann (1962) induciendo mutaciones con ácido nitroso en el ARN del virus del mosaico del tabaco (TMV) pudo demostrar que las  mutaciones habitualmente producían un cambio en un solo aminoácido. El ácido nitroso produce desaminaciones que provocan sustituciones de bases, si el código fuera solapado y un nucleótido formará parte de dos o tres tripletes, la sustitución de un nucleótido daría lugar a dos o tres aminoácidos alterados en la proteína de la cápside del TMV.
Diferencias entre un código solapado y uno no solapado
Código solapado: restricciones en la secuencia de aminoácidos
Otra forma de comprobar que el código es sin superposición es que no hay ninguna restricción en la secuencia de aminoácidos de las proteínas, de manera, que un determinado aminoácido puede ir precedido o seguido de cualquiera de los 20 aminoácidos que existen. Si dos codones sucesivos compartieran dos nucleótidos, cualquier triplete solamente podría ir precedido o seguido por cuatro codones determinados. Por consiguiente, si el código fuera superpuesto, un aminoácido determinado solamente podría ir precedido o seguido de otros cuatro aminoácidos como mucho.
LA LECTURA DEL CÓDIGO GENÉTICO ES "SIN COMAS"
Teniendo en cuenta que la lectura se hace de tres en tres bases, a partir de un punto de inicio la lectura se lleva a cabo sin interrupciones o espacios vacíos, es decir, la lectura es seguida "sin comas". De manera, que si añadimos un nucleótido (adición) a la secuencia, a partir de ese punto se altera el cuadro de lectura y se modifican todos los aminoácidos. Lo mismo sucede si se pierde (deleción) un nucleótido de la secuencia. A partir del nucleótido delecionado se altera el cuadro de lectura y cambian todos los aminoácidos. Si la adición o la deleción es de tres nucleótidos o múltiplo de tres, se añade un aminoácido o más de uno a la secuencia que sigue siendo la misma a partir del la última adición o deleción. Una adición y una deleción sucesivas vuelven a restaurar el cuadro de lectura.
En la siguiente tabla se da un ejemplo con una frase que contiene solamente palabras de tres letras. A partir de la adición de una letra cambia la pauta de lectura y el significado de la frase, lo mismo sucede cuando se pierde una letra. Una adición y una deleción sucesivas recuperan el significado de la frase. Una adición de tres letras añade una palabra pero después se recupera la pauta de lectura y el sentido de la frase.
Secuencia normal: ejemplo con una frase
UNOMASUNOSONDOS 
Adición de una A después de la primera N: cambia el cuadro de lectura
UNAOMASUNOSONDOS
Deleción (pérdida) de la primera O: cambia el cuadro de lectura
UNMASUNOSONDOS 
Adición de A y deleción de A: se recupera el cuadro de lectura
UNAOMSUNOSONDOS 
Adición de tres letras (AAA)
UNOAAAMASUNOSONDOS
DESCIFRAMIENTO DEL CÓDIGO GENÉTICO
La asignación de un aminoácido a cada triplete o el desciframiento de la clave genética, se llevó a cabo fundamentalmente gracias al esfuerzo de tres grupos de investigación, el grupo de M. W. Nirenberg, el grupo de S. Ochoa y el equipo de H. G. Khorana. Parece lógico pensar que el desciframiento del código genético se debería haber realizado comparando las secuencia de nucleótidos de un gen y la de aminoácidos del polipéptido codificado por dicho gen. Sin embargo, en la época en la que se realizaron estos trabajos no era posible todavía obtener la secuencia de los ácidos nucleicos.
Severo Ochoa
Marshall W. Nirenberg
Har Gobind Khorana
La mayoría de los trabajos realizados por estos tres grupos de investigación consistieron en sintetizar ARN mensajeros (ARN-m) para utilizarlos posteriormente como mensajeros artificiales en un sistema acelular de traducción "in vitro". Estos sistemas acelulares de traducción "in vitro" procedían de la bacteria E. coli y contenían todo lo necesario para llevar a cabo la traducción: ribosomas, todos los ARN transferentes, aminoácidos, enzimas, etc. Sin embargo, a estos sistemas acelulares se les quitaban los ARN mensajeros de E. coli y se les añadía un ARN sintetizado artificialmente. En estos sistemas acelulares se sintetizaba un polipéptido.
Posteriormente, se comparaba la secuencia del ARN -m sintético utilizado en el experimento con la secuencia de aminoácidos del polipéptido producido.
La puesta a punto de estas técnicas requería poder sintetizar ARN-m de forma enzimática (grupo de Ochoa) o de  forma química (grupo de Khorana) y conseguir un sistema acelular estable para sintetizar proteínas (grupo de Nirenberg).
En esencia, los grupos de investigación anteriormente mencionados realizaron los siguientes tipos de esperimentos:
UTILIZACIÓN DE HOMOPOLÍMEROS
Un homopolímero es un ARN sintético que solamente contiene un tipo de ribonucleótido. Por ejemplo, el ARN sintético UUUUUUUUUUUUU.......
Gruberg-Manago y Ochoa (1955) aislaron a partir de timo de ternera un ezima denominada Polirribonucleótido fosforilasa que tenía la capacidad de sintetizar ARN a partir de ribonucleósidos difosfato y sin necesidad de molde. Este enzima iba tomando al azar los ribonuclkeñosidos del medio para originar un ARN.
Matthei y Nirenberg (1961) consiguieron sintetizar polipéptidos "in vitro" añadiendo un ARN sintético de secuencia conocida a un sistema acelular estable de traducción. Usando la Polirribonucleótido fosforilasa sintetizaron poli-uridílico (poli-U: UUUUUUUUUUUUUU...). Cuando emplearon este ARN sintético en su sistema acelular de traducción daba lugar a la formación de un polipéptido que solamente contenía el aminoácido fenilalanina (Poli-fenilalanina: phe-phe-phe-phe-..). Por tanto, el triplete UUU codificaba para fenilalanina (phe). También comprobaron que el ARN síntético Poli C (Poli-citidílico: CCCCCCCCCC....) daba lugar a un polipéptido que contenía solamente prolina (Poli-prolina: pro-pro-pro-pro-pro-...), por tanto, el codón CCC significaba prolina (pro).
Poco tiempo después, Ochoa sintetizó Poli-adenílico (Poli-A: AAAAAAAAA....) y observó que el polipéptido que aparecía solamente tenía el aminoácido lisina (Poli-lisina: lys-lys-lys-lys-....). Por consiguiente el triplete AAA codificaba para el aminoácido lisina (lys). También corroboró que el Poli-C daba lugar a Poli-prolina. El ARN Poli-guanílico no producía proteína alguna, probablemente debido a que adquiría una estructura terciaría helicoidal que impedía su traducción a proteína.
TripleteAminoácido
CCCprolina
UUUfenilalanina
AAAlisina
USO DE COPOLÍMEROS
El siguiente paso fue la utilización de copolímeros, es decir, de ARN sintéticos que contenían más de un más de un ribonucleótido distinto. Para ello emplearon la Polirribonucleótido fosforilasa y pusieron en el medio dos ribonucleósidos distintos. Por ejemplo, U y G, de manera que había 5 veces más U que G en el medio (5U:1G). Debido a que el enzima toma los ribonucleósidos difosfato del medio al azar, la probabilidad de que tome un U del medio es 5/6, mientras< que la probabilidad de que tome una G es 1/6. El ARN sintético formado presentaba una secuencia al azar de uracilos y guaninas y aparecían en él ocho tripletes diferentes con las siguientes probabilidades:
Triplete 5’ 3’
ProbabilidadValor relativo
UUU
5/6 x 5/6 x 5/6 = 125/216
100
UUG
5/6 x 5/6 x 1/6 = 25/216
20
UGU
5/6 x 1/6 x 5/6 = 25/216
20
GUU
1/6 x 5/6 x 5/6 = 25/216
20
UGG
5/6 x 1/6 x 1/6 = 5/216
4
GUG
1/6 x 5/6 x 1/6 = 5/216
4
GGU
1/6 x 1/6 x 5/6 = 5/216
4
GGG
1/6 x 1/6 x 1/6 = 1/216
0,08
Cuando se analizó el polipéptido que se sintetizaba con este mensajero sintético, se observó que contenía fenilalanina (phe), cisteina (cys), valina (val), glicina (gly) y triptófano (trp). Tomando como valor 100 el de el aminoácido más frecuente, cys y val presentaban un valor de 20 mientras que trp y gly mostraban un valor de 4 a 5. Se confirmaba que UUU significaba fenilalanina y se deducía que 2U y 1G (UUG, UGU y GUU) codificaban para cisteína y valina. También se deducía que 1U y 2G (UGG, GUG y GGU) codificaban para triptófano y glicina. Sin emabrgo, no era posible asignar un triplete concreto para cisteína y valina, o para triptófano y glicina. Parece raro, que en estos experimentos no detectaran el aminoácido leucina (leu) que esta codificado por el triplete UUG, tampoco dedujeron que el aminoácido valina estaba codificado por 1U y 2 G (GUG). Uno e los problemas, de estos experimentos radica en asignar el valor 100 al aminoácido más frecuente y comparar las proporciones de aminoácidos obtenidas de esta manera con las de los distintos tripletes del mensajero, ya que el aminoácido más frecuente puede estar codificado por más de un triplete. Oto inconveniente es que los mensajeros sintéticos producidos no presenten la frecuencia de codones esperada por azar.
Este tipo de experimentos fueron realizados por los grupos de Nirenberg y de Ochoa y no rindieron grandes resultados.
EMPLEO DE POLÍMEROS DE SECUENCIA CONOCIDA
La siguiente forma de abordar el desciframiento de la clave genética fue utilizar ARN mensajeros sintéticos de secuencia conocida obtenidos por métodos de síntesis química o enzimática. Estos métodos fueron empleados por Khorana y col. (1965).
Utilizando el Poli-UCde 116 residuos de longitud, ARN mensajero sintético en el que se repite muchas veces seguidas el dinucleótido UC (UCUCUCUCUCUCUC...) obtuvieron un polipéptido que contenía los residuos de serina y leucina en secuencia alternada (ser-leu-ser-leu-ser-leu-ser-leu-....). El Poli-UC contiene dos tripletes diferentes, UCU y CUC, por consiguiente uno de ellos codifica serina y el otro leucina, pero no se puede determinar cuál a cuál.
También se emplearon los mensarejos sintéticos Poli-AC, Poli-AG y Poli-UG que codificacban para los siguientes aminoácidos:
ARN sintéticoCodonesPolipéptido sintetizadoAminoáciods
Poli- AC (ACACACAC..)ACA y CACthr-his-thr-his-thr-histreonina e histidina
Poli-AG (AGAGAGAG..)AGA y GAGarg-glu-glu-arg-glu-argarginina y glutámico
Poli-UG (UGUGUGUG..)UGU y GUGcys-val-cys-val-cys-val-cisteína y valina
Poli-UC (UCUCUCUC..)UCU y CUCser-leu-ser-leu-ser-leu-serina y leucina
En 1965, Nishimura y colaboradores utilizaron el Poli-AAG, mensajero sintético en el que se repite muchas veces seguidas el trinucleótido AAG (AAGAAGAAGAAGAAG...) y encontraron la aparición de tres polipéptidos distintos en el sistema acelular de traducción, detectaron Poli-lisina (lys-lys-lys-lys-...), Poli-arginina (arg-arg-arg-arg-..) y Poli-glutamato (glu-glu-glu-glu-..). Estos resultados además de confirmar que el código genético se compone de grupos de tres bases o codones, indican que en los sistemas acelulares de traducción, la iniciación de la traducción del mensajero puede realizarse por cualquier ribonucleótido. Si comienza por la primea A, se repite AAG-AAG-AAG-.., si la tradución comienza por la segunda A, se repite AGA-AGA-AGA-AGA-..., y si la traducción comienza por la G, se repite el triplete GAA-GAA-GAA-GAA-GAA-....
El punto de iniciación de la lectura de los mensajeros sintéticos en su sistema acelular de traducción "in vitro",  en ausencia de triplete de iniciación (AUG), puede ser cualquier ribonucleótido.
En el ejemplo de la figura, dependiendo del punto de iniciación aparece un polipéptido distinto, cuando comienza por la primera A se sintetiza Poli-lys, en la segunda A se produce Poli-arg y en cuando se inicia en la G aparece Poli-glu.
  
Naturalmente, en este experimento no se sabe cuál de los tres aminoácidos corresponde a cada uno de los tres tripletes
ARN sintéticoCodonesPolipéptido sintetizadoAminoácidos
Poli- AAGAAG, AGA y GAAPoli-lys, Poli-arg, Poly-glulys, arg y glu
AAGAAGAAGAAG..AAGPoli- lys: lys-lys-lys-lys-..lisina
AGAAGAAGAAGA..AGAPoli-arg: arg-arg-arg arg-..arginina
GAAGAAGAAGAA..GAAPoli-glu: glu-glu-glu-glu-..glutámico
TÉCNICA DE INCORPORACIÓN DE ARN TRASNFERENTES
En esta técnica se utilizan ARN mensajeros sintéticos de secuencia conocida con la siguiente estructura: los grupos de Khorana y Nirenberg emplearon trinucleótidos, mientras que el equipo de Matthei utilizaba oligonucleótidos del tipo ABCCCCCCCCCCC.... (el tercer nucleótido estaba repetido 100 veces). En este último caso solamente se analiza en primer triplete, ABC.
En todos los casos, en lugar de analizar los polipéptidos sintetizados, se analiza la especificidad con que el ARN transferente (ARN-t) con o sin su aminoácido correspondiente se incorpora al ribosoma. Dicha especificidad viene determinada por la secuencia de ribonucleótidos del ARN-m sintético empleado.
Para averiguar el ARN-t que es capaz de unirse en el ribosoma al trinucleótido analizado, es necesario marcar radiactivamente uno de los ARN-t de todos los utilizados. Se lleva a cabo esta operación marcadndo radiactivamente cada vez un ARN-t distinto.
Con este sistema fue posible descifrar todos los tripletes que aún no habían sido descifrados.
EL CÓDIGO GENÉTICO ES UNIVERSAL
El desciframiento del código genético se ha realizado fundamentalmente en la bacteria E. coli, por tanto, cabe preguntarse si el código genético de esta bacteria es igual que el de otros organismos tanto procarióticos como eucarióticos. Los experimentos realizados hasta la fecha indican que el código genético nuclear es universal, de manera que un determinado triplete o codón lleva información para el mismo aminoácido en diferentes especies. Hoy día existen muchos experimentos que demuestran la universalidad del código nuclear, algunos de estos experimentos son:
  • Utilización de ARN mensajeros en diferentes sistemas acelulares. Por ejemplo ARN mensajero y ribosomas de reticulocitos de conejo con ARN transferentes de E. coli. En este sistema se sintetiza un polipéptido igual o muy semejante a la hemoglobina de conejo.
  • Las técnicas de ingeniería genética que permiten introducir ADN de un organismo en otro de manera que el organismo receptor sintetiza las proteínas del organismo donante del ADN. Por ejemplo, la síntesis de proteínas humanas en la bacteria E. coli.
El desciframiento del código genético dio como resultado la siguiente asignación de aminoácidos a los 64 tripletes.
  SEGUNDA BASE  
  UCAG  
PR
I
M
E
R
A

B
A
S
E
UUUUPheUCUSerUAUTyrUGUCysUTE
R
C
E
R
A

B
A
S
E
UUCPheUCCSerUACTyrUGCCysC
UUALeuUCASerUAAFINUGAFINA
UUGLeuUCGSerUAGFINUGGTrpG
CCUULeuCCUProCUAHisCGUArgU
CUCLeuCCCProCACHisCGCArgC
CUALeuCCAProCAAGlnCGAArgA
CUGLeuCCGProCAGGlnCGGArgG
AAUUIleACUThrAAUAsnAGUSerU
AUCIleACCThrAACAsnAGCSerC
AUAIleACAThrAAALysAGAArgA
AUGMetACGThrAAGLysAGGArgG
GGUUValGCUAlaGAUAspGGUGlyU
GUCValGCCAlaGACAspGGCGyC
GUAValGCAAlaGAAGluGGAGlyA
GUGValGCGAlaGAGGluGGGGlyG

El código genético nos indica que aminoácido corresponde a cada triplete o codón del ARN mensajero.

  • El triplete de iniciación suele ser AUG que codifica para Formil-metionina. También pueden actuar como tripletes de iniciación GUG (Val) y UGG (Leu) aunque con menor eficacia.
  • Existen tres tripletes sin sentido o codones de terminación (FIN) que no codifican para ningún aminoácido: UAA (ocre), UAG (ambar) y UGA (ópalo).
  • La mayoría de los aminoácidos están determinados por más de un triplete, excepto la metionina (AUG) y el triptófano (UGG) que son los únicos que poseen un solo triplete.
  • Cuando un aminoácido está codificado por varios tripletes suele variar la tercera base, por ejemplo, la glicina es GGX, la alanina es GCX, la valina es GUX, la treonina es ACX. Sin embargo, hay varias excepciones en las que también puede variar la primera base, por ejemplo, la arginina es AGPu y CGX, la leucina es CUX y UUPu y la serina es UCX y AGPi.
El código genético mitocondrial es la única excepción a la universalidad del código, de manera que en algunos organismos los aminoácidos determinados por el mismo triplete o codón son diferentes en el núcleo y en la mitocondria.

Excepciones a la Universalidad del Código

OrganismoCodónSignificado en Código NuclearSignificado en Código Mitocondrial
TodosUGAFINTrp
LevaduraCUXLeuThr
DrosophilaAGAArgSer
Humao, bovinoAGA, AGCArgFIN
Humano, bovinoAUAIleMet (iniciación)
RatónAUU, AUC, AUAIleMet (iniciación)

No hay comentarios:

Publicar un comentario