AMIGOS PARA SIEMPRE: QUÍMICA

MACROMOLÉCULAS - SECUENCIA ADN

Métodos de alto rendimiento [ editar ]

Las lecturas de secuencias múltiples y fragmentadas deben ensamblarse juntas en función de sus áreas superpuestas.

La secuenciación de alto rendimiento, o de próxima generación, ^{[nt 1] se}aplica a la secuenciación del genoma, la resecuenciación del genoma, el perfil del transcriptoma ( RNA-Seq ), las interacciones ADN-proteína ( secuenciación ChIP ) y la caracterización del epigenoma . ^[56] Es necesario volver a secuenciar, porque el genoma de un individuo de una especie no indicará todas las variaciones del genoma entre otros individuos de la misma especie.

La alta demanda de secuenciación de bajo costo ha impulsado el desarrollo de tecnologías de secuenciación de alto rendimiento que paralelizan el proceso de secuenciación, produciendo miles o millones de secuencias simultáneamente. ^[57]^[58]^[59] Las tecnologías de secuenciación de alto rendimiento están destinadas a reducir el costo de la secuenciación de ADN más allá de lo que es posible con los métodos estándar de terminación de colorante. ^[60] En la secuenciación de ultra alto rendimiento, se pueden ejecutar en paralelo hasta 500,000 operaciones de secuenciación por síntesis. ^[61]^[62]^[63] Estas tecnologías llevaron a la capacidad de secuenciar un genoma humano completo en tan solo un día. ^[64] A partir de 2019Los líderes corporativos en el desarrollo de productos de secuenciación de alto rendimiento incluyeron Illumina , Qiagen y ThermoFisher Scientific . ^[64]

Comparación de los métodos de secuenciación de alto rendimiento ^[65]^[66]
Método	Leer la longitud	Precisión (solo lectura no consenso)	Lecturas por carrera	Tiempo por carrera	Costo por 1 millón de bases (en US $)	Ventajas	Desventajas
Secuenciación de una sola molécula en tiempo real (Pacific Biosciences)	30,000 pb (N50 ); longitud máxima de lectura> 100,000 bases ^[67]^[68]^[69]	Precisión de lectura cruda del 87% ^[70]	500,000 por célula Sequel SMRT, 10–20 gigabases^[67]^[71]^[72]	30 minutos a 20 horas^[67]^[73]	$ 0.05– $ 0.08	Rápido.Detecta 4mC, 5mC, 6mA. ^[74]	Rendimiento moderado. El equipo puede ser muy caro.
Semiconductor Ion (Secuenciación Ion Torrent)	hasta 600 pb^[75]	99.6% ^[76]	hasta 80 millones	2 horas	$ 1	Equipos menos costosos.Rápido.	Errores de homopolímero.
Pirosecuenciación (454)	700 pb	99.9%	1 millón	24 horas	$ 10	Tamaño de lectura larga.Rápido.	Las carreras son caras.Errores de homopolímero.
Secuenciación por síntesis (Illumina)	MiniSeq, NextSeq: 75–300 bp; MiSeq: 50–600 pb; HiSeq 2500: 50–500 pb; HiSeq 3/4000: 50–300 bp; HiSeq X: 300 pb	99.9% (Phred30)	MiniSeq / MiSeq: 1–25 Millones; SiguienteSeq: 130-00 Millones; HiSeq 2500: 300 millones - 2 mil millones; HiSeq 3/4000 2.5 mil millones; HiSeq X: 3 mil millones	1 a 11 días, dependiendo del secuenciador y la longitud de lectura especificada^[77]	$ 0.05 a $ 0.15	Posibilidad de alto rendimiento de secuencia, dependiendo del modelo de secuenciador y la aplicación deseada.	El equipo puede ser muy caro.Requiere altas concentraciones de ADN.
Síntesis de anclaje de sonda combinatoria (cPAS-BGI / MGI)	BGISEQ-50: 35-50 pb; MGISEQ 200: 50-200 pb; BGISEQ-500, MGISEQ-2000: 50-300 pb ^[78]	99.9% (Phred30)	BGISEQ-50: 160M; MGISEQ 200: 300M; BGISEQ-500: 1300M por celda de flujo; MGISEQ-2000: celda de flujo FCS 375M, celda de flujo FCL 1500M por celda de flujo.	De 1 a 9 días, dependiendo del instrumento, lea la longitud y la cantidad de celdas de flujo que se ejecutan a la vez.	$ 0.035- $ 0.12
Secuenciación por ligadura (secuenciación SOLiD)	50 + 35 o 50 + 50 pb	99.9%	1.2 a 1.4 mil millones	1 a 2 semanas	$ 0.13	Bajo costo por base.	Más lento que otros métodos.Tiene problemas de secuenciación de secuencias palindrómicas.^[79]
Secuenciación de nanoporos	Dependiendo de la preparación de la biblioteca, no del dispositivo, el usuario elige la longitud de lectura.(hasta 500 kb reportados)	~ 92–97% de lectura única	depende de la longitud de lectura seleccionada por el usuario	Datos transmitidos en tiempo real. Elige 1 min a 48 hrs.	$ 500–999 por celda de flujo, el costo base depende de expt	Lecturas individuales más largas.Comunidad de usuarios accesible.Portátil (tamaño Palm).	Menor rendimiento que otras máquinas, precisión de lectura única en 90 s.
Terminación de la cadena (secuenciación de Sanger)	400 a 900 pb	99.9%	N / A	20 minutos a 3 horas	$ 2400	Útil para muchas aplicaciones.	Más caro y poco práctico para proyectos de secuenciación más grandes.Este método también requiere el paso lento de la clonación de plásmidos o PCR.

Secuenciación masiva de firmas paralelas (MPSS) [ editar ]

La primera de las tecnologías de secuenciación de alto rendimiento, la secuenciación masiva de firmas paralelas(o MPSS), se desarrolló en la década de 1990 en Lynx Therapeutics, una compañía fundada en 1992 por Sydney Brenner y Sam Eletr . MPSS fue un método basado en perlas que usó un enfoque complejo de ligadura de adaptador seguido de decodificación de adaptador, leyendo la secuencia en incrementos de cuatro nucleótidos. Este método lo hizo susceptible al sesgo específico de la secuencia o la pérdida de secuencias específicas. Debido a que la tecnología era tan compleja, el MPSS solo fue realizado "en casa" por Lynx Therapeutics y no se vendieron máquinas de secuenciación de ADN a laboratorios independientes. Lynx Therapeutics se fusionó con Solexa (más tarde adquirida por Illumina).) en 2004, lo que condujo al desarrollo de la secuenciación por síntesis, un enfoque más simple adquirido de Manteia Predictive Medicine , que dejó obsoleto el MPSS. Sin embargo, las propiedades esenciales de la salida MPSS eran típicas de los tipos de datos de alto rendimiento posteriores, incluidos cientos de miles de secuencias de ADN cortas. En el caso de MPSS, estos se usaron típicamente para secuenciar el cDNA para las mediciones de los niveles de expresión génica . ^[41]

Secuenciación Polony [ editar ]

El método de secuenciación Polony , desarrollado en el laboratorio de George M. Church en Harvard, fue uno de los primeros sistemas de secuenciación de alto rendimiento y se utilizó para secuenciar un genoma completo de E. coli en 2005. ^[80] Combinó una combinación in vitro La biblioteca de marcadores con PCR en emulsión, un microscopio automatizado y la química de la secuenciación basada en la ligadura para secuenciar un genoma de E. coli con una precisión de> 99.9999% y un costo de aproximadamente 1/9 de la secuenciación de Sanger. ^[80]La tecnología se otorgó bajo licencia a Agencourt Biosciences, posteriormente se expandió a Agencourt Personal Genomics y finalmente se incorporó a Applied Biosystems.Plataforma SOLID. Applied Biosystems fue posteriormente adquirida por Life Technologies , ahora parte de Thermo Fisher Scientific .

454 pirosecuenciación [ editar ]

Una versión en paralelo de pirosecuenciación fue desarrollada por 454 Life Sciences , que desde entonces ha sido adquirida por Roche Diagnostics . El método amplifica el ADN en el interior de las gotas de agua en una solución de aceite (emulsión PCR), y cada gota contiene una única plantilla de ADN unida a una única perla recubierta con cebador que luego forma una colonia clonal. La máquina de secuenciación contiene muchos pocillos de picolitro, cada uno de los cuales contiene una sola perla y enzimas de secuenciación. La pirosecuenciación usa luciferasa para generar luz para la detección de los nucleótidos individuales agregados al ADN naciente, y los datos combinados se usan para generar lecturas de secuencia . ^[48]Esta tecnología proporciona longitud de lectura intermedia y precio por base en comparación con la secuenciación de Sanger en un extremo y Solexa y SOLiD en el otro. ^[60]

Secuenciación de Illumina (Solexa) [ editar ]

Solexa , ahora parte de Illumina , fue fundada por Shankar Balasubramanian y David Klenerman en 1998, y desarrolló un método de secuenciación basado en la tecnología de terminadores de tinte reversibles y polimerasas diseñadas. ^[81] El concepto de química terminada reversible fue inventado por Bruno Canard y Simon Sarfati en el Instituto Pasteur de París. ^[82]^[83] Fue desarrollado internamente en Solexa por los nombrados en las patentes relevantes. En 2004, Solexa adquirió la compañía Manteia Predictive Medicine para obtener una tecnología de secuenciación masivamente paralela inventada en 1997 por Pascal Mayer y Laurent Farinelli. ^[38]Se basa en "grupos de ADN" o "colonias de ADN", que involucran la amplificación clonal de ADN en una superficie. La tecnología de cluster fue co-adquirida con Lynx Therapeutics of California. Solexa Ltd. más tarde se fusionó con Lynx para formar Solexa Inc.

Un secuenciador Illumina HiSeq 2500

En este método, las moléculas de ADN y los cebadores se unen primero en una celda de deslizamiento o flujo y se amplifican con polimerasapara que se formen las colonias locales de ADN clonal, que luego se denominan "agrupaciones de ADN". Para determinar la secuencia, se agregan cuatro tipos de bases terminadoras reversibles (bases RT) y se eliminan por lavado los nucleótidos no incorporados. Una cámara toma imágenes de los nucleótidos marcados con fluorescencia . Luego, el tinte, junto con el bloqueador terminal 3 ', se elimina químicamente del ADN, lo que permite que comience el siguiente ciclo. A diferencia de la pirosecuenciación, las cadenas de ADN se extienden un nucleótido a la vez y la adquisición de imágenes se puede realizar en un momento demorado, lo que permite capturar matrices muy grandes de colonias de ADN mediante imágenes secuenciales tomadas desde una sola cámara.

Un secuenciador Illumina MiSeq

El desacoplamiento de la reacción enzimática y la captura de imágenes permite un rendimiento óptimo y una capacidad de secuenciación teóricamente ilimitada. Con una configuración óptima, el rendimiento del instrumento al que se puede llegar finalmente es dictado únicamente por la tasa de conversión de analógico a digital de la cámara, multiplicado por el número de cámaras y dividido por el número de píxeles por colonia de ADN requeridos para visualizarlos de manera óptima (aproximadamente 10 píxeles / colonia). En 2012, con cámaras que operan a velocidades de conversión A / D de más de 10 MHz y ópticas, fluídicas y enzimáticas disponibles, el rendimiento puede ser múltiplos de 1 millón de nucleótidos / segundo, que corresponde aproximadamente a 1 genoma humano equivalente a 1x de cobertura.por hora por instrumento y 1 genoma humano re-secuenciado (a aproximadamente 30x) por día por instrumento (equipado con una sola cámara). ^[84]

Síntesis de anclaje de sonda combinatoria (cPAS) [ editar ]

Este método es una modificación mejorada de la tecnología de ligamiento de anclaje de sonda combinatoria (cPAL) descrita por Complete Genomics ^[85], que desde entonces se ha convertido en parte de la compañía china de genómica BGI en 2013. ^[86] Las dos compañías han perfeccionado la tecnología para permitir una lectura más larga Longitudes, reducciones de tiempo de reacción y tiempo más rápido para resultados. Además, los datos ahora se generan como lecturas de longitud completa contiguas en el formato de archivo FASTQ estándar y se pueden usar tal como están en la mayoría de los procesos de análisis bioinformáticos basados en lecturas cortas. ^[87]^{[ citación necesitada ]}

Las dos tecnologías que forman la base de esta tecnología de secuenciación de alto rendimiento son nanoballs de ADN (DNB) y matrices con patrones para la unión de nanoball a una superficie sólida. ^[85]Las nanobollas de ADN se forman simplemente desnaturalizando bibliotecas ligadas con adaptadores de doble cadena y ligando la cadena directa solo a un oligonucleótido de férula para formar un círculo de ADNss. Las copias fieles de los círculos que contienen el inserto de ADN se producen utilizando la Amplificación de círculo de rodadura que genera aproximadamente 300–500 copias. La hebra larga de ssDNA se pliega sobre sí misma para producir una estructura tridimensional nanoball que tiene aproximadamente 220 nm de diámetro. Hacer DNBs reemplaza la necesidad de generar copias de PCR de la biblioteca en la celda de flujo y como tal puede eliminar grandes proporciones de lecturas duplicadas, ligaduras de adaptador-adaptador y errores inducidos por PCR. ^[87]^{[ citación necesitada ]}

Un secuenciador BGI MGISEQ-2000RS

La matriz modelada de puntos cargados positivamente se fabrica mediante técnicas de fotolitografía y grabado seguidas por modificación química para generar una célula de flujo de secuenciación. Cada punto en la celda de flujo tiene un diámetro de aproximadamente 250 nm, están separados por 700 nm (de centro a centro) y permite unir fácilmente un solo DNB cargado negativamente a la celda de flujo y, por lo tanto, reduce la agrupación en la celda de flujo. ^[85]^{[ citación necesaria ]}

La secuenciación se realiza luego mediante la adición de una sonda oligonucleotídica que se une en combinación a sitios específicos dentro del DNB. La sonda actúa como un anclaje que luego permite que uno de los cuatro nucleótidos marcados, inactivados de manera reversible, se unan después de fluir a través de la celda de flujo. Los nucleótidos no unidos se eliminan por lavado antes de la excitación con láser de las etiquetas adjuntas, luego emiten fluorescencia y las cámaras capturan la señal que se convierte en una salida digital para la llamada de base. La base adjunta tiene su terminador y la etiqueta químicamente dividida al finalizar el ciclo. El ciclo se repite con otro flujo de nucleótidos marcados libres a través de la célula de flujo para permitir que el siguiente nucleótido se una y capture su señal.^{[ cita requerida ]}

Secuenciación SOLID [ editar ]

Preparación de la biblioteca para la plataforma SOLiD.

La tecnología SOLiD de Applied Biosystems (ahora una marca de Life Technologies ) emplea la secuenciación por ligadura . Aquí, un conjunto de todos los oligonucleótidos posibles de una longitud fija se marcan de acuerdo con la posición secuenciada. Los oligonucleótidos son recocidos y ligados; La ligación preferencial por la ADN ligasa para secuencias coincidentes da como resultado una señal informativa del nucleótido en esa posición. Antes de la secuenciación, el ADN se amplifica por PCR en emulsión. Las perlas resultantes, cada una de las cuales contiene copias individuales de la misma molécula de ADN, se depositan en un portaobjetos de vidrio. ^[88] El resultado son secuencias de cantidades y longitudes comparables a la secuenciación de Illumina. ^[60] Esta secuenciación por ligadura.Se ha informado que el método tiene algún problema de secuenciación de secuencias palindrómicas. ^[79]

Secuenciación de semiconductores Ion Torrent [ editar ]

Ion Torrent Systems Inc. (ahora propiedad de Life Technologies ) desarrolló un sistema basado en el uso de química de secuenciación estándar, pero con un novedoso sistema de detección basado en semiconductores. Este método de secuenciación se basa en la detección de iones de hidrógeno que se liberan durante la polimerización del ADN , a diferencia de los métodos ópticos utilizados en otros sistemas de secuenciación. Un micropocillo que contiene un filamento de ADN de plantilla que debe secuenciarse se inunda con un solo tipo de nucleótido . Si el nucleótido introducido es complementario.al nucleótido de plantilla principal se incorpora en la cadena complementaria en crecimiento. Esto provoca la liberación de un ión de hidrógeno que dispara un sensor de iones hipersensible, lo que indica que se ha producido una reacción. Si las repeticiones de homopolímerosestán presentes en la secuencia de la plantilla, se incorporarán múltiples nucleótidos en un solo ciclo. Esto conduce a un número correspondiente de hidrógenos liberados y una señal electrónica proporcionalmente más alta. ^[89]

Secuenciación de la plantilla TAGGCT con IonTorrent, PacBioRS y GridION

ADN Nanoball secuenciación [ editar ]

La secuenciación de nanoball de ADN es un tipo de tecnología de secuenciación de alto rendimiento que se utiliza para determinar la secuencia genómica completa de un organismo. La compañía Complete Genomics utiliza esta tecnología para secuenciar muestras enviadas por investigadores independientes. El método utiliza la replicación de círculo rodante para amplificar pequeños fragmentos de ADN genómico en nanoballs de ADN. Luego se usa la secuenciación no ligada por ligadura para determinar la secuencia de nucleótidos. ^[90] Este método de secuenciación de ADN permite secuenciar grandes cantidades de nanoballs de ADN por ejecución y a bajos costos de reactivos encomparación con otras plataformas de secuenciación de alto rendimiento. ^[91] Sin embargo, solo se determinan secuencias cortas de ADN a partir de cada nanobola de ADN, lo que dificulta la asignación de las lecturas cortas a un genoma de referencia . ^[90] Esta tecnología se ha utilizado para múltiples proyectos de secuenciación del genoma y está programada para ser utilizada para más. ^[92]

Heliscope secuenciación de una sola molécula [ editar ]

La secuenciación de Heliscope es un método de secuenciación de una sola molécula desarrollado por Helicos Biosciences . Utiliza fragmentos de ADN con adaptadores de cola de poli-A agregados que se unen a la superficie de la célula de flujo. Los siguientes pasos incluyen la secuenciación basada en la extensión con lavados cíclicos de la celda de flujo con nucleótidos marcados con fluorescencia (un tipo de nucleótido a la vez, como con el método de Sanger). Las lecturas son realizadas por el secuenciador Heliscope. ^[93]^[94] Las lecturas son cortas, con un promedio de 35 pb. ^[95] En 2009 se secuenció un genoma humano usando el Heliscope, sin embargo, en 2012 la empresa quebró. ^[96]

Individual tiempo real molécula (SMRT) secuenciación [ editar ]

La secuenciación SMRT se basa en el enfoque de secuenciación por síntesis. El ADN se sintetiza en guías de onda de modo cero (ZMW, por sus siglas en inglés): pequeños contenedores con forma de pozo con las herramientas de captura ubicadas en el fondo del pozo. La secuenciación se realiza con el uso de polimerasa no modificada (unida al fondo de ZMW) y nucleótidos marcados con fluorescencia que fluyen libremente en la solución. Los pozos se construyen de manera que solo se detecte la fluorescencia que se produce en el fondo del pozo. La etiqueta fluorescente se separa del nucleótido tras su incorporación en la cadena de ADN, dejando una cadena de ADN no modificada. Según Pacific Biosciences(PacBio), el desarrollador de tecnología SMRT, esta metodología permite la detección de modificaciones de nucleótidos (como la metilación de citosina). Esto sucede a través de la observación de la cinética de la polimerasa. Este enfoque permite lecturas de 20,000 nucleótidos o más, con longitudes de lectura promedio de 5 kilobases. ^[71]^[97] En 2015, Pacific Biosciences anunció el lanzamiento de un nuevo instrumento de secuenciación llamado Sequel System, con 1 millón de ZMW en comparación con 150,000 ZMW en el instrumento PacBio RS II. ^[98]^{[99] La} secuenciación SMRT se conoce como secuenciación de " tercera generación " o "lectura larga".

Nanopore secuenciación del ADN [ editar ]

El ADN que pasa a través del nanoporo cambia su corriente de iones. Este cambio depende de la forma, el tamaño y la longitud de la secuencia de ADN. Cada tipo de nucleótido bloquea el flujo de iones a través del poro durante un período de tiempo diferente. El método no requiere nucleótidos modificados y se realiza en tiempo real. La secuenciación de nanoporos se conoce como secuenciación de " tercera generación " o "lectura larga", junto con la secuenciación SMRT.

La investigación industrial inicial sobre este método se basó en una técnica llamada "Secuenciación de exonucleasa", donde la lectura de señales eléctricas que ocurren en los nucleótidos que pasan por los poros de alfa (α) -hemolisina se unen covalentemente con ciclodextrina . ^[100] Sin embargo, el método comercial posterior, la secuenciación de cadenas secuencia las bases de ADN en una cadena intacta.

Dos áreas principales de la secuenciación de nanoporos en desarrollo son la secuenciación de nanoporos en estado sólido y la secuenciación de nanoporos basada en proteínas. La secuenciación de nanoporos de proteínas utiliza complejos de proteínas de membrana tales como α-hemolisina, MspA ( Mycobacterium smegmatis Porin A) o CssG, que muestran una gran promesa dada su capacidad para distinguir entre individuos y grupos de nucleótidos. ^[101] En contraste, la secuenciación de nanoporos en estado sólido utiliza materiales sintéticos como el nitruro de silicio y el óxido de aluminio y se prefiere por su capacidad mecánica superior y estabilidad térmica y química. ^[102] El método de fabricación es esencial para este tipo de secuenciación dado que la matriz de nanoporos puede contener cientos de poros con diámetros más pequeños que ocho nanómetros.^[101]

El concepto se originó a partir de la idea de que las moléculas de ADN o ARN de una sola hebra pueden manejarse electroforéticamente en una secuencia lineal estricta a través de un poro biológico que puede ser inferior a ocho nanómetros, y puede detectarse dado que las moléculas liberan una corriente iónica mientras se mueven a través de poro. El poro contiene una región de detección capaz de reconocer diferentes bases, con cada base generando varias señales específicas de tiempo correspondientes a la secuencia de bases cuando cruzan el poro que luego se evalúan. ^[102] El control preciso sobre el transporte de ADN a través del poro es crucial para el éxito. Se han utilizado diversas enzimas, como las exonucleasas y las polimerasas, para moderar este proceso colocándolas cerca de la entrada del poro.

AMIGOS PARA SIEMPRE

Páginas

domingo, 21 de abril de 2019

QUÍMICA - MOLÉCULAS