La gelatina de Wharton ( sustancia gelatinea funiculi umbilicalis ) es una sustancia gelatinosa dentro del cordón umbilical también presente en el humor vítreo del globo ocular, en gran parte compuesta de mucopolisacáridos ( ácido hialurónico y sulfato de condroitina ). También contiene algunos fibroblastos y macrófagos . [1] Se deriva del mesodermo extraembrionario .
Oclusión del cordón umbilical [ editar ]
Como tejido mucoso , protege y aísla los vasos sanguíneos umbilicales . La gelatina de Wharton, cuando se expone a los cambios de temperatura, colapsa las estructuras dentro del cordón umbilical y por lo tanto proporciona una sujeción fisiológica del cordón (un promedio de) 5 minutos después del nacimiento.
Células madre [ editar ]
Las células en la gelatina de Wharton expresan varios genes de células madre , incluida la telomerasa . Se pueden extraer, cultivar e inducir para diferenciarse en tipos de células maduras, como las neuronas . [2] Por lo tanto, la gelatina de Wharton es una fuente potencial de células madre adultas (consulte también el método más común para almacenar sangre del cordón umbilical ). [3] Las células madre mesenquimales derivadas de gelatina de Wharton pueden tener un efecto inmunomodulador en los linfocitos. [4] En un estudio reciente, el trasplante de tejido de Wharton's Jelly ha demostrado ser capaz de reducir la lesión cerebral traumática y puede tener potencial terapéutico. [5]
Etimología [ editar ]
Lleva el nombre del médico y anatomista inglés Thomas Wharton (1614–1673) que lo describió por primera vez en su publicación Adenographia , o "La descripción de las glándulas del cuerpo entero", publicada por primera vez en 1656.
WormBase es una base de datos biológica en línea sobre la biología y el genoma del organismo modelo de nematodos Caenorhabditis elegans y contiene información sobre otros nematodos relacionados. [1] [2] WormBase es utilizado por la comunidad de investigación de C. elegans como un recurso de información y como un lugar para publicar y distribuir sus resultados. La base de datos se actualiza regularmente con nuevas versiones que se lanzan cada dos meses. WormBase es una de las organizaciones que participan en el proyecto de Base de datos de organismos modelo genéricos (GMOD).
Contenidos [ editar ]
WormBase comprende los siguientes conjuntos de datos principales:
- Los genomas anotados de Caenorhabditis elegans , Caenorhabditis briggsae , Caenorhabditis remanei , Caenorhabditis brenneri , Caenorhabditis Angaria , Pristionchus pacificus , Haemonchus contortus , Meloidogyne hapla , Meloidogyne incognita , Brugia malayi y Onchocerca volvulus ;
- Anotaciones curadas a mano que describen la función de ~ 20,500 genes codificadores de proteínas de C. elegans y ~ 16,000 genes codificadores de proteínas de C. elegans ;
- Familias de genes;
- Ortologías;
- Sitios de unión al factor de transcripción genómica
- Información completa sobre alelos mutantes y sus fenotipos;
- Pantallas de RNAi de genoma completo ( interferencia de ARN );
- Mapas genéticos, marcadores y polimorfismos;
- El mapa físico de C. elegans ;
- Perfiles de expresión génica (etapa, tejido y célula) de microarrays, análisis SAGE y fusiones de promotores GFP;
- El linaje celular completo del gusano;
- El diagrama de cableado del sistema nervioso de gusanos;
- Interacción proteína-proteína Datos de interactoma ;
- Relaciones reguladoras genéticas;
- Detalles de homologías de secuencia intra e interespecíficas (con enlaces a otras bases de datos de organismos modelo ).
Además, WormBase contiene una bibliografía actualizada de búsqueda de C. elegans research y está vinculada al proyecto WormBook .
Herramientas [ editar ]
WormBase ofrece muchas formas de buscar y recuperar datos de la base de datos:
- WormMart , Wiki - fue [3] una herramienta para recuperar información variada sobre muchos genes (o las secuencias de esos genes). Esta fue la implementación de WormBase de BioMart . [4]
- WormMine , Wiki - a partir de 2016, [3] la principal instalación de minería de datos. Esta es la implementación de WormBase de InterMine . [5]
- Navegador de genomas : explore los genes de C. elegans (y otras especies) en su contexto genómico
- Textpresso : una herramienta de búsqueda que consulta la literatura publicada de C. elegans (incluidos los resúmenes de reuniones) y un subconjunto de literatura sobre nematodos.
Curación de secuencia [ editar ]
La curación de secuencia en WormBase se refiere al mantenimiento y anotación de la secuencia genómica primaria y un conjunto de genes de consenso.
Secuencia del genoma [ editar ]
Aunque el C. elegansLa secuencia del genoma es la secuencia del genoma eucariota más precisa y completa, ha necesitado refinamiento continuamente a medida que se crean nuevas pruebas. Muchos de estos cambios fueron inserciones o deleciones de un solo nucleótido, sin embargo, se han descubierto varios ensamblajes erróneos grandes. Por ejemplo, en 2005 se tuvo que invertir un cósmido de 39 kb. Otras mejoras provienen de la comparación de ADN genómico con secuencias de ADNc y el análisis de datos de alto rendimiento de RNASeq. Cuando se identifican diferencias entre la secuencia genómica y las transcripciones, el nuevo análisis de los datos genómicos originales a menudo conduce a modificaciones de la secuencia genómica. Los cambios en la secuencia genómica plantean dificultades al comparar las coordenadas cromosómicas de los datos derivados de diferentes versiones de WormBase. Para ayudar a estas comparaciones,http://wiki.wormbase.org/index.php/Converting_Coordinates_between_releases
Modelos de estructura genética [ editar ]
Todos los conjuntos de genes de la especie WormBase fueron generados inicialmente por programas de predicción de genes. Los programas de predicción de genes proporcionan un conjunto razonable de estructuras de genes, pero los mejores solo predicen correctamente alrededor del 80% de las estructuras de genes completas. Tienen dificultades para predecir genes con estructuras inusuales, así como aquellos con una señal de inicio de traducción débil, sitios de empalme débiles o genes de exón individuales. Pueden predecir incorrectamente un modelo de gen de codificación donde el gen es un pseudogen y predicen las isoformas de un gen de manera deficiente, si es que lo hacen.
Los modelos de genes de C. elegans , C. briggsae , C. remanei y C. brenneri se curan manualmente. La mayoría de los cambios en la estructura génica se han basado en datos de transcripción de proyectos a gran escala, como las bibliotecas EST de Yuji Kohara, el proyecto Orfeome de Mark Vidal (worfdb.dfci.harvard.edu/) los datos de Illumina de Waterston y Hillier y los datos de 454 de Makedonka Mitreva. Sin embargo, otros tipos de datos (por ejemplo, alineamientos de proteínas, programas de predicción ab initio , sitios líderes de trans-empalme, señales de poli-A y sitios de adición, SAGE y TEC-REDlas etiquetas de transcripción, los péptidos espectroscópicos de masa y los dominios de proteínas conservados) son útiles para refinar las estructuras, especialmente cuando la expresión es baja y, por lo tanto, las transcripciones no están lo suficientemente disponibles. Cuando los genes se conservan entre las especies de nematodos disponibles, el análisis comparativo también puede ser muy informativo.
WormBase alienta a los investigadores a informarles a través de la mesa de ayuda si tienen evidencia de una estructura genética incorrecta. Cualquier evidencia de secuencia de ADNc o ARNm para el cambio debe enviarse a EMBL / GenBank / DDBJ; Esto ayuda en la confirmación y evidencia del modelo de gen, ya que WormBase recupera rutinariamente datos de secuencia de estas bases de datos públicas. Esto también hace que los datos sean públicos, lo que permite una referencia y un reconocimiento adecuados para los investigadores.
Cuando se realiza cualquier cambio en un CDS (o Pseudogene), el antiguo modelo de gen se conserva como un objeto 'histórico'. Esto tendrá un nombre de sufijo como: “AC3.5: wp119”, donde 'AC3.5' es el nombre del CDS y el '119' se refiere a la versión de la base de datos en la que se realizó el cambio. La razón del cambio y la evidencia del cambio se agregan a la anotación del CDS; estos se pueden ver en la sección Visible / Observación de la sección 'Visualización de árbol' del CDS en el sitio web WormBase.
Nomenclatura de genes [ editar ]
Genes [ editar ]
En WormBase, un gen es una región que se expresa o una región que se ha expresado y ahora es un pseudogen. Los genes tienen identificadores únicos como 'WBGene00006415'. Todos los genes de C. elegans WormBase también tienen un nombre de secuencia, que se deriva del cósmido, el fósmido o el clon YAC en el que residen, por ejemplo F38H4.7 , lo que indica que está en el cósmido 'F38H4', y hay al menos 6 otros genes en ese cósmido. Si un gen produce una proteína que se puede clasificar como miembro de una familia, al gen también se le puede asignar un nombre CGC como tag-30, lo que indica que este es el trigésimo miembro de la familia de genes etiqueta . La asignación de nombres de familias de genes está controlada por WormBase [6]y las solicitudes de nombres deben hacerse, antes de la publicación, a través del formulario en: http://tazendra.caltech.edu/~azurebrd/cgi-bin/forms/gene_name.cgi
Hay algunas excepciones a este formato, como los genes cln-3.1 , cln-3.2 y cln-3.3, todos los cuales son igualmente similares al gen humano CLN3 . Los nombres de GCG de genes para especies no elegantes en WormBase tienen el código de especie de 3 letras antepuesto, como Cre-acl-5 , Cbr-acl-5 , Cbn-acl-5 .
Un gen puede ser un pseudogen, o puede expresar uno o más genes de ARN no codificantes (ncRNA) o secuencias codificantes de proteínas (CDS).
Pseudogenes [ editar ]
Los pseudogenes son genes que no producen una transcripción funcional razonable. Pueden ser pseudogenes de genes codificantes o de ARN no codificantes y pueden ser enteros o fragmentos de un gen y pueden o no expresar una transcripción. El límite entre lo que se considera una transcripción de codificación razonable es a veces subjetivo ya que, en ausencia de otra evidencia, el uso de sitios de empalme débiles o exones cortos a menudo puede producir un modelo putativo, aunque insatisfactorio, de un CDS. Los pseudogenes y genes con una estructura problemática se revisan constantemente en WormBase y se utilizan nuevas pruebas para tratar de resolver su estado.
CDS [ editar ]
Las secuencias de codificación (CDS) son la única parte de la estructura de un gen que se cura manualmente en WormBase. La estructura del gen y sus transcripciones se derivan de la estructura de sus CDS.
Los CDS tienen un Nombre de secuencia que se deriva del mismo Nombre de secuencia que su objeto Gene primario, por lo que el gen 'F38H4.7' tiene un CDS llamado 'F38H4.7'. El CDS especifica la codificación de exones en el gen desde el codón START (Metionina) hasta (e incluyendo) el codón STOP.
Cualquier gen puede codificar múltiples proteínas como resultado de un empalme alternativo. Estas isoformas tienen un nombre que se forma a partir del nombre de secuencia del gen con una letra única añadida. En el caso del gen bli-4 hay 6 isoformas de CDS conocidas, llamadas K04F10.4a, K04F10.4b, K04F10.4c, K04F10.4d, K04F10.4e y K04F10.4f.
Es común referirse a las isoformas en la literatura usando el nombre de familia del gen CGC con una letra adjunta, por ejemplo pha-4a , sin embargo, esto no tiene significado dentro de la base de datos WormBase y las búsquedas de pha-4a en WormBase no devolverán nada. El nombre correcto de esta isoforma es el nombre de CDS / Transcripción: F38A6.1a , o incluso mejor, el nombre de la proteína: WP: CE15998 .
Transcripciones de genes [ editar ]
Las transcripciones de un gen en WormBase se derivan automáticamente mapeando cualquier alineamiento de ADNc o ARNm disponible en el modelo CDS. Por lo tanto, estas transcripciones de genes a menudo incluirán los exones UTR que rodean al CDS. Si no hay transcripciones de ADNc o ARNm disponibles, las transcripciones de genes tendrán exactamente la misma estructura que los CDS en los que están modeladas.
Las transcripciones de genes llevan el nombre del nombre de secuencia del CDS utilizado para crearlas, por ejemplo, F38H4.7 o K04F10.4a .
Sin embargo, si hay un empalme alternativo en los UTR, que no cambiaría la secuencia de la proteína, las transcripciones empalmadas alternativamente se nombran con un dígito adjunto, por ejemplo: K04F10.4a.1 y K04F10.4a.2 . Si no hay isoformas del gen de codificación, por ejemplo AC3.5 , pero hay un empalme alternativo en los UTR, habrá múltiples transcripciones llamadas AC3.5.1 y AC3.5.2 , etc. Si no hay transcripciones UTR alternativas, el único coding_transcript se llama igual que el CDS y no tiene el .1 adjunto, como en el caso de K04F10.4f.
Operones [ editar ]
Los grupos de genes que se co-transcriben como operones se curan como objetos Operon. Estos tienen nombres como CEOP5460 y se curan manualmente utilizando evidencia de los sitios de secuencia líder trans-empalmados con SL2.
Genes de ARN no codificantes [ editar ]
Hay varias clases de clases de genes de ARN no codificantes en WormBase:
- Los genes de tRNA son predichos por el programa 'tRNAscan-SE'.
- Los genes de ARNr se predicen por homología con otras especies.
- snRNA genes se importan principalmente de Rfam .
- Los genes piRNA provienen de un análisis del motivo característico en estos genes.
- Los genes miRNA se han importado principalmente de miRBase . Tienen la transcripción primaria y la transcripción madura marcada. La transcripción primaria tendrá un nombre de secuencia como W09G3.10 y la transcripción madura tendrá una letra agregada a este nombre como W09G3.10a (y si hay transcripciones maduras alternativas, W09G3.10b , etc.).
- snoRNA genes se importan principalmente de Rfam o de documentos.
- Los genes de ncRNA que no tienen otra función obvia pero que obviamente no codifican proteínas ni son pseudogenes están curados. Muchos de estos han conservado la homología con genes en otras especies. Algunos de estos se expresan en sentido inverso a los genes que codifican proteínas.
También hay un gen scRNA.
Transposones [ editar ]
Los transposones no se clasifican como genes y, por lo tanto, no tienen un objeto genético primario. Su estructura está seleccionada como un objeto Transposon_CDS con un nombre como C29E6.6 .
Otras especies [ editar ]
Las especies no elegans en WormBase tienen genomas que se han ensamblado a partir de tecnologías de secuenciación que no implican la secuenciación de cósmidos o YAC. Por lo tanto, estas especies no tienen nombres de secuencia para CDS y transcripciones de genes basadas en nombres de cósmidos. En cambio, tienen identificadores alfanuméricos únicos construidos como los nombres en la tabla a continuación.
Especies | Nombre del gen de ejemplo |
---|---|
C. briggsae | CBG00001 |
C. remanei | CRE00001 |
C. brenneri | CBN00001 |
C. japonica | CJA00001 |
Pristionchus pacificus | PPA00001 |
Proteínas [ editar ]
Los productos proteicos del gen se crean traduciendo las secuencias de CDS. Cada secuencia de proteína única recibe un nombre de identificación único como WP: CE40440 . En la tabla a continuación se dan ejemplos de los nombres de los identificadores de proteínas para cada especie en WormBase.
Especies | Ejemplo de nombre de proteína |
---|---|
C. elegans | WP: CE00001 |
C. briggsae | BP: CBP00001 |
C. remanei | RP: RP00001 |
C. brenneri | CN: CN00001 |
C. japonica | JA: JA00001 |
Pristionchus pacificus | PP: PP00001 |
Heterorhabditis bacteriophora | HB: HB00001 |
Brugia malayi | BM: BM00001 |
Meloidogyne hapla | MH: MH00001 |
Meloidogyne incognita | MI: MI00001 |
Haemonchus contortus | HC: HC00001 |
Es posible que dos secuencias de CDS de genes separados, dentro de una especie, sean idénticas y, por lo tanto, es posible tener proteínas idénticas codificadas por genes separados. Cuando esto sucede, se utiliza un único nombre de identificación único para la proteína a pesar de que es producida por dos genes.
ParaSite [ editar ]
WormBase ParaSite es un sub-portal para aproximadamente 100 borradores de genomas de helmintos parásitos ( nematodos y platelmintos ) desarrollados en el Instituto Europeo de Bioinformática y el Instituto Wellcome Trust Sanger . [7] Todos los genomas están ensamblados y anotados. Información adicional como dominios de proteínas y términos de ontología genética también están disponibles. Los árboles genéticos permiten la alineación de ortólogos entre gusanos parásitos, otros nematodos y especies de comparación no gusanos. Se ofrece una herramienta de minería de datos BioMart para permitir el acceso a gran escala a los datos.
Gestión de WormBase [ editar ]
WormBase es una colaboración entre el Instituto Europeo de Bioinformática , el Instituto Wellcome Trust Sanger , el Instituto de Ontario para la Investigación del Cáncer , la Universidad de Washington en St. Louis y el Instituto de Tecnología de California . Está respaldado por la subvención P41-HG002223 de los Institutos Nacionales de Salud y la subvención G0701197 del British Medical Research Council . [8] Caltech lleva a cabo la curación biológica y desarrolla las ontologías subyacentes, el EBI lleva a cabo la curación y el cálculo de la secuencia, así como la creación de bases de datos, el Sanger está involucrado principalmente en la curación y visualización de genomas y genes de nematodos parásitos, y el OICR desarrolla el sitio web y los principales herramientas de minería de datos.
No hay comentarios:
Publicar un comentario