HomoloGene - HomoloGene
HomoloGene , una herramienta del Centro Nacional de Información Biotecnológica de los Estados Unidos (NCBI), es un sistema para la detección automática de homólogos (similitud atribuible a la descendencia de un ancestro común) entre los genes anotados de varios genomas eucariotas completamente secuenciados.
El procesamiento de HomoloGene consiste en el análisis de proteínas de los organismos de entrada. Las secuencias se comparan usando blastp, luego se emparejan y se colocan en grupos, usando un árbol taxonómico construido a partir de la similitud de secuencia, donde los organismos relacionados más cercanos se emparejan primero y luego se agregan más organismos al árbol. Las alineaciones de proteínas se mapean de nuevo a sus correspondientes secuencias de ADN, y luego se pueden calcular métricas de distancia como distancias moleculares Jukes y Cantor (1969) , la relación Ka / Ks .
Las secuencias se emparejan mediante el uso de un algoritmo heurístico para maximizar la puntuación globalmente, en lugar de localmente, en una coincidencia bipartita (consulte el gráfico bipartito completo ). Y luego calcula la significancia estadística de cada partido. Los cortes se hacen por posición y los valores de Ks se establecen para evitar que se agrupen "ortólogos" falsos . Los "parálogos" se identifican al encontrar secuencias que están más cercanas dentro de las especies que otras especies.
Organismos de entrada
Metazoos
Vertebrados
Homo sapiens , Pan troglodytes , Mus musculus , Rattus norvegicus , Canis lupus familiaris , Bos taurus , Gallus gallus , Xenopus tropicalis , Danio rerio "
Invertebrados
" Drosophila melanogaster , Anopheles gambiae , Caenorhabditis elegans "
Hongos
" Saccharomyces cerevisiae , Schizosaccharomyces pombe , Kluyveromyces lactis , Eremothecium gossypii , Magnaporthe grisea , Neurospora crassa "
Plantas
Dicotiledóneas
Monocotiledóneas
" Oryza sativa "
Protista
Interfaz
El HomoloGene está vinculado a todas las bases de datos de Entrez y se basa en la información de homología y fenotipo de estos vínculos:
- Informática del genoma del ratón (MGI),
- Red de información del pez cebra (ZFIN),
- Base de datos del genoma de Saccharomyces (SGD),
- Clústeres de grupos ortólogos (COG),
- FlyBase ,
- Herencia mendeliana en línea en el hombre (OMIM)
Como resultado, HomoloGene muestra información sobre genes, proteínas, fenotipos y dominios conservados.
Referencias
enlaces externos
- HomoloGene en el Centro Nacional de Información Biotecnológica
- Cosechador bioinformático - Cosechador bioinformático , un meta motor de búsqueda que utiliza Homologene
- OMIM
- ZFIN
- SGD
- DIENTE
- FlyBase
- MGI
- Base de datos del genoma de ratas