HomoloGene - HomoloGene

HomoloGene , una herramienta del Centro Nacional de Información Biotecnológica de los Estados Unidos (NCBI), es un sistema para la detección automática de homólogos (similitud atribuible a la descendencia de un ancestro común) entre los genes anotados de varios genomas eucariotas completamente secuenciados.

El procesamiento de HomoloGene consiste en el análisis de proteínas de los organismos de entrada. Las secuencias se comparan usando blastp, luego se emparejan y se colocan en grupos, usando un árbol taxonómico construido a partir de la similitud de secuencia, donde los organismos relacionados más cercanos se emparejan primero y luego se agregan más organismos al árbol. Las alineaciones de proteínas se mapean de nuevo a sus correspondientes secuencias de ADN, y luego se pueden calcular métricas de distancia como distancias moleculares Jukes y Cantor (1969) , la relación Ka / Ks .

Las secuencias se emparejan mediante el uso de un algoritmo heurístico para maximizar la puntuación globalmente, en lugar de localmente, en una coincidencia bipartita (consulte el gráfico bipartito completo ). Y luego calcula la significancia estadística de cada partido. Los cortes se hacen por posición y los valores de Ks se establecen para evitar que se agrupen "ortólogos" falsos . Los "parálogos" se identifican al encontrar secuencias que están más cercanas dentro de las especies que otras especies.

Organismos de entrada

Metazoos

Vertebrados

Homo sapiens , Pan troglodytes , Mus musculus , Rattus norvegicus , Canis lupus familiaris , Bos taurus , Gallus gallus , Xenopus tropicalis , Danio rerio "

Invertebrados

" Drosophila melanogaster , Anopheles gambiae , Caenorhabditis elegans "

Hongos

" Saccharomyces cerevisiae , Schizosaccharomyces pombe , Kluyveromyces lactis , Eremothecium gossypii , Magnaporthe grisea , Neurospora crassa "

Plantas

Dicotiledóneas

" Arabidopsis thaliana "

Monocotiledóneas

" Oryza sativa "

Protista

" Plasmodium falciparum .

Interfaz

El HomoloGene está vinculado a todas las bases de datos de Entrez y se basa en la información de homología y fenotipo de estos vínculos:

Como resultado, HomoloGene muestra información sobre genes, proteínas, fenotipos y dominios conservados.

Referencias

enlaces externos