Distancia genética - Genetic distance

Mapa de distancias genéticas de Cavalli-Sforza et al. (1994)

La distancia genética es una medida de la divergencia genética entre especies o entre poblaciones dentro de una especie, ya sea que la distancia mida el tiempo desde un ancestro común o el grado de diferenciación. Las poblaciones con muchos alelos similares tienen distancias genéticas pequeñas. Esto indica que están estrechamente relacionados y tienen un antepasado común reciente.

La distancia genética es útil para reconstruir la historia de poblaciones, como las múltiples expansiones humanas fuera de África . También se utiliza para comprender el origen de la biodiversidad . Por ejemplo, las distancias genéticas entre diferentes razas de animales domesticados a menudo se investigan para determinar qué razas deben protegerse para mantener la diversidad genética.

Fundamento biológico

En el genoma de un organismo , cada gen está ubicado en un lugar específico llamado locus de ese gen. Las variaciones alélicas en estos loci provocan variaciones fenotípicas dentro de las especies (p. Ej., Color de pelo, color de ojos). Sin embargo, la mayoría de los alelos no tienen un impacto observable en el fenotipo. Dentro de una población, los nuevos alelos generados por mutación mueren o se extienden por toda la población. Cuando una población se divide en diferentes poblaciones aisladas (por factores geográficos o ecológicos), las mutaciones que ocurren después de la división estarán presentes solo en la población aislada. La fluctuación aleatoria de las frecuencias alélicas también produce una diferenciación genética entre poblaciones. Este proceso se conoce como deriva genética . Al examinar las diferencias entre las frecuencias de los alelos entre las poblaciones y calcular la distancia genética, podemos estimar cuánto tiempo hace que las dos poblaciones se separaron.

Medidas

Aunque es sencillo definir la distancia genética como una medida de la divergencia genética, se han propuesto varias medidas estadísticas diferentes. Esto ha sucedido porque diferentes autores consideraron diferentes modelos evolutivos. Los más utilizados son la distancia genética de Nei, la medida de Cavalli-Sforza y ​​Edwards, y la distancia genética de Reynolds, Weir y Cockerham, que se enumeran a continuación.

En todas las fórmulas de esta sección, y representan dos poblaciones diferentes para las que se han estudiado los loci. Dejemos que represente la frecuencia del alelo th en el locus th .

Distancia genética estándar de Nei

En 1972, Masatoshi Nei publicó lo que llegó a conocerse como la distancia genética estándar de Nei. Esta distancia tiene la agradable propiedad de que si la tasa de cambio genético (sustitución de aminoácidos) es constante por año o generación, la distancia genética estándar de Nei ( D ) aumenta en proporción al tiempo de divergencia. Esta medida asume que las diferencias genéticas son causadas por mutación y deriva genética .

Esta distancia también se puede expresar en términos de la media aritmética de la identidad genética. Sea la probabilidad de que los dos miembros de la población tengan el mismo alelo en un locus particular y sea ​​la probabilidad correspondiente en la población . Además, sea ​​la probabilidad de que un miembro y un miembro tengan el mismo alelo. Ahora vamos , y representan la media aritmética de , y sobre todos los loci, respectivamente. En otras palabras,

donde es el número total de loci examinados.

La distancia estándar de Nei se puede escribir como

Distancia de cuerda de Cavalli-Sforza

En 1967 Luigi Luca Cavalli-Sforza y AWF Edwards publicaron esta medida. Asume que las diferencias genéticas surgen debido únicamente a la deriva genética . Una de las principales ventajas de esta medida es que las poblaciones están representadas en una hiperesfera, cuya escala es una unidad por sustitución de genes. La distancia de la cuerda en la esfera hiperdimensional viene dada por

Algunos autores eliminan el factor para simplificar la fórmula a costa de perder la propiedad de que la escala es una unidad por sustitución de genes.

Distancia genética de Reynolds, Weir y Cockerham

En 1983, esta medida fue publicada por John Reynolds, Bruce Weir y C. Clark Cockerham . Esta medida asume que la diferenciación genética ocurre solo por deriva genética sin mutaciones. Estima el coeficiente de coancestría que proporciona una medida de la divergencia genética mediante:

Otras medidas

Se han propuesto muchas otras medidas de distancia genética con éxito variable.

Distancia D A de Nei 1983

Esta distancia asume que las diferencias genéticas surgen debido a la mutación y la deriva genética , pero se sabe que esta medida de distancia proporciona árboles de población más confiables que otras distancias, particularmente para datos de ADN de microsatélites.

distancia euclidiana

Distancia genética euclidiana entre 51 poblaciones humanas en todo el mundo, calculada utilizando 289,160 SNP . El rojo oscuro es el par más similar y el azul oscuro es el par más distante.

Distancia de Goldstein 1995

Fue desarrollado específicamente para marcadores de microsatélites y se basa en el modelo de mutación escalonada (SMM). y son las medias de los tamaños de los alelos en la población X e Y.

Distancia genética mínima de Nei 1973

Esta medida asume que las diferencias genéticas surgen debido a la mutación y la deriva genética .

La distancia de Roger 1972

Índice de fijación

Una medida comúnmente utilizada de la distancia genética es el índice de fijación (F ST ) que varía entre 0 y 1. Un valor de 0 indica que dos poblaciones son genéticamente idénticas (diversidad genética mínima o nula entre las dos poblaciones) mientras que un valor de 1 indica que dos poblaciones son genéticamente diferentes (máxima diversidad genética entre las dos poblaciones). No se asume ninguna mutación. Las poblaciones grandes entre las que hay mucha migración, por ejemplo, tienden a estar poco diferenciadas, mientras que las poblaciones pequeñas entre las que hay poca migración tienden a estar muy diferenciadas. F ST es una medida conveniente de esta diferenciación y, como resultado, F ST y las estadísticas relacionadas se encuentran entre las estadísticas descriptivas más utilizadas en genética poblacional y evolutiva. Pero F ST es más que una estadística descriptiva y una medida de diferenciación genética. F ST está directamente relacionado con la varianza en la frecuencia de los alelos entre poblaciones y, a la inversa, con el grado de semejanza entre los individuos dentro de las poblaciones. Si F ST es pequeño, significa que las frecuencias alélicas dentro de cada población son muy similares; si es grande, significa que las frecuencias alélicas son muy diferentes.

Software

  • PHYLIP usa GENDIST
    • Distancia genética estándar de Nei 1972
    • Cavalli-Sforza y ​​Edwards 1967
    • 1983 de Reynolds, Weir y Cockerham
  • TFPGA
    • Distancia genética estándar de Nei (original e imparcial)
    • Distancia genética mínima de Nei (original e imparcial)
    • La modificación de Wright (1978) de la distancia de Roger (1972)
    • 1983 de Reynolds, Weir y Cockerham
  • GDA
  • POPGENE
  • POPTREE2 Takezaki, Nei y Tamura (2010, 2014)
    • Distancias genéticas y análisis de diversidad genética de uso común
  • DISPAN
    • Distancia genética estándar de Nei 1972
    • Distancia D A de Nei entre poblaciones 1983

Ver también

Referencias

enlaces externos