Análisis de rasgos complejos de todo el genoma - Genome-wide complex trait analysis

Análisis de rasgos complejos en todo el genoma ( GCTA ) La máxima verosimilitud restringida basada en el genoma ( GREML ) es un método estadístico para la estimación de componentes de varianza en genética que cuantifica la contribución total de sentido estrecho (aditivo) a la heredabilidad de un rasgo de un subconjunto particular de variantes genéticas (normalmente limitado a SNP con MAF > 1%, de ahí términos como "heredabilidad del chip" / "heredabilidad del SNP"). Esto se hace cuantificando directamente la similitud genética casual de individuos no emparentados y comparándola con su similitud medida en un rasgo; si dos individuos no emparentados son relativamente similares genéticamente y también tienen medidas de rasgos similares, entonces es probable que la genética medida influya causalmente en ese rasgo, y la correlación puede decir hasta cierto punto cuánto. Esto se puede ilustrar trazando las diferencias cuadráticas de rasgos por pares entre individuos frente a su grado estimado de parentesco. El marco GCTA se puede aplicar en una variedad de entornos. Por ejemplo, se puede utilizar para examinar los cambios en la heredabilidad durante el envejecimiento y el desarrollo. También se puede ampliar para analizar correlaciones genéticas bivariadas entre rasgos. Existe un debate en curso sobre si GCTA genera estimaciones confiables o estables de heredabilidad cuando se usa en datos actuales de SNP. El método se basa en la dicotomía falsa y obsoleta de los genes frente al medio ambiente. También adolece de graves deficiencias metodológicas, como la susceptibilidad a la estratificación de la población .

Las estimaciones de heredabilidad de GCTA son útiles porque proporcionan límites inferiores para las contribuciones genéticas a rasgos como la inteligencia sin depender de los supuestos utilizados en los estudios de gemelos y otros estudios de familia y pedigrí , lo que los corrobora y permite el diseño de una asociación de todo el genoma bien potenciada. diseños de estudio (GWAS) para encontrar las variantes genéticas específicas involucradas. Por ejemplo, una estimación de GCTA del 30% de heredabilidad de SNP es consistente con una heredabilidad genética total mayor del 70%. Sin embargo, si la estimación de GCTA fuera ~ 0%, eso implicaría una de tres cosas: a) no hay contribución genética, b) la contribución genética es completamente en forma de variantes genéticas no incluidas, o c) la contribución genética está enteramente en forma de efectos no aditivos como epistasis / dominancia . Ejecutar GCTA en cromosomas individuales y hacer una regresión de la proporción estimada de variación de rasgo explicada por cada cromosoma contra la longitud de ese cromosoma puede revelar si las variantes genéticas responsables se agrupan o se distribuyen uniformemente en todo el genoma o están ligadas al sexo . Por supuesto, los cromosomas pueden ser reemplazados por subdivisiones más detalladas o funcionalmente informadas. El examen de las correlaciones genéticas puede revelar hasta qué punto las correlaciones observadas, como entre la inteligencia y el nivel socioeconómico, se deben a los mismos rasgos genéticos y, en el caso de las enfermedades, pueden indicar vías causales compartidas, como las que se pueden inferir de la variación genética asociada conjuntamente. con esquizofrenia y otras enfermedades mentales o inteligencia reducida.

Historia

La estimación en biología / cría de animales usando métodos estándar ANOVA / REML de componentes de varianza como heredabilidad, ambiente compartido, efectos maternos, etc., típicamente requiere individuos de parentesco conocido como padre / hijo; esto a menudo no está disponible o los datos del pedigrí no son confiables, lo que conduce a la imposibilidad de aplicar los métodos o requiere un estricto control de laboratorio de toda la reproducción (lo que amenaza la validez externa de todas las estimaciones), y varios autores han señalado que la relación podría medirse directamente a partir de marcadores genéticos. (y si los individuos estuvieran razonablemente relacionados, económicamente se tendrían que obtener pocos marcadores para el poder estadístico), lo que llevó a Kermit Ritland a proponer en 1996 que la relación por pares medida directamente podría compararse con las mediciones de fenotipo por pares (Ritland 1996, "A Marker-based Method para inferencias sobre la herencia cuantitativa en poblaciones naturales " ).

A medida que los costos de secuenciación del genoma cayeron abruptamente durante la década de 2000, se hizo posible adquirir suficientes marcadores en suficientes sujetos para realizar estimaciones confiables utilizando individuos muy distantes. Visscher et al. 2006/2007, que utilizó marcadores SNP para estimar el parentesco real de los hermanos y estimar la heredabilidad a partir de la genética directa. En los seres humanos, a diferencia de las aplicaciones originales de animales / plantas, la relación se conoce generalmente con alta confianza en la 'población silvestre', y el beneficio de GCTA está más relacionado con evitar las suposiciones de los diseños clásicos de genética del comportamiento y verificar sus resultados, y dividir la heredabilidad por Clase SNP y cromosomas. El primer uso de GCTA propiamente dicho en humanos se publicó en 2010, y se encontró que el 45% de la varianza en la altura humana puede explicarse por los SNP incluidos. (Los grandes GWAS en altura han confirmado desde entonces la estimación). Luego se describió el algoritmo GCTA y se publicó una implementación de software en 2011. Desde entonces se ha utilizado para estudiar una amplia variedad de rasgos biológicos, médicos, psiquiátricos y psicológicos en humanos, y inspiró muchos enfoques variantes.

Beneficios

Heredabilidad robusta

Los estudios de gemelos y familias se han utilizado durante mucho tiempo para estimar la variación explicada por categorías particulares de causas genéticas y ambientales. En una amplia variedad de rasgos humanos estudiados, normalmente existe una mínima influencia del entorno compartido, una considerable influencia del entorno no compartido y un gran componente genético (en su mayoría aditivo), que es en promedio ~ 50% y, a veces, mucho más alto para algunos rasgos como como altura o inteligencia. Sin embargo, los estudios de gemelos y familias han sido criticados por basarse en una serie de supuestos que son difíciles o imposibles de verificar, como el supuesto de ambientes iguales (que los ambientes de gemelos monocigóticos y dicigóticos son igualmente similares), que no existe clasificación errónea de cigosidad (confundir idénticos con fraternos y viceversa), que los gemelos no son representativos de la población general y que no hay apareamiento selectivo . Las violaciones de estos supuestos pueden resultar en un sesgo tanto hacia arriba como hacia abajo de las estimaciones de los parámetros. (Este debate y crítica se han centrado particularmente en la heredabilidad del coeficiente intelectual ).

El uso de SNP o datos de genoma completo de participantes de sujetos no relacionados (con participantes demasiado relacionados, por lo general> 0.025 o ~ niveles de primos cuartos de similitud, eliminados, y varios componentes principales incluidos en la regresión para evitar y controlar la estratificación de la población ) omite muchas críticas de heredabilidad: los gemelos a menudo no se involucran en absoluto, no hay cuestiones de igualdad de trato, la relación se estima con precisión y las muestras se extraen de una amplia variedad de temas.

Además de ser más robustos a las violaciones de los supuestos del estudio de gemelos, los datos de SNP pueden ser más fáciles de recopilar ya que no requieren gemelos raros y, por lo tanto, también se puede estimar la heredabilidad de los rasgos raros (con la debida corrección para el sesgo de verificación ).

Energía GWAS

Las estimaciones de GCTA se pueden utilizar para resolver el problema de heredabilidad faltante y diseñar GWAS que producirán aciertos estadísticamente significativos en todo el genoma. Esto se hace comparando la estimación de GCTA con los resultados de GWAS más pequeños. Si un GWAS de n = 10k usando datos de SNP no logra encontrar ningún acierto, pero el GCTA indica una alta heredabilidad explicada por los SNP, entonces eso implica que hay una gran cantidad de variantes involucradas ( poligenicidad ) y, por lo tanto, GWAS mucho más grandes lo harán. Ser necesario estimar con precisión el efecto de cada SNP y dar cuenta directamente de una fracción de la heredabilidad de GCTA.

Desventajas

  1. Inferencia limitada: las estimaciones de GCTA son inherentemente limitadas en el sentido de que no pueden estimar la heredabilidad en sentido amplio como los estudios de gemelos / familias, ya que solo estiman la heredabilidad debido a los SNP. Por lo tanto, si bien sirven como un control crítico de la imparcialidad de los estudios de gemelos / familias, los GCTA no pueden reemplazarlos para estimar las contribuciones genéticas totales a un rasgo.
  2. Requisitos sustanciales de datos: el número de SNP genotipados por persona debe ser de miles e idealmente de cientos de miles para estimaciones razonables de similitud genética (aunque esto ya no es un problema para los chips comerciales actuales que por defecto son cientos de miles o millones de marcadores); y el número de personas, para estimaciones algo estables de heredabilidad SNP plausible, debe ser al menos n > 1000 e idealmente n > 10000. Por el contrario, los estudios de gemelos pueden ofrecer estimaciones precisas con una fracción del tamaño de la muestra.
  3. Ineficiencia computacional: la implementación original de GCTA escala mal con el aumento del tamaño de los datos ( ), por lo que incluso si hay suficientes datos disponibles para estimaciones precisas de GCTA, la carga computacional puede ser inviable. GCTA se puede metanálisis como un metanálisis de efectos fijos ponderado con precisión estándar, por lo que los grupos de investigación a veces estiman cohortes o subconjuntos y luego los agrupan metanalíticamente (a costa de complejidad adicional y cierta pérdida de precisión). Esto ha motivado la creación de implementaciones más rápidas y algoritmos variantes que hacen diferentes suposiciones, como el uso de la coincidencia de momentos .
  4. Necesidad de datos en bruto: GCTA requiere similitud genética de todos los sujetos y, por lo tanto, su información genética en bruto; Debido a problemas de privacidad, los datos de pacientes individuales rara vez se comparten. GCTA no se puede ejecutar en las estadísticas de resumen informadas públicamente por muchos proyectos de GWAS y, si se combinan varias estimaciones de GCTA, se debe realizar un metanálisis .
    Por el contrario, existen técnicas alternativas que operan en resúmenes informados por GWAS sin requerir los datos brutos, por ejemplo, la " regresión de puntaje LD " contrasta las estadísticas de desequilibrio de vinculación (disponibles en conjuntos de datos públicos como 1000 genomas ) con los tamaños de efecto de resumen público para inferir la heredabilidad y estimar correlaciones genéticas / superposiciones de múltiples rasgos. El Broad Institute ejecuta LD Hub, que proporciona una interfaz web pública para> = 177 rasgos con regresión de puntuación LD. Otro método que utiliza datos resumidos es HESS.
  5. Los intervalos de confianza pueden ser incorrectos, o estar fuera del rango de heredabilidad 0-1, y muy imprecisos debido a la asintótica.
  6. Subestimación de la heredabilidad de SNP: GCTA asume implícitamente que todas las clases de SNP, más raras o más comunes, más nuevas o más antiguas, más o menos en desequilibrio de ligamiento, tienen los mismos efectos en promedio; en los seres humanos, las variantes más raras y más nuevas tienden a tener efectos más grandes y más negativos, ya que representan una carga de mutación que se purga mediante la selección negativa . Al igual que con el error de medición, esto sesgará las estimaciones de GCTA hacia subestimar la heredabilidad.

Interpretación

Las estimaciones de GCTA a menudo se malinterpretan como "la contribución genética total", y dado que a menudo son mucho menores que las estimaciones del estudio de gemelos, se presume que los estudios de gemelos están sesgados y la contribución genética a un rasgo particular es menor. Esto es incorrecto, ya que las estimaciones de GCTA son límites inferiores.

Una interpretación más correcta sería que: Las estimaciones de GCTA son la cantidad esperada de varianza que podría predecirse mediante un GWAS indefinidamente grande utilizando un modelo lineal aditivo simple (sin interacciones o efectos de orden superior) en una población en particular en un momento determinado dado la selección limitada de SNP y un rasgo medido con una cantidad particular de precisión. Por lo tanto, hay muchas formas de superar las estimaciones de GCTA:

  1. Los datos de genotipado de SNP se limitan típicamente a 200k-1m de los SNP más comunes o científicamente interesantes, aunque se han documentado más de 150 millones mediante secuenciación del genoma; A medida que bajan los precios de SNP y las matrices se vuelven más completas o la secuenciación del genoma completo reemplaza por completo el genotipado de SNP, la heredabilidad de sentido estrecho esperada aumentará a medida que se incluyan más variantes genéticas en el análisis. La selección también se puede ampliar considerablemente utilizando haplotipos e imputación (los SNP pueden representar variantes genéticas no observadas con las que tienden a heredarse); por ejemplo, Yang et al. 2015 encuentra que con un uso más agresivo de la imputación para inferir variantes no observadas, la estimación de la altura GCTA se expande al 56% desde el 45%, y Hill et al. 2017 encuentra que expandir GCTA para cubrir variantes más raras eleva las estimaciones de inteligencia de ~ 30% a ~ 53% y explica toda la heredabilidad en su muestra; para 4 rasgos en el Biobanco del Reino Unido, imputando elevadas las estimaciones de heredabilidad del SNP. Las variantes genéticas adicionales incluyen mutaciones de novo / carga de mutaciones y variaciones estructurales , como variaciones en el número de copias .
  2. Las estimaciones de heredabilidad de sentido estricto suponen una simple aditividad de los efectos, ignorando las interacciones. Como algunos valores de los rasgos se deben a estos efectos más complicados, el efecto genético total excederá el del subconjunto medido por GCTA, y a medida que se encuentren y midan los SNP aditivos, será posible encontrar interacciones también utilizando estadísticas más sofisticadas. modelos.
  3. todas las estimaciones de correlación y heredabilidad están sesgadas a cero por la presencia de errores de medición ; la necesidad de ajustar esto conduce a técnicas como la corrección de Spearman para el error de medición , ya que la subestimación puede ser bastante severa para rasgos donde la medición precisa y a gran escala es difícil y costosa, como la inteligencia. Por ejemplo, una estimación de inteligencia GCTA de 0.31, basada en una medición de inteligencia con confiabilidad de prueba-reprueba , después de la corrección ( ), sería una estimación verdadera de ~ 0.48, lo que indica que los SNP comunes por sí solos explican la mitad de la varianza. Por lo tanto, un GWAS con una mejor medición de la inteligencia puede esperar encontrar más resultados de inteligencia que los indicados por un GCTA basado en una medición más ruidosa.

Implementaciones

GCTA
Autor (es) original (es) Jian Yang
Versión inicial 30 de agosto de 2010 ; Hace 11 años ( 2010-08-30 )
Lanzamiento (s) estable (s)
1.26.0 / 22 de junio de 2016 ; Hace 5 años ( 22/06/2016 )
Versión (s) de vista previa
1.93.2beta / 8 de mayo de 2020 ; Hace 15 meses ( 08/05/2020 )
Escrito en C ++
Sistema operativo Linux
macOS (no completamente probado)
Windows (no completamente probado)
Plataforma x86_64
Disponible en inglés
Escribe Genética
Licencia GPL v3 (código fuente)
MIT (archivos ejecutables)
Sitio web cnsgenomics .com / software / gcta /
A partir de 8 de abril de 2021

El paquete de software original "GCTA" es el más utilizado; su funcionalidad principal cubre la estimación GREML de la heredabilidad de SNP, pero incluye otras funcionalidades:

  • Estimar la relación genética de los SNP de todo el genoma;
  • Estimar el coeficiente de consanguinidad a partir de SNP de todo el genoma;
  • Estimar la varianza explicada por todos los SNP autosómicos ;
  • Divida la variación genética en cromosomas individuales;
  • Estime la variación genética asociada con el cromosoma X;
  • Probar el efecto de la compensación de dosis sobre la variación genética en el cromosoma X ;
  • Predecir los efectos genéticos aditivos en todo el genoma para sujetos individuales y para SNP individuales;
  • Estimar la estructura LD que abarca una lista de SNP objetivo;
  • Simular datos de GWAS basados ​​en los datos de genotipos observados;
  • Convierta los datos de genotipos sin procesar de Illumina en formato PLINK ;
  • Análisis condicional y conjunto de estadísticas resumidas de GWAS sin datos de genotipo a nivel individual
  • Estimación de la correlación genética entre dos rasgos (enfermedades) utilizando datos SNP
  • Análisis de asociación de modelo lineal mixto

Otras implementaciones y algoritmos variantes incluyen:

Rasgos

Las estimaciones de GCTA con frecuencia encuentran estimaciones de 0.1-0.5, consistentes con las estimaciones de heredabilidad de sentido amplio (con la excepción de los rasgos de personalidad, para los cuales la teoría y los resultados actuales de GWAS sugieren genética no aditiva impulsada por la selección dependiente de la frecuencia ). Los rasgos GCTA univariados se han utilizado en (excluyendo las estimaciones de heredabilidad de SNP calculadas mediante otros algoritmos como la regresión de puntuación LD y los GCTA bivariados que se enumeran en correlación genética ) incluyen (formato de estimación puntual: " ( error estándar )"):

Ver también

Referencias

  1. ^ Figura 3 de Yang et al 2010, o Figura 3 de Ritland & Ritland 1996
  2. ^ "Contribuciones genéticas a la estabilidad y el cambio en la inteligencia desde la infancia hasta la vejez" , Deary et al 2012
  3. ^ Lee et al 2012, "Estimación de pleiotropía entre enfermedades complejas mediante relaciones genómicas derivadas de polimorfismo de un solo nucleótido y máxima probabilidad restringida"
  4. ^ Krishna Kumar, Siddharth; Feldman, Marcus W .; Rehkopf, David H .; Tuljapurkar, Shripad (5 de enero de 2016). "Limitaciones de GCTA como solución al problema de heredabilidad faltante" . Actas de la Academia Nacional de Ciencias de los Estados Unidos de América . 113 (1): E61–70. doi : 10.1073 / pnas.1520109113 . ISSN  1091-6490 . PMC  4711841 . PMID  26699465 .
  5. ^ BURT, CALLIE H .; SIMONS, RONALD L. (febrero de 2015). "Estudios de heredabilidad en la era postgenómica: el defecto fatal es conceptual". Criminología . 53 (1): 103-112. doi : 10.1111 / 1745-9125.12060 .
  6. ^ Duncan, LE; Ratanatharathorn, A .; Aiello, AE; Almli, LM; Amstadter, AB; Ashley-Koch, AE; Baker, DG; Beckham, JC; Bierut, LJ (marzo de 2018). "El mayor GWAS de PTSD (N = 20 070) produce superposición genética con esquizofrenia y diferencias sexuales en la heredabilidad" . Psiquiatría molecular . 23 (3): 666–673. doi : 10.1038 / mp.2017.77 . ISSN  1476-5578 . PMC  5696105 . PMID  28439101 . "Un error común acerca de las estimaciones de heredabilidad del chip SNP calculadas con GCTA y LDSC es que deben ser similares a las estimaciones de los estudios de gemelos, cuando en realidad los estudios de gemelos tienen la ventaja de capturar todos los efectos genéticos: comunes, raros y aquellos que no están genotipados por los métodos disponibles. Por lo tanto, la suposición debe ser que h2SNP <h2TWIN cuando se usa GCTA y LDSC, y esto es lo que observamos para el PTSD, como se ha observado para muchos otros fenotipos.
  7. Eric Turkheimer ( "Still Missing" , Turkheimer 2011) analiza los resultados de GCTA en el contexto del debate del estudio de gemelos: "De las tres reservas sobre la heredabilidad genética cuantitativa que se esbozaron al principio, las suposiciones de los estudios de gemelos y familias, el universalidad de la heredabilidad y ausencia de mecanismo: el nuevo paradigma ha dejado al primero de ellos, y antes de continuar explicando mi escepticismo sobre si se han resuelto los problemas más importantes, vale la pena apreciar lo significativo que es este logro. El programa de investigación de Visscher, ahora debería ser imposible argumentar que todo el cuerpo de la investigación genética cuantitativa que muestra la importancia universal de los genes para el desarrollo humano se basaba de alguna manera en una visión optimista del supuesto de ambientes iguales en los estudios de gemelos, poniendo fin a toda una escuela de pensamiento equivocada entre los oponentes tradicionales de la genética cuantitativa clásica (y por asociación conductual) (p. ej., Joseph , 2010; Kamin y Goldberger, 2002) "; véase también Turkheimer, Harden y Nisbett :" Estos métodos han proporcionado a los científicos una nueva forma de calcular la heredabilidad: los estudios que miden directamente la variación de la secuencia del ADN han demostrado que los pares de personas que no son parientes, pero que son un poco más similares genéticamente, también tienen un coeficiente intelectual más similar que otros pares de personas que resultan ser más diferentes genéticamente. Estos estudios de heredabilidad "basados ​​en el ADN" no dicen mucho más que los estudios de gemelos clásicos, pero eliminan muchas de las sospechas persistentes de que los estudios de gemelos eran fundamentalmente defectuosos de alguna manera. Al igual que la validez de las pruebas de inteligencia, la heredabilidad de la inteligencia ya no es científicamente controvertida ".
  8. ^ "Este hallazgo de pleiotropía fuerte en todo el genoma a través de diversas habilidades cognitivas y de aprendizaje, indexadas por la inteligencia general, es un hallazgo importante sobre los orígenes de las diferencias individuales en la inteligencia. No obstante, este hallazgo parece haber tenido poco impacto en campos relacionados como neurociencia cognitiva o psicología cognitiva experimental. Sugerimos que parte de la razón de esta negligencia es que estos campos generalmente ignoran las diferencias individuales. siempre ha habido preocupaciones sobre algunas de sus suposiciones; 6 juzgamos que esto cambiará ahora que GCTA está comenzando a confirmar los resultados gemelos ". - "Diferencias entre genética e inteligencia: cinco hallazgos especiales" , Plomin & Deary 2015
  9. ^ "Los 10 principales hallazgos replicados de la genética del comportamiento" , Plomin et al., 2016: "Esta investigación se ha basado principalmente en el diseño de gemelos en el que se compara el parecido de gemelos idénticos y fraternos y en el diseño de adopción en el que el parecido de parientes separados por adopción se compara. Aunque los diseños gemelos y de adopción han sido criticados por separado (Plomin et al., 2013), estos dos diseños generalmente convergen en la misma conclusión a pesar de estar basados ​​en supuestos muy diferentes, lo que agrega fuerza a estas conclusiones ... GCTA subestima la influencia genética por varias razones y requiere muestras de varios miles de individuos para revelar la pequeña señal de similitud genética casual del ruido de las diferencias de ADN en todo el genoma (Vinkhuyzen, Wray, Yang, Goddard y Visscher, 2013). ha aportado pruebas sistemáticas de una influencia genética significativa en las capacidades cognitivas (Benyamin et al., 2014; Davies et al., 2015; St. Pourcain et al., 2014 ), psicopatología (LK Davis et al., 2013; Gaugler y col., 2014; Klei et al., 2012; Lubke et al., 2012, 2014; McGue y col., 2013; Ripke y col., 2013; Wray et al., 2014), personalidad (CA Rietveld, Cesarini, et al., 2013; Verweij et al., 2012; Vinkhuyzen et al., 2012) y uso de sustancias o dependencia de drogas (Palmer et al., 2015; Vrieze, McGue, Miller, Hicks y Iacono, 2013), lo que respalda los resultados de los estudios de gemelos y de adopción ".
  10. ^ ver también Ritland 1996b, "Estimadores de parentesco y coeficientes de consanguinidad individual" ; Ritland & Ritland 1996, "Inferencias sobre la herencia cuantitativa basadas en la estructura de la población natural en la flor de mono amarillo, Mimulus guttatus " ; Lynch & Ritland 1999, "Estimación de la relación por pares con marcadores moleculares" ; Ritland 2000, "Parentesco inferido por marcadores como herramienta para detectar la heredabilidad en la naturaleza" ; Thomas 2005, "La estimación de las relaciones genéticas utilizando marcadores moleculares y su eficiencia en la estimación de la heredabilidad en poblaciones naturales"
  11. ^ Visscher et al 2006, "Estimación libre de suposiciones de heredabilidad a partir del intercambio de identidad por descendencia en todo el genoma entre hermanos completos"
  12. ^ Visscher et al 2007, "Partición del genoma de la variación genética para la altura de 11.214 pares de hermanos"
  13. ^ "Los SNP comunes explican una gran proporción de heredabilidad para la altura humana" , Yang et al 2010
  14. ^ " Un comentario sobre 'Los SNP comunes explican una gran proporción de la heredabilidad de la altura humana' por Yang et al. (2010)" , Visscher et al 2010
  15. ^ "Definición del papel de la variación común en la arquitectura genómica y biológica de la altura humana adulta" , Wood et al 2014
  16. ^ "GCTA: una herramienta para el análisis de rasgos complejos en todo el genoma" , Yang et al 2011
  17. ^ "Metaanálisis de la heredabilidad de los rasgos humanos basado en cincuenta años de estudios de gemelos" , Polderman et al 2015
  18. ^ Barnes, JC; Wright, John Paul; Boutwell, Brian B .; Schwartz, Joseph A .; Connolly, Eric J .; Nedelec, Joseph L .; Castor, Kevin M. (1 de noviembre de 2014). "Demostrar la validez de la investigación de gemelos en criminología" . Criminología . 52 (4): 588–626. doi : 10.1111 / 1745-9125.12049 . ISSN  1745-9125 .
  19. ^ "GCTA eventualmente proporcionará pruebas de ADN directas de resultados genéticos cuantitativos basados ​​en estudios de gemelos y de adopción. Un problema es que se requieren muchos miles de individuos para proporcionar estimaciones confiables. Otro problema es que se necesitan más SNP que incluso el millón de SNP genotipados en microarreglos de SNP actuales porque hay mucha variación de ADN que no capturan estos SNP. Como resultado, GCTA no puede estimar toda la heredabilidad, quizás solo alrededor de la mitad de la heredabilidad. Los primeros informes de análisis de GCTA estiman que la heredabilidad es aproximadamente la mitad de las estimaciones de heredabilidad de gemelos y estudios de adopción para la altura (Lee, Wray, Goddard y Visscher, 2011; Yang et al., 2010; Yang, Manolio, et al "2011), y la inteligencia (Davies et al., 2011)". pg110, Behavioural Genetics , Plomin et al 2012
  20. ^ "Metanálisis de los resultados de GREML de múltiples cohortes" , Yang 2015
  21. ^ "Análisis de heredabilidad de todo el fenoma del biobanco del Reino Unido" , Ge et al 2016
  22. ^ Pasaniuc & Price 2016, "Disección de la genética de rasgos complejos utilizando estadísticas de asociación resumidas"
  23. ^ "La regresión de la puntuación LD distingue la confusión de la poligenicidad en los estudios de asociación de todo el genoma" , Bulik-Sullivan et al 2015
  24. ^ "LD Hub: una base de datos centralizada y una interfaz web para la regresión de la puntuación LD que maximiza el potencial de los datos GWAS de nivel de resumen para el análisis de correlación genética y heredabilidad de SNP" , Zheng et al 2016
  25. ^ "Contrastando la arquitectura genética de 30 rasgos complejos a partir de datos de asociación resumidos" , Shi et al 2016
  26. ^ "Construcción rápida y precisa de intervalos de confianza para la heredabilidad" , Schweiger et al 2016
  27. ^ "La arquitectura dependiente del desequilibrio de ligamiento de los rasgos complejos humanos muestra la acción de la selección negativa" , Gazal et al 2017
  28. ^ "Secuenciación profunda de 10,000 genomas humanos" , Telenti 2015
  29. ^ "Los haplotipos de SNP comunes pueden explicar la falta de heredabilidad de enfermedades complejas" , Bhatia et al 2015
  30. ^ "La estimación de la varianza genética con variantes imputadas encuentra una heredabilidad faltante insignificante para la altura humana y el índice de masa corporal" , Yang et al 2015
  31. ^ Hill et al 2017, "El análisis genómico de los datos familiares revela efectos genéticos adicionales sobre la inteligencia y la personalidad"
  32. ^ Evans et al 2017, "Comparación de métodos que utilizan datos del genoma completo para estimar la heredabilidad y la arquitectura genética de rasgos complejos"
  33. ^ Métodos de metanálisis: corrección de errores y sesgos en los resultados de la investigación , Hunter & Schmidt 2004
  34. ^ a b c d e "Documento GCTA" . cnsgenomics.com . Consultado el 8 de abril de 2021 .
  35. ^ "Modelos mixtos lineales rápidos para estudios de asociación de todo el genoma" , Lippert 2011
  36. ^ "Modelos mixtos lineales mejorados para estudios de asociación de todo el genoma" , Listgarten et al 2012
  37. ^ "Ventajas y dificultades en la aplicación de métodos de asociación de modelos mixtos" , Yang et al 2014
  38. ^ "Un modelo mixto de múltiples marcadores de lazo para el mapeo de asociación con la corrección de la estructura de la población" , Rakitsch et al 2012
  39. ^ "Análisis de modelo mixto eficiente en todo el genoma para estudios de asociación" , Zhou & Stephens 2012
  40. ^ "Modelo de componente de varianza para tener en cuenta la estructura de la muestra en estudios de asociación de todo el genoma" , Kang et al 2012
  41. ^ "Análisis avanzado de rasgos complejos" , Gray et al 2012
  42. ^ "Análisis de rasgos complejos avanzados de heredabilidad regional para GPU y arquitectura paralela tradicional" , Cebamanos et al 2012
  43. ^ "El análisis de modelo mixto bayesiano eficiente aumenta el poder de asociación en grandes cohortes" , Loh et al 2012
  44. ^ "Contrastar las arquitecturas genéticas de la esquizofrenia y otras enfermedades complejas mediante el análisis de componentes de varianza rápida" , Loh et al 2015; ver también "Arquitecturas regionales contrastantes de la esquizofrenia y otras enfermedades complejas usando análisis de componentes de varianza rápida" , Loh et al 2015
  45. ^ "Modelos mixtos para metaanálisis y secuenciación" , Bulik-Sullivan 2015
  46. ^ "Análisis de heredabilidad de todo el genoma masivamente acelerado (MEGHA)" , Ge et al 2015
  47. ^ Speed ​​et al 2016, "Reevaluación de la heredabilidad de SNP en rasgos humanos complejos"
  48. ^ Evans et al 2017, "Estimación de heredabilidad en sentido estricto de rasgos complejos utilizando información de identidad por descendencia".
  49. ^ "Mantenimiento de la variación genética en la personalidad humana: prueba de modelos evolutivos estimando la heredabilidad debido a variantes causales comunes e investigando el efecto de la endogamia distante" , Verweij et al 2012
  50. ^ "La genética evolutiva de la personalidad" , Penke et al 2007; "La genética evolutiva de la personalidad revisada" , Penke & Jokela 2016

Otras lecturas

enlaces externos