Secuenciación del genoma completo -Whole genome sequencing

Los electroferogramas se utilizan comúnmente para secuenciar porciones de genomas.
Cariograma esquemático de un ser humano, que muestra una descripción general del genoma humano , con 22 cromosomas homólogos , las versiones femenina (XX) y masculina (XY) del cromosoma sexual (abajo a la derecha), así como el genoma mitocondrial (a escala en abajo a la izquierda).

La secuenciación del genoma completo ( WGS ), también conocida como secuenciación del genoma completo , secuenciación del genoma completo o secuenciación del genoma completo , es el proceso de determinar la totalidad, o casi la totalidad, de la secuencia de ADN del genoma de un organismo en un solo momento. Esto implica secuenciar todo el ADN cromosómico de un organismo , así como el ADN contenido en las mitocondrias y, para las plantas, en el cloroplasto .

La secuenciación del genoma completo se ha utilizado en gran medida como una herramienta de investigación, pero se introdujo en las clínicas en 2014. En el futuro de la medicina personalizada , los datos de la secuencia del genoma completo pueden ser una herramienta importante para guiar la intervención terapéutica. La herramienta de secuenciación de genes a nivel de SNP también se utiliza para identificar variantes funcionales de estudios de asociación y mejorar el conocimiento disponible para investigadores interesados ​​en biología evolutiva y, por lo tanto, puede sentar las bases para predecir la susceptibilidad a enfermedades y la respuesta a fármacos.

La secuenciación del genoma completo no debe confundirse con el perfil de ADN , que solo determina la probabilidad de que el material genético provenga de un individuo o grupo en particular, y no contiene información adicional sobre las relaciones genéticas, el origen o la susceptibilidad a enfermedades específicas. Además, la secuenciación del genoma completo no debe confundirse con los métodos que secuencian subconjuntos específicos del genoma; tales métodos incluyen la secuenciación del exoma completo (1-2 % del genoma) o el genotipado SNP (< 0,1 % del genoma).

Historia

El primer genoma bacteriano completo que se secuenció fue el de la bacteria Haemophilus influenzae .
El gusano Caenorhabditis elegans fue el primer animal al que se le secuenció todo el genoma.
El genoma completo de Drosophila melanogaster fue secuenciado en 2000.
Arabidopsis thaliana fue el primer genoma vegetal secuenciado.
El genoma del ratón de laboratorio Mus musculus se publicó en 2002.
Se necesitaron 10 años y 50 científicos de todo el mundo para secuenciar el genoma de Elaeis guineensis ( palma aceitera ). Este genoma fue particularmente difícil de secuenciar porque tenía muchas secuencias repetidas que son difíciles de organizar.

Los métodos de secuenciación de ADN utilizados en las décadas de 1970 y 1980 eran manuales; por ejemplo, secuenciación de Maxam-Gilbert y secuenciación de Sanger . Mediante estas técnicas se secuenciaron varios genomas completos de bacteriófagos y virus animales, pero el cambio a métodos de secuenciación automatizados más rápidos en la década de 1990 facilitó la secuenciación de los genomas bacterianos y eucarióticos más grandes.

El primer virus en el que se secuenció su genoma completo fue el bacteriófago MS2 en 1976. En 1992, el cromosoma III de la levadura fue el primer cromosoma de cualquier organismo en ser completamente secuenciado. El primer organismo cuyo genoma completo se secuenció por completo fue Haemophilus influenzae en 1995. Después, se secuenciaron por primera vez los genomas de otras bacterias y algunas arqueas , en gran parte debido a su pequeño tamaño genómico. H. influenzae tiene un genoma de 1.830.140 pares de bases de ADN. En contraste, los eucariotas , tanto unicelulares como multicelulares como Amoeba dubia y humanos ( Homo sapiens ) respectivamente, tienen genomas mucho más grandes (ver la paradoja del valor C ). Amoeba dubia tiene un genoma de 700 mil millones de pares de nucleótidos distribuidos en miles de cromosomas . Los seres humanos contienen menos pares de nucleótidos (alrededor de 3200 millones en cada célula germinal ; tenga en cuenta que el tamaño exacto del genoma humano aún se está revisando) que A. dubia; sin embargo, el tamaño de su genoma supera con creces el tamaño del genoma de las bacterias individuales.

Los primeros genomas de bacterias y arqueas, incluido el de H. influenzae , se secuenciaron mediante secuenciación de escopeta . En 1996 se secuenció el primer genoma eucariótico ( Saccharomyces cerevisiae ). S. cerevisiae , un organismo modelo en biología , tiene un genoma de solo alrededor de 12 millones de pares de nucleótidos , y fue el primer eucariota unicelular en secuenciar todo su genoma. El primer eucariota multicelular y animal en el que se secuenció todo su genoma fue el gusano nematodo : Caenorhabditis elegans en 1998. Los genomas eucariotas se secuencian mediante varios métodos, incluida la secuenciación de escopeta de fragmentos cortos de ADN y la secuenciación de clones de ADN más grandes de bibliotecas de ADN , como bacterias. cromosomas artificiales (BAC) y cromosomas artificiales de levadura (YAC).

En 1999, se publicó la secuencia completa de ADN del cromosoma 22 humano , el autosoma humano más corto. Para el año 2000, se secuenció el segundo genoma animal y segundo invertebrado (pero el primer insecto ), el de la mosca de la fruta Drosophila melanogaster , una opción popular de organismo modelo en la investigación experimental. El primer genoma vegetal , el del organismo modelo Arabidopsis thaliana , también se secuenció por completo en 2000. En 2001, se publicó un borrador de la secuencia completa del genoma humano. El genoma del ratón de laboratorio Mus musculus se completó en 2002.

En 2004, el Proyecto Genoma Humano publicó una versión incompleta del genoma humano. En 2008, un grupo de Leiden, Países Bajos, informó sobre la secuenciación del primer genoma humano femenino ( Marjolein Kriek ).

Actualmente se han secuenciado total o parcialmente miles de genomas .

Detalles experimentales

Células utilizadas para la secuenciación

Casi cualquier muestra biológica que contenga una copia completa del ADN, incluso una cantidad muy pequeña de ADN o ADN antiguo , puede proporcionar el material genético necesario para la secuenciación completa del genoma. Dichas muestras pueden incluir saliva , células epiteliales , médula ósea , cabello (siempre y cuando el cabello contenga un folículo piloso ), semillas , hojas de plantas o cualquier otra cosa que tenga células que contengan ADN.

La secuencia del genoma de una sola célula seleccionada de una población mixta de células se puede determinar utilizando técnicas de secuenciación del genoma de una sola célula . Esto tiene importantes ventajas en microbiología ambiental en los casos en que una sola célula de una especie de microorganismo en particular puede aislarse de una población mixta mediante microscopía sobre la base de su morfología u otras características distintivas. En tales casos, pueden omitirse los pasos normalmente necesarios de aislamiento y crecimiento del organismo en cultivo, lo que permite la secuenciación de un espectro mucho mayor de genomas de organismos.

La secuenciación del genoma de una sola célula se está probando como un método de diagnóstico genético previo a la implantación , en el que se toma y analiza una célula del embrión creado por fertilización in vitro antes de la transferencia del embrión al útero. Después de la implantación, el ADN fetal libre de células puede tomarse de la madre mediante una simple venopunción y usarse para la secuenciación del genoma completo del feto.

Técnicas tempranas

Un analizador genético ABI PRISM 3100. Dichos secuenciadores capilares automatizaron los primeros esfuerzos de secuenciación de genomas.

La secuenciación de casi un genoma humano completo se logró por primera vez en 2000, en parte mediante el uso de tecnología de secuenciación de escopeta . Si bien la secuenciación de escopeta del genoma completo para genomas pequeños (4000–7000 pares de bases ) ya estaba en uso en 1979, la aplicación más amplia se benefició de la secuenciación final por pares, conocida coloquialmente como secuenciación de escopeta de doble cañón . A medida que los proyectos de secuenciación comenzaron a asumir genomas más largos y complicados, varios grupos comenzaron a darse cuenta de que se podía obtener información útil mediante la secuenciación de ambos extremos de un fragmento de ADN. Aunque la secuenciación de ambos extremos del mismo fragmento y el seguimiento de los datos emparejados fue más engorrosa que la secuenciación de un solo extremo de dos fragmentos distintos, el conocimiento de que las dos secuencias estaban orientadas en direcciones opuestas y tenían aproximadamente la longitud de un fragmento aparte de cada uno. otro fue valioso para reconstruir la secuencia del fragmento objetivo original.

La primera descripción publicada del uso de extremos emparejados fue en 1990 como parte de la secuenciación del locus HPRT humano , aunque el uso de extremos emparejados se limitó a cerrar brechas después de la aplicación de un enfoque de secuenciación de escopeta tradicional. La primera descripción teórica de una estrategia de secuenciación final por pares pura, asumiendo fragmentos de longitud constante, fue en 1991. En 1995 se introdujo la innovación de usar fragmentos de diferentes tamaños y se demostró que una estrategia de secuenciación final por pares pura sería posible en grandes objetivos Posteriormente, la estrategia fue adoptada por el Instituto de Investigación Genómica (TIGR) para secuenciar el genoma completo de la bacteria Haemophilus influenzae en 1995, y luego por Celera Genomics para secuenciar el genoma completo de la mosca de la fruta en 2000 y, posteriormente, el genoma humano completo. Applied Biosystems , ahora llamada Life Technologies , fabricó los secuenciadores capilares automatizados utilizados tanto por Celera Genomics como por The Human Genome Project.

Técnicas actuales

Si bien la secuenciación capilar fue el primer enfoque para secuenciar con éxito un genoma humano casi completo, todavía es demasiado costosa y lleva demasiado tiempo para fines comerciales. Desde 2005, la secuenciación capilar ha sido desplazada progresivamente por tecnologías de secuenciación de alto rendimiento (antes "próxima generación"), como la secuenciación de colorantes Illumina , la pirosecuenciación y la secuenciación SMRT . Todas estas tecnologías continúan empleando la estrategia básica de escopeta, es decir, la paralelización y la generación de plantillas a través de la fragmentación del genoma.

Han surgido otras tecnologías, incluida la tecnología Nanopore . Aunque la precisión de secuenciación de la tecnología Nanopore es menor que la de los anteriores, su longitud de lectura es en promedio mucho más larga. Esta generación de lecturas largas es valiosa especialmente en aplicaciones de secuenciación de genoma completo de novo .

Análisis

En principio, la secuenciación completa del genoma puede proporcionar la secuencia de nucleótidos sin procesar del ADN de un organismo individual en un solo momento. Sin embargo, se deben realizar más análisis para proporcionar el significado biológico o médico de esta secuencia, por ejemplo, cómo se puede usar este conocimiento para ayudar a prevenir enfermedades. Se están desarrollando y refinando métodos para analizar datos de secuenciación.

Debido a que la secuenciación genera una gran cantidad de datos (por ejemplo, hay aproximadamente seis mil millones de pares de bases en cada genoma diploide humano), su salida se almacena electrónicamente y requiere una gran cantidad de poder de cómputo y capacidad de almacenamiento.

Si bien el análisis de datos WGS puede ser lento, es posible acelerar este paso mediante el uso de hardware dedicado.

Comercialización

Costo total de secuenciar un genoma humano completo calculado por el NHGRI .

Varias empresas públicas y privadas compiten para desarrollar una plataforma completa de secuenciación del genoma que sea comercialmente sólida tanto para la investigación como para el uso clínico, incluidas Illumina, Knome, Sequenom, 454 Life Sciences , Pacific Biosciences , Complete Genomics , Helicos Biosciences , GE Global Research ( General Electric ), Affymetrix , IBM , Intelligent Bio-Systems, Life Technologies, Oxford Nanopore Technologies y el Instituto de Genómica de Beijing . Estas empresas están fuertemente financiadas y respaldadas por capitalistas de riesgo , fondos de cobertura y bancos de inversión .

Un objetivo comercial comúnmente mencionado para el costo de la secuenciación hasta fines de la década de 2010 era de $ 1000  USD, sin embargo, las empresas privadas están trabajando para alcanzar un nuevo objetivo de solo $ 100.

Incentivo

En octubre de 2006, la X Prize Foundation , en colaboración con la J. Craig Venter Science Foundation, estableció el Archon X Prize for Genomics, con la intención de otorgar $10 millones al "primer equipo que pueda construir un dispositivo y usarlo para secuenciar 100 genomas humanos en 10 días o menos, con una precisión de no más de un error por cada 1.000.000 de bases secuenciadas, con secuencias que cubran con precisión al menos el 98% del genoma, y ​​a un costo recurrente de no más de $1,000 por genoma". El Premio Archon X de Genómica se canceló en 2013, antes de su fecha de inicio oficial.

Historia

En 2007, Applied Biosystems comenzó a vender un nuevo tipo de secuenciador llamado SOLiD System. La tecnología permitió a los usuarios secuenciar 60 gigabases por ejecución.

En junio de 2009, Illumina anunció que estaba lanzando su propio servicio de secuenciación del genoma completo personal a una profundidad de 30x por $ 48,000 por genoma. En agosto, el fundador de Helicos Biosciences, Stephen Quake , declaró que utilizando el secuenciador de molécula única de la empresa, secuenció su propio genoma completo por menos de 50.000 dólares. En noviembre, Complete Genomics publicó un artículo revisado por pares en Science que demuestra su capacidad para secuenciar un genoma humano completo por $ 1,700.

En mayo de 2011, Illumina redujo su servicio de secuenciación completa del genoma a $5000 por genoma humano, o $4000 si pide 50 o más. Helicos Biosciences, Pacific Biosciences, Complete Genomics, Illumina, Sequenom, ION Torrent Systems, Halcyon Molecular, NABsys, IBM y GE Global parecen estar yendo cabeza a cabeza en la carrera por comercializar la secuenciación del genoma completo.

Con la disminución de los costos de secuenciación, varias empresas comenzaron a afirmar que sus equipos pronto alcanzarían el genoma de $1000: estas empresas incluyeron Life Technologies en enero de 2012, Oxford Nanopore Technologies en febrero de 2012 e Illumina en febrero de 2014. En 2015, el NHGRI estimó la costo de obtener una secuencia del genoma completo en alrededor de $ 1,500. En 2016, Veritas Genetics comenzó a vender la secuenciación del genoma completo, incluido un informe sobre parte de la información de la secuenciación por $ 999. En el verano de 2019, Veritas Genetics redujo el costo de WGS a $599. En 2017, BGI comenzó a ofrecer WGS por $600.

Sin embargo, en 2015, algunos señalaron que el uso efectivo de la secuenciación de genes completos puede costar considerablemente más de $ 1000. Además, según se informa, quedan partes del genoma humano que no se han secuenciado completamente para 2017.

Comparación con otras tecnologías

microarreglos de ADN

La secuenciación completa del genoma proporciona información sobre un genoma que es mucho más grande que las matrices de ADN , el líder anterior en tecnología de genotipado.

Para los humanos, las matrices de ADN actualmente brindan información genotípica sobre hasta un millón de variantes genéticas, mientras que la secuenciación completa del genoma brindará información sobre los seis mil millones de bases en el genoma humano, o 3000 veces más datos. Debido a esto, la secuenciación del genoma completo se considera una innovación disruptiva para los mercados de matrices de ADN, ya que la precisión de ambos oscila entre el 99,98 % y el 99,999 % (en regiones de ADN no repetitivas) y el costo de sus consumibles de $ 5000 por 6 mil millones de pares de bases es competitivo. (para algunas aplicaciones) con matrices de ADN ($500 por 1 millón de pares de bases).

Aplicaciones

Frecuencias de mutación

La secuenciación del genoma completo ha establecido la frecuencia de mutación para genomas humanos completos. La frecuencia de mutación en todo el genoma entre generaciones para humanos (de padres a hijos) es de unas 70 nuevas mutaciones por generación. Se encontró un nivel de variación aún más bajo al comparar la secuenciación del genoma completo en las células sanguíneas de un par de monocigóticos (gemelos idénticos) centenarios de 100 años. Solo se encontraron 8 diferencias somáticas, aunque la variación somática que ocurre en menos del 20% de las células sanguíneas no se detectaría.

En las regiones codificantes de proteínas específicas del genoma humano, se estima que hay alrededor de 0,35 mutaciones que cambiarían la secuencia de proteínas entre generaciones de padres e hijos (menos de una proteína mutada por generación).

En el cáncer, las frecuencias de mutación son mucho más altas debido a la inestabilidad del genoma . Esta frecuencia puede depender además de la edad del paciente, la exposición a agentes que dañan el ADN (como la radiación UV o los componentes del humo del tabaco) y la actividad/inactividad de los mecanismos de reparación del ADN. Además, la frecuencia de mutación puede variar entre los tipos de cáncer: en las células de la línea germinal, las tasas de mutación ocurren en aproximadamente 0,023 mutaciones por megabase, pero este número es mucho mayor en el cáncer de mama (1,18-1,66 mutaciones somáticas por Mb), en el cáncer de pulmón (17,7) o en melanomas (≈33). Dado que el genoma humano haploide consta de aproximadamente 3200 megabases, esto se traduce en unas 74 mutaciones (principalmente en regiones no codificantes ) en el ADN de la línea germinal por generación, pero entre 3776 y 5312 mutaciones somáticas por genoma haploide en el cáncer de mama, 56 640 en el cáncer de pulmón y 105 600 en los melanomas. .

La distribución de mutaciones somáticas en el genoma humano es muy desigual, de modo que las regiones ricas en genes y de replicación temprana reciben menos mutaciones que la heterocromatina de replicación tardía y pobre en genes, probablemente debido a la actividad diferencial de reparación del ADN. En particular, la modificación de histonas H3K9me3 está asociada con frecuencias de mutación altas y H3K36me3 con bajas.

Estudios de asociación del genoma completo

En la investigación, la secuenciación del genoma completo se puede utilizar en un estudio de asociación de todo el genoma (GWAS), un proyecto que tiene como objetivo determinar la variante o variantes genéticas asociadas con una enfermedad o algún otro fenotipo.

Uso diagnóstico

En 2009, Illumina lanzó sus primeros secuenciadores de genoma completo que fueron aprobados para uso clínico en lugar de solo para investigación y los médicos en centros médicos académicos comenzaron a usarlos silenciosamente para tratar de diagnosticar qué les pasaba a las personas a quienes los enfoques estándar no habían ayudado. En 2009, un equipo de Stanford dirigido por Euan Ashley realizó una interpretación clínica de un genoma humano completo, el del bioingeniero Stephen Quake. En 2010, el equipo de Ashley informó sobre la autopsia molecular del genoma completo y, en 2011, amplió el marco de interpretación a una familia completamente secuenciada, la familia West, que fue la primera familia secuenciada en la plataforma Illumina. El precio para secuenciar un genoma en ese momento era de $ 19,500  USD, que se facturaba al paciente pero generalmente se pagaba con una beca de investigación; una persona en ese momento había solicitado el reembolso de su compañía de seguros. Por ejemplo, un niño había necesitado alrededor de 100 cirugías cuando tenía tres años, y su médico recurrió a la secuenciación del genoma completo para determinar el problema; Se necesitó un equipo de alrededor de 30 personas que incluía a 12 expertos en bioinformática , tres técnicos de secuenciación, cinco médicos, dos asesores genéticos y dos especialistas en ética para identificar una rara mutación en el XIAP que estaba causando problemas generalizados.

Debido a las recientes reducciones de costos (ver arriba), la secuenciación del genoma completo se ha convertido en una aplicación realista en el diagnóstico de ADN. En 2013, el consorcio 3Gb-TEST obtuvo financiación de la Unión Europea para preparar el sistema sanitario para estas innovaciones en el diagnóstico de ADN. Deben existir esquemas de evaluación de la calidad , evaluación de tecnologías sanitarias y directrices . El consorcio 3Gb-TEST ha identificado el análisis y la interpretación de los datos de secuencia como el paso más complicado del proceso de diagnóstico. En la reunión del Consorcio en Atenas en septiembre de 2014, el Consorcio acuñó la palabra genotraducción para este paso crucial. Este paso conduce a un llamado genoinforme . Se necesitan lineamientos para determinar el contenido requerido de estos informes.

Genomes2People (G2P), una iniciativa del Brigham and Women's Hospital y la Escuela de Medicina de Harvard, se creó en 2011 para examinar la integración de la secuenciación genómica en la atención clínica de adultos y niños. El director de G2P, Robert C. Green , dirigió previamente el estudio REVEAL (Evaluación de riesgos y educación para la enfermedad de Alzheimer), una serie de ensayos clínicos que exploran las reacciones de los pacientes al conocer su riesgo genético de padecer Alzheimer. Green y un equipo de investigadores lanzaron el Proyecto BabySeq en 2013 para estudiar las consecuencias éticas y médicas de secuenciar el ADN de un bebé. Una segunda fase, BabySeq2, fue financiada por NIH en 2021 y es un estudio de implementación que amplía este proyecto, planeando inscribir a 500 bebés de diversas familias y rastrear los efectos de su secuenciación genómica en su atención pediátrica.

En 2018, los investigadores del Rady Children's Institute for Genomic Medicine en San Diego, CA, determinaron que la secuenciación rápida del genoma completo (rWGS, por sus siglas en inglés) puede diagnosticar trastornos genéticos a tiempo para cambiar el manejo médico o quirúrgico agudo (utilidad clínica) y mejorar los resultados en bebés con enfermedades agudas . Los investigadores informaron sobre un estudio de cohorte retrospectivo de bebés hospitalizados con enfermedades agudas en un hospital infantil regional de julio de 2016 a marzo de 2017. Cuarenta y dos familias recibieron rWGS para el diagnóstico etiológico de trastornos genéticos. La sensibilidad diagnóstica de rWGS fue del 43 % (dieciocho de 42 bebés) y del 10 % (cuatro de 42 bebés) para las pruebas genéticas estándar (p = 0,0005). La tasa de utilidad clínica de rWGS (31 %, trece de 42 bebés) fue significativamente mayor que la de las pruebas genéticas estándar (2 %, uno de 42; P = 0,0015). Once (26 %) bebés con rWGS de diagnóstico evitaron la morbilidad, uno tuvo una reducción del 43 % en la probabilidad de mortalidad y uno comenzó cuidados paliativos. En seis de los once bebés, los cambios en el manejo redujeron el costo de hospitalización entre $800,000 y $2,000,000. Estos hallazgos replican un estudio previo de la utilidad clínica de rWGS en bebés hospitalizados con enfermedades agudas y demuestran mejores resultados y ahorros netos en atención médica. rWGS merece consideración como una prueba de primer nivel en este entorno.

Una revisión de 36 publicaciones de 2018 encontró que el costo de la secuenciación del genoma completo oscila entre $ 1,906  USD y $ 24,810  USD y tiene una amplia variación en el rendimiento de diagnóstico del 17% al 73% según los grupos de pacientes.

Estudio de asociación de variantes raras

Los estudios de secuenciación del genoma completo permiten la evaluación de asociaciones entre rasgos complejos y variantes raras codificantes y no codificantes ( frecuencia de alelos menores (MAF) < 1%) en todo el genoma. Los análisis de una sola variante generalmente tienen poca potencia para identificar asociaciones con variantes raras, y se han propuesto pruebas de conjuntos de variantes para probar conjuntamente los efectos de conjuntos dados de múltiples variantes raras. Las anotaciones de SNP ayudan a priorizar variantes funcionales raras, y la incorporación de estas anotaciones puede aumentar de manera efectiva el poder de la asociación genética de análisis de variantes raras de estudios de secuenciación del genoma completo. Se han desarrollado específicamente algunas herramientas para proporcionar análisis de asociación de variantes raras todo en uno para datos de secuenciación del genoma completo, incluida la integración de datos de genotipo y sus anotaciones funcionales, análisis de asociación, resumen de resultados y visualización.

El metanálisis de los estudios de secuenciación del genoma completo proporciona una solución atractiva al problema de recolectar muestras de gran tamaño para descubrir variantes raras asociadas con fenotipos complejos. Se han desarrollado algunos métodos para permitir el análisis funcionalmente informado de asociación de variantes raras en cohortes a escala de biobanco utilizando enfoques eficientes para el almacenamiento de estadísticas resumidas.

Oncología

En este campo, la secuenciación del genoma completo representa un gran conjunto de mejoras y desafíos a los que se enfrenta la comunidad científica, ya que permite analizar, cuantificar y caracterizar el ADN tumoral circulante (ctDNA) en el torrente sanguíneo. Esto sirve como base para el diagnóstico temprano del cáncer, la selección del tratamiento y el seguimiento de la recaída , así como para determinar los mecanismos de resistencia, metástasis y patrones filogenéticos en la evolución del cáncer. También puede ayudar en la selección de tratamientos individualizados para pacientes que padecen esta patología y observar cómo están funcionando los fármacos existentes durante la progresión del tratamiento. La secuenciación profunda del genoma completo implica una reconstrucción subclonal basada en ctDNA en plasma que permite un perfil epigenómico y genómico completo , mostrando la expresión del ADN tumoral circulante en cada caso.

Preocupaciones éticas

La introducción de la secuenciación del genoma completo puede tener implicaciones éticas. Por un lado, las pruebas genéticas pueden potencialmente diagnosticar enfermedades prevenibles, tanto en el individuo que se somete a las pruebas genéticas como en sus familiares. Por otro lado, las pruebas genéticas tienen desventajas potenciales, como la discriminación genética , la pérdida del anonimato y los impactos psicológicos, como el descubrimiento de la no paternidad .

Algunos especialistas en ética insisten en que se debe proteger la privacidad de las personas que se someten a pruebas genéticas, y es de particular preocupación cuando los menores se someten a pruebas genéticas. El director ejecutivo de Illumina, Jay Flatley, afirmó en febrero de 2009 que "para 2019 se habrá convertido en una rutina mapear los genes de los bebés cuando nacen". Este uso potencial de la secuenciación del genoma es muy controvertido, ya que va en contra de las normas éticas establecidas para las pruebas genéticas predictivas de menores asintomáticos que han sido bien establecidas en los campos de la genética médica y el asesoramiento genético . Las pautas tradicionales para las pruebas genéticas se han desarrollado a lo largo de varias décadas desde que fue posible por primera vez probar los marcadores genéticos asociados con la enfermedad, antes del advenimiento de la detección genética integral y rentable.

Cuando un individuo se somete a la secuenciación del genoma completo, revela información no solo sobre sus propias secuencias de ADN, sino también sobre las probables secuencias de ADN de sus parientes genéticos cercanos. Esta información puede revelar además información predictiva útil sobre los riesgos de salud presentes y futuros de los familiares. Por lo tanto, hay preguntas importantes sobre qué obligaciones, si las hay, se deben a los miembros de la familia de las personas que se someten a pruebas genéticas. En la sociedad europea/occidental, generalmente se alienta a las personas analizadas a compartir información importante sobre cualquier diagnóstico genético con sus parientes cercanos, ya que la importancia del diagnóstico genético para la descendencia y otros parientes cercanos suele ser una de las razones para buscar una prueba genética en el futuro. primer lugar. Sin embargo, se puede desarrollar un gran dilema ético cuando los pacientes se niegan a compartir información sobre un diagnóstico que se hace para un trastorno genético grave que es altamente prevenible y donde existe un alto riesgo para los familiares portadores de la misma mutación de la enfermedad. En tales circunstancias, el médico puede sospechar que los familiares preferirían conocer el diagnóstico y, por lo tanto, el médico puede enfrentarse a un conflicto de intereses con respecto a la confidencialidad médico-paciente.

También pueden surgir problemas de privacidad cuando se utiliza la secuenciación del genoma completo en estudios de investigación científica. Los investigadores a menudo necesitan poner información sobre los genotipos y fenotipos de los pacientes en bases de datos científicas públicas, como bases de datos específicas de locus. Aunque solo se envían datos de pacientes anónimos a bases de datos específicas de locus, los pacientes aún pueden ser identificables por sus familiares en el caso de encontrar una enfermedad rara o una mutación sin sentido rara. La discusión pública sobre la introducción de técnicas forenses avanzadas (como la búsqueda familiar avanzada utilizando sitios web públicos de ascendencia de ADN y enfoques de fenotipado de ADN) ha sido limitada, inconexa y desenfocada. A medida que la genética forense y la genética médica convergen hacia la secuenciación del genoma, los problemas relacionados con los datos genéticos se conectan cada vez más y es posible que sea necesario establecer protecciones legales adicionales.

Secuencias públicas del genoma humano

Primeras personas con secuencias genómicas públicas

Los primeros genomas humanos casi completos secuenciados fueron dos estadounidenses de ascendencia predominantemente europea del noroeste en 2007 ( J. Craig Venter con una cobertura de 7,5 veces y James Watson con una cobertura de 7,4 veces). A esto le siguió en 2008 la secuenciación de un hombre chino Han anónimo (en 36 veces), un hombre yoruba de Nigeria (en 30 veces), una genetista clínica ( Marjolein Kriek ) de los Países Bajos (en 7 u 8 veces). ) y una paciente de leucemia de unos 50 años (con una cobertura de 33 y 14 veces para el tumor y los tejidos normales). Steve Jobs fue una de las primeras 20 personas a las que se les secuenció todo el genoma, al parecer por un costo de 100.000 dólares. En junio de 2012, había 69 genomas humanos casi completos disponibles públicamente. En noviembre de 2013, una familia española puso a disposición del público sus datos genómicos personales bajo una licencia de dominio público Creative Commons . El trabajo fue dirigido por Manuel Corpas y los datos se obtuvieron mediante pruebas genéticas directas al consumidor con 23andMe y el Instituto de Genómica de Beijing . Se cree que este es el primer conjunto de datos de Public Genomics de este tipo para toda una familia.

bases de datos

Según Science, las principales bases de datos de genomas completos son:

Biobanco Genomas completos completos Liberar/acceder a la información
Biobanco del Reino Unido 200,000 Disponible a través de una plataforma web en noviembre de 2021, es el conjunto de datos público más grande de genomas completos. Los genomas están vinculados a información médica anónima y se hacen más accesibles para la investigación biomédica que los conjuntos de datos anteriores y menos completos. Se lanzarán 300,000 genomas más a principios de 2023.
Trans-Omics para medicina de precisión 161,000 Los Institutos Nacionales de Salud (NIH) requieren el consentimiento específico del proyecto
Programa Million Veteran 125,000 Los investigadores de asuntos no veteranos obtienen acceso en 2022
Genómica Los 100.000 genomas de Inglaterra 120,000 Los investigadores deben unirse a la colaboración
Todos nosotros 90.000 NIH espera lanzar a principios de 2022

Cobertura genómica

En términos de cobertura y precisión genómica , la secuenciación del genoma completo se puede clasificar en términos generales en cualquiera de los siguientes:

  • Un borrador de secuencia que cubre aproximadamente el 90 % del genoma con una precisión aproximada del 99,9 %
  • Una secuencia terminada , que cubre más del 95 % del genoma con una precisión aproximada del 99,99 %

Producir una secuencia terminada verdaderamente de alta calidad según esta definición es muy costoso. Por lo tanto, la mayoría de los resultados de la "secuenciación del genoma completo" humano son borradores de secuencias (a veces por encima y otras veces por debajo de la precisión definida anteriormente).

Ver también

Referencias

enlaces externos