Secuenciación del genoma del cáncer - Cancer genome sequencing

La secuenciación del genoma del cáncer es la secuenciación del genoma completo de un grupo único, homogéneo o heterogéneo de células cancerosas. Es un método de laboratorio bioquímico para la caracterización e identificación de secuencias de ADN o ARN de células cancerosas.

A diferencia de la secuenciación del genoma completo (WG), que generalmente proviene de células sanguíneas, como los proyectos de secuenciación WG de J. Craig Venter y James D. Watson , la secuenciación del genoma de saliva, células epiteliales o cáncer de hueso implica la secuenciación directa del tejido del tumor primario , tejido normal adyacente o distal, el microentorno tumoral tal como células de fibroblasto / estroma, o sitios de tumores metastásicos.

De manera similar a la secuenciación del genoma completo, la información generada a partir de esta técnica incluye: identificación de bases de nucleótidos (ADN o ARN), número de copias y variantes de secuencia, estado de mutación y cambios estructurales como translocaciones cromosómicas y genes de fusión .

La secuenciación del genoma del cáncer no se limita a la secuenciación de WG y también puede incluir secuenciación de exoma , transcriptoma , micronoma y perfil de secuencia final . Estos métodos se pueden usar para cuantificar la expresión génica , la expresión de miARN e identificar eventos de corte y empalme alternativos además de los datos de secuencia.

El primer informe de secuenciación del genoma del cáncer apareció en 2006. En este estudio se secuenciaron 13.023 genes en 11 tumores de mama y 11 colorrectales. En 2007 se publicó un seguimiento posterior en el que el mismo grupo añadió poco más de 5.000 genes más y casi 8.000 especies de transcripciones para completar los exomas de 11 tumores de mama y colorrectales. El primer genoma completo del cáncer que se secuenciaron fue de leucemia mieloide aguda citogenéticamente normal por Ley et al. en noviembre de 2008. El primer tumor de cáncer de mama fue secuenciado por Shah et al. en octubre de 2009, los primeros tumores de pulmón y piel de Pleasance et al. en enero de 2010, y los primeros tumores de próstata de Berger et al. en febrero de 2011.

Historia

Históricamente, los esfuerzos de secuenciación del genoma del cáncer se han dividido entre proyectos de secuenciación basados en transcriptomas y esfuerzos centrados en el ADN.

El Proyecto de Anatomía del Genoma del Cáncer (CGAP) se financió por primera vez en 1997 con el objetivo de documentar las secuencias de las transcripciones de ARN en las células tumorales. A medida que la tecnología mejoraba, el CGAP amplió sus objetivos para incluir la determinación de perfiles de expresión génica de tejidos cancerosos, precancerosos y normales.

El CGAP publicó la colección más grande disponible públicamente de etiquetas de secuencia expresadas en cáncer en 2003.

El Proyecto del Genoma del Cáncer del Instituto Sanger , financiado por primera vez en 2005, se centra en la secuenciación del ADN. Ha publicado un censo de genes implicados causalmente en el cáncer y una serie de pruebas de resecuenciación del genoma completo para los genes implicados en el cáncer.

El Consorcio Internacional del Genoma del Cáncer (ICGC) se fundó en 2007 con el objetivo de integrar los datos genómicos , transcriptómicos y epigenéticos disponibles de muchos grupos de investigación diferentes. A diciembre de 2011, el ICGC incluye 45 proyectos comprometidos y dispone de datos de 2.961 genomas de cáncer.

Impacto social

La complejidad y biología del cáncer

El proceso de tumorigénesis que transforma una célula normal en una célula cancerosa implica una serie de cambios genéticos y epigenéticos complejos . La identificación y caracterización de todos estos cambios se puede lograr mediante diversas estrategias de secuenciación del genoma del cáncer.

El poder de la secuenciación del genoma del cáncer radica en la heterogeneidad de los cánceres y los pacientes. La mayoría de los cánceres tienen una variedad de subtipos y, combinados con estas 'variantes de cáncer', se encuentran las diferencias entre un subtipo de cáncer en un individuo y en otro individuo. La secuenciación del genoma del cáncer permite a los médicos y oncólogos identificar los cambios específicos y únicos que ha experimentado un paciente para desarrollar su cáncer. A partir de estos cambios, se puede emprender una estrategia terapéutica personalizada.

Relevancia clínica

Una gran contribución a la muerte por cáncer y al fracaso del tratamiento del cáncer es la evolución clonal a nivel citogenético, por ejemplo, como se observa en la leucemia mieloide aguda (AML). En un estudio de Nature publicado en 2011, Ding et al. identificaron fracciones celulares caracterizadas por cambios mutacionales comunes para ilustrar la heterogeneidad de un tumor en particular antes y después del tratamiento versus sangre normal en un individuo.

Estas facciones celulares solo podrían haber sido identificadas a través de la secuenciación del genoma del cáncer, mostrando la información que la secuenciación puede proporcionar y la complejidad y heterogeneidad de un tumor dentro de un individuo.

Proyectos genómicos integrales del cáncer

Los dos proyectos principales centrados en la caracterización completa del cáncer en individuos, que implican en gran medida la secuenciación, incluyen el Proyecto del Genoma del Cáncer , basado en el Instituto Wellcome Trust Sanger y el Atlas del Genoma del Cáncer, financiado por el Instituto Nacional del Cáncer (NCI) y el Instituto Nacional de Investigación del Genoma Humano ( NHGRI). Combinado con estos esfuerzos, el Consorcio Internacional del Genoma del Cáncer (una organización más grande) es una organización científica voluntaria que proporciona un foro para la colaboración entre los principales investigadores de cáncer y genómica del mundo.

Proyecto del genoma del cáncer (CGP)

El objetivo de Cancer Genome Projects es identificar variantes de secuencia y mutaciones críticas en el desarrollo de cánceres humanos. El proyecto implica el cribado sistemático de genes codificantes y uniones de empalme flanqueantes de todos los genes del genoma humano en busca de mutaciones adquiridas en cánceres humanos. Para investigar estos eventos, el conjunto de muestras de descubrimiento incluirá ADN del tumor primario, tejido normal (de los mismos individuos) y líneas de células cancerosas. Todos los resultados de este proyecto se fusionan y almacenan en la base de datos de cáncer COSMIC . COSMIC también incluye datos mutacionales publicados en la literatura científica.

Atlas del genoma del cáncer (TCGA)

El TCGA es un esfuerzo multiinstitucional para comprender la base molecular del cáncer a través de tecnologías de análisis del genoma, incluidas técnicas de secuenciación del genoma a gran escala. Se están recolectando, secuenciando y analizando cientos de muestras. Actualmente, el tejido canceroso que se recolecta incluye: sistema nervioso central, mama, gastrointestinal, ginecológico, de cabeza y cuello, hematológico, torácico y urológico.

Los componentes de la red de investigación de TCGA incluyen: recursos básicos de bioespecímenes, centros de caracterización del genoma, centros de secuenciación del genoma, centros de caracterización de proteomas, un centro de coordinación de datos y centros de análisis de datos del genoma. Cada tipo de cáncer se someterá a una caracterización y un análisis genómicos completos. Los datos y la información generados están disponibles gratuitamente a través del portal de datos de proyectos TCGA.

Consorcio Internacional del Genoma del Cáncer (ICGC)

El objetivo del ICGC es “Obtener una descripción completa de los cambios genómicos, transcriptómicos y epigenómicos en 50 tipos y subtipos de tumores diferentes que son de importancia clínica y social en todo el mundo”.

Tecnologías y plataformas

Secuenciación de segunda generación

Secuenciación de tercera generación

La secuenciación del genoma del cáncer utiliza la misma tecnología involucrada en la secuenciación del genoma completo. La historia de la secuenciación ha recorrido un largo camino, y se originó en 1977 por dos grupos independientes: la técnica de secuenciación enzimática del ADN didoxi de Fredrick Sanger y la técnica de degradación química de Allen Maxam y Walter Gilbert. A raíz de estos artículos de referencia, más de 20 años después, nació la secuenciación de próxima generación de alto rendimiento (HT-NGS) de 'Segunda generación' seguida de la 'Tecnología HT-NGS de tercera generación' en 2010. Las figuras de la derecha ilustran el proceso biológico general y empresas involucradas en la secuenciación HT-NGS de segunda y tercera generación.

Tres principales plataformas de segunda generación incluyen Roche / 454 Pyro-secuenciación , ABI / secuenciación SóLIdAS por la ligadura, y la amplificación del puente de Illumina tecnología de secuenciación. Las tres principales plataformas de tercera generación incluyen la secuenciación en tiempo real de una sola molécula (SMRT) de Pacific Biosciences , la secuenciación de Oxford Nanopore y la secuenciación de semiconductores de iones .

Análisis de los datos

El flujo de trabajo de la secuenciación de un tumor desde la biopsia hasta la recomendación de tratamiento.

Al igual que con cualquier proyecto de secuenciación del genoma, las lecturas deben ensamblarse para formar una representación de los cromosomas que se están secuenciando. Con los genomas del cáncer, esto generalmente se hace alineando las lecturas con el genoma de referencia humano .

Dado que incluso las células no cancerosas acumulan mutaciones somáticas, es necesario comparar la secuencia del tumor con un tejido normal compatible para descubrir qué mutaciones son exclusivas del cáncer. En algunos cánceres, como la leucemia, no es práctico hacer coincidir la muestra de cáncer con un tejido normal, por lo que se debe utilizar un tejido no canceroso diferente.

Se ha estimado que el descubrimiento de todas las mutaciones somáticas en un tumor requeriría una cobertura de secuenciación de 30 veces del genoma del tumor y un tejido normal compatible. En comparación, el borrador original del genoma humano tenía una cobertura de aproximadamente 65 veces.

Un objetivo principal de la secuenciación del genoma del cáncer es identificar las mutaciones impulsoras: cambios genéticos que aumentan la tasa de mutación en la célula, lo que conduce a una evolución y metástasis más rápidas del tumor. Es difícil determinar las mutaciones impulsoras a partir de la secuencia de ADN únicamente; pero los impulsores tienden a ser las mutaciones más comúnmente compartidas entre los tumores, se agrupan alrededor de oncogenes conocidos y tienden a no ser silenciosos. Las mutaciones pasajeras, que no son importantes en la progresión de la enfermedad, se distribuyen aleatoriamente por todo el genoma. Se ha estimado que el tumor promedio porta alrededor de 80 mutaciones somáticas, menos de 15 de las cuales se espera que sean impulsoras.

Un análisis de genómica personal requiere una caracterización funcional adicional de los genes mutantes detectados y el desarrollo de un modelo básico del origen y progresión del tumor. Este análisis se puede utilizar para hacer recomendaciones de tratamiento farmacológico. En febrero de 2012, esto solo se ha hecho para los ensayos clínicos de pacientes diseñados para evaluar el enfoque genómico personal para el tratamiento del cáncer.

Limitaciones

Un cribado a gran escala de mutaciones somáticas en tumores de mama y colorrectales mostró que muchas mutaciones de baja frecuencia contribuyen en pequeña medida a la supervivencia celular. Si la supervivencia celular está determinada por muchas mutaciones de pequeño efecto, es poco probable que la secuenciación del genoma descubra un único objetivo del "talón de Aquiles" para los medicamentos contra el cáncer. Sin embargo, las mutaciones somáticas tienden a agruparse en un número limitado de vías de señalización, que son posibles objetivos de tratamiento.

Los cánceres son poblaciones heterogéneas de células. Cuando los datos de secuencia se derivan de un tumor completo, se pierde información sobre las diferencias en la secuencia y el patrón de expresión entre células. Esta dificultad puede mejorarse mediante el análisis de una sola célula.

Las propiedades clínicamente significativas de los tumores, incluida la resistencia a los fármacos, a veces son causadas por reordenamientos del genoma a gran escala, más que por mutaciones únicas. En este caso, la información sobre variantes de un solo nucleótido será de utilidad limitada.

La secuenciación del genoma del cáncer se puede utilizar para proporcionar información clínicamente relevante en pacientes con tipos de tumores raros o nuevos. Traducir la información de la secuencia a un plan de tratamiento clínico es muy complicado, requiere expertos en muchos campos diferentes y no se garantiza que conduzca a un plan de tratamiento eficaz.

Incidentalome

El incidentaloma es el conjunto de variantes genómicas detectadas no relacionadas con el cáncer en estudio. (El término es un juego con el nombre incidentaloma , que designa tumores y crecimientos detectados en imágenes de cuerpo entero por coincidencia). La detección de tales variantes puede resultar en medidas adicionales, como más pruebas o control del estilo de vida.

Languages

In other projects