Chip en chip - ChIP-on-chip

Descripción general del flujo de trabajo de un experimento de chip en chip.

ChIP-on-chip (también conocido como ChIP-chip ) es una tecnología que combina inmunoprecipitación de cromatina ('ChIP') con microarrays de ADN ( "chip" ). Al igual que el ChIP normal , el ChIP-on-chip se utiliza para investigar las interacciones entre proteínas y ADN in vivo . Específicamente, permite la identificación del cistroma , la suma de los sitios de unión , para las proteínas de unión al ADN en todo el genoma. Se puede realizar un análisis del genoma completo para determinar las ubicaciones de los sitios de unión para casi cualquier proteína de interés. Como sugiere el nombre de la técnica, estas proteínas son generalmente las que operan en el contexto de la cromatina . Los representantes más destacados de esta clase son los factores de transcripción , las proteínas relacionadas con la replicación , como la proteína del complejo de reconocimiento de origen (ORC), las histonas , sus variantes y las modificaciones de histonas.

El objetivo de ChIP-on-chip es localizar sitios de unión a proteínas que puedan ayudar a identificar elementos funcionales en el genoma . Por ejemplo, en el caso de un factor de transcripción como proteína de interés, se pueden determinar sus sitios de unión al factor de transcripción en todo el genoma. Otras proteínas permiten la identificación de regiones promotoras , potenciadores , represores y elementos silenciadores , aislantes , elementos límite y secuencias que controlan la replicación del ADN. Si las histonas son un tema de interés, se cree que la distribución de modificaciones y sus localizaciones pueden ofrecer nuevos conocimientos sobre los mecanismos de regulación .

Uno de los objetivos a largo plazo para el que se diseñó ChIP-on-chip es establecer un catálogo de organismos (seleccionados) que enumere todas las interacciones proteína-ADN en diversas condiciones fisiológicas. Este conocimiento ayudaría en última instancia a comprender la maquinaria detrás de la regulación genética, la proliferación celular y la progresión de la enfermedad. Por lo tanto, ChIP-on-chip ofrece tanto potencial para complementar nuestro conocimiento sobre la orquestación del genoma en el nivel de nucleótidos como información sobre niveles más altos de información y regulación a medida que se propaga mediante la investigación sobre epigenética .

Plataformas tecnológicas

Las plataformas técnicas para realizar experimentos ChIP-on-chip son microarrays de ADN o "chips" . Se pueden clasificar y distinguir según diversas características:

Tipo de sonda : las matrices de ADN pueden comprender ADNc con manchas mecánicas o productos de PCR , oligonucleótidos con manchas mecánicas u oligonucleótidos que se sintetizan in situ . Las primeras versiones de microarrays se diseñaron para detectar ARN de regiones genómicas expresadas ( marcos de lectura abiertos, también conocidos como ORF). Aunque tales matrices son perfectamente adecuadas para estudiar los perfiles de expresión génica , tienen una importancia limitada en los experimentos de ChIP ya que la mayoría de las proteínas "interesantes" con respecto a esta técnica se unen en regiones intergénicas . Hoy en día, incluso las matrices personalizadas se pueden diseñar y ajustar para que coincidan con los requisitos de un experimento. Además, se puede sintetizar cualquier secuencia de nucleótidos para cubrir regiones génicas e intergénicas.

Tamaño de la sonda : la versión anterior de las matrices de ADNc tenía una longitud de sonda de aproximadamente 200 pb. Las últimas versiones de matrices usan oligos tan cortos como 70- (Microarrays, Inc.) a 25-mers ( Affymetrix ). (Febrero de 2007)

Composición de la sonda : hay matrices de ADN en mosaico y sin mosaico. Las matrices no en mosaico utilizan sondas seleccionadas de acuerdo con criterios no espaciales, es decir, las secuencias de ADN utilizadas como sondas no tienen distancias fijas en el genoma. Sin embargo, las matrices en mosaico seleccionan una región genómica (o incluso un genoma completo) y lo dividen en partes iguales. Tal región se llama camino en mosaico. La distancia media entre cada par de fragmentos vecinos (medida desde el centro de cada fragmento) da la resolución de la ruta en mosaico. Una ruta puede estar superpuesta, de un extremo a otro o espaciada.

Tamaño de la matriz : las primeras micromatrices utilizadas para ChIP-on-Chip contenían aproximadamente 13.000 segmentos de ADN con manchas que representan todos los ORF y las regiones intergénicas del genoma de la levadura. Hoy en día, Affymetrix ofrece matrices de levadura en mosaico de genoma completo con una resolución de 5 pb (en total, 3,2 millones de sondas). Las matrices en mosaico para el genoma humano también se vuelven cada vez más poderosas. Solo por nombrar un ejemplo, Affymetrix ofrece un conjunto de siete matrices con aproximadamente 90 millones de sondas, que abarcan la parte no repetitiva completa del genoma humano con un espaciado de aproximadamente 35 pb. (Febrero de 2007) Además del microarray real, se necesitan otros equipos de hardware y software para ejecutar experimentos de chip en chip. Generalmente ocurre que los microarrays de una empresa no pueden ser analizados por el hardware de procesamiento de otra empresa. Por lo tanto, comprar una matriz también requiere comprar el equipo de flujo de trabajo asociado. Los elementos más importantes son, entre otros, hornos de hibridación, lectores de chips y paquetes de software para el análisis numérico posterior de los datos brutos.

Flujo de trabajo de un experimento de chip en chip

Comenzando con una pregunta biológica, un experimento de chip en chip se puede dividir en tres pasos principales: el primero es configurar y diseñar el experimento seleccionando la matriz y el tipo de sonda adecuados. En segundo lugar, el experimento real se realiza en el laboratorio húmedo. Por último, durante la parte del ciclo del laboratorio seco, los datos recopilados se analizan para responder la pregunta inicial o dar lugar a nuevas preguntas para que el ciclo pueda comenzar de nuevo.

Parte del flujo de trabajo de laboratorio húmedo

Descripción general del flujo de trabajo de la parte de laboratorio húmedo de un experimento de chip en chip.

En el primer paso, la proteína de interés (POI) se reticula con el sitio de ADN al que se une en un entorno in vitro . Por lo general, esto se realiza mediante una fijación suave de formaldehído que es reversible con calor.

Luego, las células se lisan y el ADN se corta mediante sonicación o usando nucleasa microcócica . Esto da como resultado trozos bicatenarios de fragmentos de ADN, normalmente de 1 kb o menos de longitud. Aquellos que se reticularon con el POI forman un complejo de ADN-POI.

En el siguiente paso, solo estos complejos se filtran del conjunto de fragmentos de ADN, utilizando un anticuerpo específico del POI. Los anticuerpos pueden estar unidos a una superficie sólida, pueden tener una perla magnética o alguna otra propiedad física que permita la separación de complejos reticulados y fragmentos no unidos. Este procedimiento es esencialmente una inmunoprecipitación (IP) de la proteína. Esto se puede hacer usando una proteína etiquetada con un anticuerpo contra la etiqueta (por ejemplo , FLAG , HA , c-myc) o con un anticuerpo contra la proteína nativa.

La reticulación de los complejos POI-ADN se invierte (generalmente mediante calentamiento) y las hebras de ADN se purifican. Para el resto del flujo de trabajo, el PDI ya no es necesario.

Después de un paso de amplificación y desnaturalización , los fragmentos de ADN monocatenarios se marcan con una etiqueta fluorescente como Cy5 o Alexa 647.

Finalmente, los fragmentos se vierten sobre la superficie de la micromatriz de ADN, que está salpicada de secuencias cortas de una sola hebra que cubren la porción genómica de interés. Siempre que un fragmento marcado "encuentre" un fragmento complementario en la matriz, se hibridará y volverá a formar un fragmento de ADN de doble hebra.

Parte del flujo de trabajo de laboratorio seco

Descripción general del flujo de trabajo de la parte de laboratorio seco de un experimento de chip en chip.

Después de un período de tiempo suficientemente grande para permitir la hibridación, la matriz se ilumina con luz fluorescente. Las sondas de la matriz que se hibridan con uno de los fragmentos marcados emiten una señal de luz que es capturada por una cámara. Esta imagen contiene todos los datos sin procesar de la parte restante del flujo de trabajo.

Estos datos sin procesar, codificados como imagen de color falso , deben convertirse a valores numéricos antes de que se pueda realizar el análisis real. El análisis y la extracción de información de los datos brutos a menudo sigue siendo la parte más desafiante para los experimentos de chip en chip. Surgen problemas a lo largo de esta parte del flujo de trabajo, que van desde la lectura inicial del chip hasta los métodos adecuados para restar el ruido de fondo y, finalmente, los algoritmos apropiados que normalizan los datos y los ponen a disposición para el análisis estadístico posterior , que luego, con suerte, conducen a una mejor comprensión de la cuestión biológica que el experimento busca abordar. Además, debido a las diferentes plataformas de arreglos y la falta de estandarización entre ellas, el almacenamiento e intercambio de datos es un gran problema. En términos generales, el análisis de datos se puede dividir en tres pasos principales:

Durante el primer paso, las señales de fluorescencia capturadas de la matriz se normalizan, utilizando señales de control derivadas del mismo chip o de un segundo. Dichas señales de control indican qué sondas de la matriz se hibridaron correctamente y cuáles se unieron de manera inespecífica.

En el segundo paso, se aplican pruebas numéricas y estadísticas para controlar los datos y los datos de la fracción IP para identificar las regiones enriquecidas con POI a lo largo del genoma. Los siguientes tres métodos se utilizan ampliamente: rango percentil medio , error de matriz única y ventana deslizante . Estos métodos generalmente difieren en cómo se manejan las señales de baja intensidad, cuánto ruido de fondo se acepta y qué rasgo de los datos se enfatiza durante el cálculo. En el pasado reciente, el enfoque de ventana deslizante parece estar favorecido y a menudo se describe como el más poderoso.

En el tercer paso, estas regiones se analizan más a fondo. Si, por ejemplo, el POI fuera un factor de transcripción, tales regiones representarían sus sitios de unión. El análisis posterior puede entonces querer inferir motivos de nucleótidos y otros patrones para permitir la anotación funcional del genoma.

Fortalezas y debilidades

Usando matrices en mosaico , ChIP -on-chip permite una alta resolución de mapas de todo el genoma. Estos mapas pueden determinar los sitios de unión de muchas proteínas de unión al ADN como los factores de transcripción y también las modificaciones de la cromatina.

Aunque el chip en chip puede ser una técnica poderosa en el área de la genómica, es muy costoso. La mayoría de los estudios publicados que utilizan ChIP-on-chip repiten sus experimentos al menos tres veces para garantizar mapas biológicamente significativos. El costo de los microarrays de ADN es a menudo un factor limitante para determinar si un laboratorio debe proceder con un experimento de chip en chip. Otra limitación es el tamaño de los fragmentos de ADN que se pueden lograr. La mayoría de los protocolos de chip en chip utilizan la sonicación como método para romper el ADN en trozos pequeños. Sin embargo, la sonicación se limita a un tamaño de fragmento mínimo de 200 pb. Para mapas de mayor resolución, esta limitación debe superarse para lograr fragmentos más pequeños, preferiblemente con resolución de un solo nucleosoma . Como se mencionó anteriormente, el análisis estadístico de la gran cantidad de datos generados a partir de arreglos es un desafío y los procedimientos de normalización deben tener como objetivo minimizar los artefactos y determinar qué es realmente biológicamente significativo. Hasta ahora, la aplicación a genomas de mamíferos ha sido una limitación importante, por ejemplo, debido al porcentaje significativo del genoma que está ocupado por repeticiones. Sin embargo, a medida que avanza la tecnología ChIP-on-chip, los mapas del genoma de mamíferos completos de alta resolución deberían ser alcanzables.

Los anticuerpos utilizados para ChIP -on-chip pueden ser un factor limitante importante. ChIP -on-chip requiere anticuerpos altamente específicos que deben reconocer su epítopo en solución libre y también en condiciones fijas. Si se demuestra con éxito inmunoprecipitado reticulado de la cromatina , se denomina " chip-grado ". Las empresas que proporcionan anticuerpos de grado ChIP incluyen Abcam , Cell Signaling Technology , Santa Cruz y Upstate. Para superar el problema de la especificidad, la proteína de interés se puede fusionar con una etiqueta como FLAG o HA que son reconocidas por anticuerpos. Una alternativa a ChIP-on-chip que no requiere anticuerpos es DamID .

También están disponibles anticuerpos contra una modificación de histona específica como H3 tri metil K4. Como se mencionó anteriormente, la combinación de estos anticuerpos y ChIP-on-chip se ha vuelto extremadamente poderosa para determinar el análisis del genoma completo de los patrones de modificación de histonas y contribuirá enormemente a nuestra comprensión del código de histonas y la epigenética.

En PLoS Biology se ha publicado un estudio que demuestra la naturaleza inespecífica de las proteínas de unión al ADN. Esto indica que la confirmación alternativa de la relevancia funcional es un paso necesario en cualquier experimento de chip ChIP.

Historia

En 1999 se realizó un primer experimento de chip en chip para analizar la distribución de cohesina a lo largo del cromosoma III de levadura en gemación . Aunque el genoma no estaba completamente representado, el protocolo de este estudio sigue siendo equivalente a los utilizados en estudios posteriores. La técnica de ChIP-on-chip que utiliza todos los ORF del genoma (que, sin embargo, permanece incompleto, faltan regiones intergénicas) se aplicó con éxito en tres artículos publicados en 2000 y 2001. Los autores identificaron sitios de unión para factores de transcripción individuales en la gemación. levadura Saccharomyces cerevisiae . En 2002, el grupo de Richard Young determinó las posiciones de todo el genoma de 106 factores de transcripción utilizando un sistema de marcado c-Myc en levadura. La primera demostración de la técnica ChIp-on-chip de mamíferos informó que el laboratorio de Peggy Farnham en colaboración con el laboratorio de Michael Zhang realizó el aislamiento de nueve fragmentos de cromatina que contienen un sitio de unión E2F débil y fuerte y se publicó en 2001. Este estudio se siguió varios meses después en una colaboración entre el laboratorio de Young y el laboratorio de Brian Dynlacht, que utilizó la técnica ChIP-on-chip para mostrar por primera vez que los objetivos E2F codifican componentes del punto de control de daño del ADN y vías de reparación, así como factores involucrados en el ensamblaje de la cromatina. / condensación, segregación cromosómica y el punto de control del huso mitótico. Otras aplicaciones de ChIP-on-chip incluyen la replicación del ADN , la recombinación y la estructura de la cromatina. Desde entonces, ChIP-on-chip se ha convertido en una herramienta poderosa para determinar mapas de modificaciones de histonas en todo el genoma y muchos más factores de transcripción. ChIP-on-chip en sistemas de mamíferos ha sido difícil debido a los genomas grandes y repetitivos. Por tanto, muchos estudios en células de mamíferos se han centrado en regiones promotoras seleccionadas que se prevé que se unan a factores de transcripción y no han analizado el genoma completo. Sin embargo, recientemente se han comercializado matrices de genomas de mamíferos completos de compañías como Nimblegen. En el futuro, a medida que las matrices de chips en chip se vuelvan cada vez más avanzadas, se analizarán con más detalle mapas de genoma completo de alta resolución de proteínas de unión al ADN y componentes de cromatina para mamíferos.

Alternativas

Introducida en 2007, la secuenciación de ChIP (ChIP-seq) es una tecnología que utiliza inmunoprecipitación de cromatina para entrecruzar las proteínas de interés con el ADN, pero luego, en lugar de utilizar una micromatriz, utiliza el método de secuenciación más preciso y de mayor rendimiento para localizar puntos de interacción.

DamID es un método alternativo que no requiere anticuerpos.

ChIP-exo utiliza un tratamiento con exonucleasa para lograr una resolución de hasta un solo par de bases.

La secuenciación CUT & RUN utiliza el reconocimiento de anticuerpos con escisión enzimática dirigida para abordar algunas limitaciones técnicas de ChIP.

Referencias

Otras lecturas

enlaces externos

Análisis y software

  • [1] CoCAS: un software de análisis gratuito para experimentos Agilent ChIP-on-Chip
  • [2] Implementación de rMAT: R desde el programa MAT para normalizar y analizar matrices de mosaico y datos de chips ChIP.