Sitio de unión al ADN - DNA binding site

Los sitios de unión al ADN son un tipo de sitio de unión que se encuentra en el ADN donde se pueden unir otras moléculas. Los sitios de unión al ADN son distintos de otros sitios de unión en que (1) son parte de una secuencia de ADN (por ejemplo, un genoma) y (2) están unidos por proteínas de unión al ADN . Los sitios de unión al ADN a menudo se asocian con proteínas especializadas conocidas como factores de transcripción y, por lo tanto, están vinculados a la regulación transcripcional . La suma de los sitios de unión al ADN de un factor de transcripción específico se denomina cistroma . Los sitios de unión al ADN también abarcan los objetivos de otras proteínas, como las enzimas de restricción , las recombinasas específicas del sitio (ver recombinación específica del sitio ) y las metiltransferasas .

Por tanto, los sitios de unión al ADN pueden definirse como secuencias de ADN cortas (típicamente de 4 a 30 pares de bases de largo, pero hasta 200 pb para los sitios de recombinación) que están unidas específicamente por una o más proteínas de unión al ADN o complejos proteicos. Se ha informado de que algunos sitios de unión tienen el potencial de sufrir un cambio evolutivo rápido.

Tipos de sitios de unión al ADN

Los sitios de unión al ADN se pueden clasificar según su función biológica. Por tanto, podemos distinguir entre sitios de unión a factores de transcripción, sitios de restricción y sitios de recombinación. Algunos autores han propuesto que los sitios de unión también podrían clasificarse según su modo de representación más conveniente. Por un lado, los sitios de restricción pueden estar representados generalmente por secuencias consenso. Esto se debe a que se dirigen principalmente a secuencias idénticas y la eficiencia de restricción disminuye abruptamente para secuencias menos similares. Por otro lado, los sitios de unión al ADN para un factor de transcripción dado suelen ser todos diferentes, con diversos grados de afinidad del factor de transcripción por los diferentes sitios de unión. Esto hace que sea difícil representar con precisión los sitios de unión del factor de transcripción usando secuencias de consenso , y generalmente se representan usando matrices de frecuencia específicas de posición (PSFM), que a menudo se representan gráficamente usando logotipos de secuencia . Este argumento, sin embargo, es en parte arbitrario. Las enzimas de restricción, como los factores de transcripción, producen un rango gradual, aunque nítido, de afinidades por diferentes sitios y, por lo tanto, también están mejor representadas por PSFM. Asimismo, las recombinasas específicas de sitio también muestran un rango variado de afinidades por diferentes sitios diana.

Historia y principales técnicas experimentales

La existencia de algo similar a los sitios de unión al ADN se sospechó a partir de los experimentos sobre la biología del bacteriófago lambda y la regulación del operón lac de Escherichia coli . Los sitios de unión al ADN finalmente se confirmaron en ambos sistemas con el advenimiento de las técnicas de secuenciación del ADN . A partir de entonces, se han descubierto sitios de unión al ADN para muchos factores de transcripción, enzimas de restricción y recombinasas específicas de sitio utilizando una profusión de métodos experimentales. Históricamente, las técnicas experimentales de elección para descubrir y analizar los sitios de unión del ADN han sido el ensayo de huella de ADNsa y el ensayo de desplazamiento de movilidad electroforético (EMSA). Sin embargo, el desarrollo de microarrays de ADN y técnicas de secuenciación rápida ha llevado a nuevos métodos masivamente paralelos para la identificación in vivo de sitios de unión, como ChIP-chip y ChIP-Seq . Para cuantificar la afinidad de unión de proteínas y otras moléculas a sitios de unión de ADN específicos se utiliza el método biofísico Termoforesis a microescala .

Bases de datos

Debido a la naturaleza diversa de las técnicas experimentales utilizadas para determinar los sitios de unión y a la cobertura irregular de la mayoría de los organismos y factores de transcripción, no existe una base de datos central (similar a GenBank en el Centro Nacional de Información Biotecnológica ) para los sitios de unión del ADN. Aunque NCBI contempla la anotación del sitio de unión al ADN en sus secuencias de referencia ( RefSeq ), la mayoría de las presentaciones omiten esta información. Además, debido al éxito limitado de la bioinformática en la producción de herramientas de predicción de sitios de unión de ADN eficientes ( las tasas de falsos positivos grandes a menudo se asocian con métodos de búsqueda de sitios / descubrimiento de motivos in-silico), no ha habido un esfuerzo sistemático para anotar computacionalmente estas características en secuencias secuenciadas. genomas.

Sin embargo, existen varias bases de datos públicas y privadas dedicadas a la compilación de sitios de unión informados experimentalmente y, a veces, pronosticados computacionalmente, para diferentes factores de transcripción en diferentes organismos. A continuación se muestra una tabla no exhaustiva de bases de datos disponibles:

Nombre Organismos Fuente Acceso URL
PlantRegMap 165 especies de plantas (p. Ej., Arabidopsis thaliana, Oryza sativa, Zea mays, etc.) Proyección y curaduría experta Público [1]
JASPAR Vertebrados, plantas, hongos, moscas y gusanos Curaduría experta con apoyo de literatura Público [2]
CIS-BP Todos los eucariotas Motivos y predicciones derivados experimentalmente Público [3]
CollecTF Procariotas Curaduría de literatura Público [4]
RegPrecise Procariotas Curaduría experta Público [5]
RegTransBase Procariotas Curaduría experta / de literatura Público [6]
RegulonDB Escherichia coli Curaduría experta Público [7]
PRODÓRICO Procariotas Curaduría experta Público [8]
TRANSFAC Mamíferos Curaduría experta / de literatura Publico privado [9]
TRED Humano, Ratón, Rata Predicciones por computadora, curación manual Público [10]
DBSD Especies de Drosophila Literatura / Comisariado experto Público [11]
HOCOMOCO Humano, Ratón Literatura / Comisariado experto Público [12] , [13]
MethMotif Humano, Ratón Curaduría experta Público [14]

Representación de sitios de unión al ADN

Una colección de sitios de unión de ADN, normalmente denominada motivo de unión de ADN, puede representarse mediante una secuencia consenso . Esta representación tiene la ventaja de ser compacta, pero a costa de descartar una cantidad sustancial de información. Una forma más precisa de representar los sitios de unión es a través de Matrices de frecuencia específicas de posición (PSFM). Estas matrices dan información sobre la frecuencia de cada base en cada posición del motivo de unión al ADN. Los PSFM generalmente se conciben con la suposición implícita de independencia posicional (diferentes posiciones en el sitio de unión al ADN contribuyen de forma independiente a la función del sitio), aunque esta suposición ha sido cuestionada para algunos sitios de unión al ADN. La información de frecuencia en un PSFM se puede interpretar formalmente en el marco de la Teoría de la Información , lo que lleva a su representación gráfica como un logotipo de secuencia .

1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 dieciséis
A 1 0 1 5 32 5 35 23 34 14 43 13 34 4 52 3
C 50 1 0 1 5 6 0 4 4 13 3 8 17 51 2 0
GRAMO 0 0 54 15 5 5 12 2 7 1 1 3 1 0 1 52
T 5 55 1 35 14 40 9 27 11 28 9 32 4 1 1 1
Suma 56 56 56 56 56 56 56 56 56 56 56 56 56 56 56 56

PSFM para el represor transcripcional LexA derivado de 56 sitios de unión a LexA almacenados en Prodoric. Las frecuencias relativas se obtienen dividiendo los recuentos de cada celda por el recuento total (56)

Búsqueda y descubrimiento computacional de sitios de unión.

En bioinformática , uno puede distinguir entre dos problemas separados con respecto a los sitios de unión al ADN: buscar miembros adicionales de un motivo de unión al ADN conocido (el problema de búsqueda del sitio) y descubrir nuevos motivos de unión al ADN en colecciones de secuencias funcionalmente relacionadas (el problema del descubrimiento del motivo de la secuencia ). . Se han propuesto muchos métodos diferentes para buscar sitios de unión. La mayoría de ellos se basan en los principios de la teoría de la información y disponen de servidores web (Yellaboina) (Munch), mientras que otros autores han recurrido a métodos de aprendizaje automático , como las redes neuronales artificiales . También está disponible una plétora de algoritmos para el descubrimiento de motivos de secuencia . Estos métodos se basan en la hipótesis de que un conjunto de secuencias comparten un motivo de unión por razones funcionales. Los métodos de descubrimiento de motivos de unión se pueden dividir a grandes rasgos en enumerativos, deterministas y estocásticos. MEME y Consensus son ejemplos clásicos de optimización determinista, mientras que el muestreador de Gibbs es la implementación convencional de un método puramente estocástico para el descubrimiento de motivos de unión al ADN. Otro ejemplo de esta clase de métodos es SeSiMCMC que se centra en sitios TFBS débiles con simetría. Si bien los métodos enumerativos a menudo recurren a la representación de expresión regular de los sitios de unión, el PSFM y su tratamiento formal según los métodos de la teoría de la información son la representación de elección para los métodos deterministas y estocásticos. Los métodos híbridos, por ejemplo, ChIPMunk, que combina optimización codiciosa con submuestreo, también utilizan PSFM. Los avances recientes en la secuenciación han llevado a la introducción de enfoques genómicos comparativos para el descubrimiento de motivos de unión al ADN, como lo ejemplifica PhyloGibbs.

Los métodos más complejos para la búsqueda de sitios de unión y el descubrimiento de motivos se basan en el apilamiento de bases y otras interacciones entre las bases de ADN, pero debido a los pequeños tamaños de muestra típicamente disponibles para los sitios de unión en el ADN, su eficiencia aún no se aprovecha por completo. Un ejemplo de tal herramienta es la ULPB

Ver también

Referencias

enlaces externos