Caja CAAT - CAAT box

El modelo de la izquierda es del complejo de NF-YC / NF-YB con el elemento CCAAT del promotor de colágeno pro 2 (I). La columna vertebral del ADN se muestra como cintas (púrpura) con las bases mostradas. Las dos posibles ubicaciones de la caja CCAAT, según el modelo, han sido de color cian. Para el modelo correcto del complejo NF-Y / CCAAT. NF-YC, NF-YB y ADN están coloreados como en la figura de la izquierda, mientras que NF-YA es azul. Las dos posiciones alternativas para el enlazador que conecta los subdominios NF-YA1 y NF-YA2 se muestran como líneas de puntos azules. Los elementos de la estructura secundaria del par de histonas que están implicados en el reconocimiento de NF-YA1 y NF-YA2 (ver texto) están etiquetados y coloreados en rojo y gris, respectivamente. Para mayor claridad, solo se muestran y etiquetan las bases del pentanucleótido CCAAT.

En biología molecular , una caja CCAAT (también abreviada en ocasiones como caja CAAT o caja CAT ) es un patrón distinto de nucleótidos con secuencia de consenso GGCCAATCT que se produce en sentido ascendente entre 60 y 100 bases del sitio de transcripción inicial . La caja CAAT señala el sitio de unión para el factor de transcripción de ARN , y típicamente se acompaña de una secuencia consenso conservada . Es una secuencia de ADN invariante a aproximadamente menos 70 pares de bases desde el origen de la transcripción en muchos promotores eucariotas . Los genes que tienen este elemento parecen necesitarlo para que el gen se transcriba en cantidades suficientes. Con frecuencia está ausente en los genes que codifican proteínas utilizadas en prácticamente todas las células. Este cuadro junto con el cuadro GC es conocido por unir factores de transcripción generales. Ambas secuencias consenso pertenecen al promotor regulador . La expresión génica completa se produce cuando las proteínas activadoras de la transcripción se unen a cada módulo dentro del promotor regulador. Se requiere una unión específica de proteínas para la activación de la caja CCAAT. Estas proteínas se conocen como proteínas de unión a caja CCAAT / factores de unión a caja CCAAT.

Una caja CCAAT es una característica que se encuentra con frecuencia antes de las regiones codificantes de eucariotas, pero no se encuentra en procariotas.

Secuencia de consenso

En la dirección de la transcripción de la hebra molde, la secuencia consenso , o el orden calculado de los residuos más frecuentes, para la caja CAAT fue 3'-TG ATTGG (T / C) (T / C) (A / G) - 5 '. El uso de paréntesis denota que cualquiera de las bases está presente, pero no se especifica en cuanto a sus frecuencias relativas. Por ejemplo, "(T / C)" significaría que se seleccionan preferentemente timina o citosina. Dentro de los metazoos (reino animal), el complejo de factor de unión central (CBF) -DNA conserva un alto grado de conservación dentro del motivo de unión CCAAT, así como las secuencias que flanquean este motivo pentamérico. El motivo CCAAT en plantas (se utilizó espinaca en un experimento) difiere ligeramente de los metazoos en que en realidad es un motivo de unión a CAAT; el promotor carece de uno de los dos residuos C del motivo pentamérico y la adición artificial del segundo C no tiene efectos significativos sobre la actividad de unión. Algunas secuencias carecen completamente del cuadro CAAT. En segundo lugar, los nucleótidos circundantes en las plantas no coinciden con la secuencia consenso anteriormente determinada por Bi et al.

Promotor principal

La caja CAAT es lo que se conoce como promotor central, también conocido como promotor basal o simplemente promotor , es una región del ADN que inicia la transcripción de un gen en particular. Esta región, en particular para la caja CAAT, se encuentra a unas 60-100 bases corriente arriba (hacia el extremo 5 '), sin embargo, a no menos de 27 pares de bases de distancia del sitio de transcripción inicial o de un gen eucariota en el que un complejo de los factores de transcripción se unen a la ARN polimerasa II antes del inicio de la transcripción. Es esencial para la transcripción que estos factores de unión centrales (también denominados factor nuclear Y o NF-Y) puedan unirse al motivo CCAAT. Los experimentos en muchos laboratorios han demostrado que las mutaciones en el motivo CCAAT que causan una pérdida de unión a CBF también disminuyen la actividad transcripcional en estos promotores, lo que sugiere que los complejos CBF-CCAAT son esenciales para una actividad transcripcional óptima.

Unión

En un experimento realizado con factores de unión al núcleo (CBF) y complejos de ADN, los investigadores pudieron determinar las secuencias preferenciales del promotor en una región sobre e inmediatamente adyacente a la caja CAAT, y dos regiones a cada lado de la caja CAAT. Mediante el uso del proceso de selección de unión aleatoria mediado por PCR , los investigadores pudieron demostrar que la secuencia "3 '- (T / C) G ATTGG (T / C) (T / C) (A / G) - 5'" flanqueando inmediatamente la región ATTGG (CCAAT en la hebra complementaria) se seleccionó preferentemente en la hebra codificante (opuesta a la hebra molde). Esto se demostró usando una secuencia de oligonucleótidos (R1) que contenía 27 nucleótidos aleatorios, flanqueados por una secuencia definida de 20 nucleótidos en cada lado. Si bien no se seleccionó un solo nucleótido en cada clon a cada lado del motivo ATTGG (CCAAT en la hebra complementaria), había varios nucleótidos en posiciones seleccionadas con alta frecuencia. Lo más notable de la secuencia anterior fue el residuo G hacia el extremo 5 'del ATTGG. Los otros residuos también enumerados fueron notables, pero hay una división entre dos residuos. Este mismo experimento también produjo la misma secuencia que se muestra arriba cuando se usó un oligonucleótido diferente (R2) que contenía un núcleo ATTGG y flanqueado por 12 nucleótidos aleatorios 5 'y 10 nucleótidos aleatorios 3'. Ambas secuencias son muy similares y se confirmaron en múltiples experimentos. Para las secuencias que flanqueaban el motivo ATTGG con dos residuos de adenina (AA) en su extremo 5 'y G (A / G) en su extremo 3', parece haber inhibido la formación del complejo CBF-ADN y, posteriormente, se produjo en solo el 1% de las secuencias promotoras. En otro experimento realizado con el principal promotor tardío (MLP) de adenovirus de una variedad de especies hospedadoras, se demostró que la mutación de la caja CAAT y la secuencia CCAAT, que se cree que desempeña un papel fundamental en el (MLP) del subgrupo C adenovirus humanos, en especies con una secuencia CAAT deficiente. El inicio de la transcripción en la especie de MLP mutante se redujo significativamente en comparación con el del tipo o especie salvaje en la que había un mutante CAAT. El fracaso para restaurar los adenovirus normalmente funcionales, exhibidos por una caja CAAT, es consistente con la idea de que la caja CAAT juega un papel vital en el MLP de adenovirus y se prefiere sobre otros elementos transcripcionales.

CCAAT en plantas

Estos factores de unión centrales, o factores nucleares (NF-Y), se componen de tres subunidades: NF-YA, NF-YB y NF-YC. Mientras que en los animales cada subunidad NF-Y está codificada por un solo gen, ha habido una diversificación en las plantas tanto en estructura como en función. Las familias de NF-Y constan de entre ocho y 39 miembros por subunidad. Una gran razón de esta diversificación se debe a las duplicaciones de genes y las duplicaciones en tándem, que han contribuido a que las familias de NF-Y sean más grandes en comparación con los factores nucleares animales codificados de forma única. Cada subunidad contiene una parte conservada evolutivamente: el C-terminal de NF-YA, la parte central de NF-YB, y el N-terminal de NF-YC, más del 70% de estos en todas las especies permanece conservado. Sin embargo, las regiones vecinas generalmente no se conservan.

Subunidad NF-YA

La familia NF-YA codifica factores de transcripción que son de longitud variable (entre 207 y 347 aminoácidos para M. truncatula ). Las proteínas NF-YA se caracterizan generalmente por dos dominios que están fuertemente conservados en todos los eucariotas superiores investigados hasta la fecha. El primer dominio (A1) contiene 20 aminoácidos que forman una hélice alfa que parece significativa en sus interacciones con NF-YB y NF-YC. El segundo dominio (A2) es adyacente al dominio A1 por una secuencia enlazadora conservada que es una secuencia de 21 aminoácidos vitales en el ADN específico para la unión a la caja CCAAT. Los dominios A1 y A2 se conservan hacia el extremo C-terminal de los mamíferos, pero ocupan una región más central en las subunidades NF-YA de la planta. En las plantas, la subunidad NF-YA ha evolucionado para regular el desarrollo de un órgano radicular facultativo solo presente en las plantas leguminosas y que se ha demostrado que se expresa en el tejido radicular. Se demostró que tiene propiedades similares a la resistencia a la sequía, y se regula al alza durante el estrés por sequía en las raíces y hojas de Arabidopsis . Los mutantes NF-YA han mostrado una pérdida de función y una hipersensibilidad a condiciones similares a la sequía y, por el contrario, la sobreexpresión de NF-YA ha resultado en resistencia a la sequía .

Subunidad NF-YB

La familia NF-YB es, similar a la subunidad NF-YA, de longitud variable, sin embargo, en promedio es mucho más pequeña que la subunidad NF-YA (90-240 aminoácidos en "M. truncatula"). Se han caracterizado con una estructura y una composición de aminoácidos similar al motivo de pliegues de histonas (HFM). Este se compone de tres hélices alfa separadas por dos dominios de bucle de hebra beta. Al igual que NF-YA, se ha demostrado que NF-YB también mejora la resistencia a la sequía cuando se sobreexpresa y también la promoción de la floración en Arabidopsis .

Subunidad NF-YC

Las proteínas NF-YC tienen un tamaño intermedio entre las proteínas NF-YA y NF-YB (117-292 aminoácidos en M. truncatula ) y también contienen el HFM que prevalece en las proteínas NF-YB. También se ha demostrado que está involucrado en el tiempo de floración en ciertas plantas (la sobreexpresión conduce a una floración más temprana) donde su influencia está potencialmente regulada por la unión de la proteína CONSTANS (CO) a la subunidad NF-YC.

Complejos NF-Y

Debido al cambio evolutivo en los genes que codifican NF-Y en las plantas, posteriormente tienen una amplia gama de complejos triméricos potenciales. Por ejemplo, en Arabidopsis , se han identificado 36 subunidades del factor de transcripción NF-Y (incluidas 10 subunidades NF-YA, 13 NF-YB y 13 NF-YC) y que teóricamente podrían formar 1690 complejos únicos (que contienen uno de cada tipo de subunidad). Este número, por supuesto, es más alto de lo que realmente sucede, ya que algunas subunidades tienen patrones de unión específicos. Los análisis funcionales de genes que codifican NF-Y en plantas han demostrado, como resultado de su diversificación evolutiva en relación con sus homólogos animales, han adquirido diversas funciones específicas, como el desarrollo embrionario, el control del tiempo de floración, el estrés ER, el estrés por sequía y los nódulos. y desarrollo de raíces. Esto puede ser solo una pequeña parte de sus capacidades, ya que el número de combinaciones teóricas de complejos NF-Y es tan grande y solo una pequeña porción se puede crear (menos del 10% de todas las interacciones posibles se confirmaron en ambas direcciones en levadura ).

Proteínas de unión potenciadoras de CCAAT (C / EBP)

Otro aspecto del motivo de unión a CCAAT son las proteínas de unión CCAAT / potenciadoras (C / EBP). Son un grupo de factores de transcripción de 6 miembros (α-ζ), que están altamente conservados y se unen al motivo CCAAT. Si bien la investigación sobre estas proteínas de unión es relativamente reciente, se ha demostrado que su función tiene roles vitales en la proliferación y diferenciación celular, el metabolismo , la inflamación y la inmunidad en varias células, pero específicamente en hepatocitos , adipocitos y células hematopoyéticas . Por ejemplo, en adipocitos, esto se ha demostrado en una variedad de experimentos con ratones: la expresión ectópica de estas C / EBP (C / EBPα y C / EBPβ) pudieron iniciar los programas de diferenciación de la célula, incluso en ausencia de hormonas adipogénicas , o la diferenciación de preadipocitos en adipocitos (o células grasas). Además, una sobreabundancia de estos C / EBP (específicamente, C / EBPδ) provoca una respuesta acelerada. Y además, en células que carecen de C / EBP o en ratones deficientes en C / EBP, ambos son incapaces de sufrir adipogénesis. Esto da como resultado que los ratones mueran de hipoglucemia o la reducción de la acumulación de lípidos en el tejido adiposo. Los C / EBP siguen un dominio de cremallera de leucina básica general (bZIP) en el extremo C-terminal y son capaces de formar dímeros con otros C / EBP u otros factores de transcripción. Esta dimerización permite que las C / EBP se unan específicamente al ADN a través de una secuencia palindrómica en el surco principal del ADN. Están regulados a través de varios medios, que incluyen hormonas , mitógenos , citocinas , nutrientes y otros factores diversos.

Ver también

Referencias