Elemento nuclear corto intercalado - Short interspersed nuclear element

Estructura genética de LINE1 y SINE humanos y murinos .

Los elementos nucleares cortos intercalados ( SINE ) son elementos transponibles (TE) no autónomos y no codificantes que tienen aproximadamente 100 a 700 pares de bases de longitud. Son una clase de retrotransposones , elementos de ADN que se amplifican a través de genomas eucariotas , a menudo a través de intermedios de ARN . Los SINE componen aproximadamente el 13% del genoma de los mamíferos .

Las regiones internas de los SINE se originan a partir de tRNA y permanecen altamente conservadas, lo que sugiere una presión positiva para preservar la estructura y función de los SINE. Si bien los SINE están presentes en muchas especies de vertebrados e invertebrados, los SINE suelen ser específicos de linaje, lo que los convierte en marcadores útiles de evolución divergente entre especies. La variación del número de copias y las mutaciones en la secuencia SINE hacen posible construir filogenias basadas en diferencias en SINE entre especies. Los SINE también están implicados en ciertos tipos de enfermedades genéticas en humanos y otros eucariotas .

En esencia, los elementos nucleares cortos intercalados son parásitos genéticos que han evolucionado muy temprano en la historia de los eucariotas para utilizar la maquinaria proteica dentro del organismo, así como para cooptar la maquinaria de elementos genómicos igualmente parásitos. La simplicidad de estos elementos los hace increíblemente exitosos para persistir y amplificarse (mediante retrotransposición) dentro de los genomas de eucariotas. Estos "parásitos" que se han vuelto omnipresentes en los genomas pueden ser muy perjudiciales para los organismos, como se analiza a continuación. Sin embargo, los eucariotas han podido integrar elementos nucleares intercalados cortos en diferentes vías de señalización, metabólicas y reguladoras y se han convertido en una gran fuente de variabilidad genética. Parecen jugar un papel particularmente importante en la regulación de la expresión génica y la creación de genes de ARN. Esta regulación se extiende a la reorganización de la cromatina y la regulación de la arquitectura genómica; Además, los diferentes linajes, mutaciones y actividad entre eucariotas hacen que los elementos nucleares intercalados cortos sean una herramienta increíblemente útil en el análisis filogenético.

Clasificación y estructura

Los SINE se clasifican como retrotransposones no LTR porque no contienen repeticiones terminales largas (LTR) . Hay tres tipos de SINE comunes a vertebrados e invertebrados: CORE-SINE, V-SINE y AmnSINE. Los SINE tienen regiones internas de 50-500 pares de bases que contienen un segmento derivado de tRNA con cajas A y B que sirven como un promotor interno para la RNA polimerasa III .

Estructura interna

Los SINE se caracterizan por sus diferentes módulos, que son esencialmente una sección de su secuencia. Los SINE pueden, pero no necesariamente tienen que poseer una cabeza, un cuerpo y una cola. La cabeza, se encuentra en el extremo 5 ' de elementos nucleares intercalados cortos y es un derivado evolutivo de un ARN sintetizado por la ARN polimerasa III, como los ARN ribosómicos y los ARNt; la cabeza 5 'es indicativa de qué elemento endógeno del que se derivó SINE y fue capaz de utilizar parasitariamente su maquinaria transcripcional. Por ejemplo, el 5 'del seno de Alu se deriva del ARN 7SL , una secuencia transcrita por la ARN polimerasa III que codifica el elemento ARN de SRP, una ribonucleoproteína abundante. El cuerpo de los SINE posee un origen desconocido, pero a menudo comparte mucha homología con un LINE correspondiente, lo que permite a los SINE cooptar parasitariamente endonucleasas codificadas por LINE (que reconocen ciertos motivos de secuencia). Por último, la cola 3 ′ de SINEs se compone de repeticiones cortas y simples de diferentes longitudes; estas repeticiones simples son sitios donde dos (o más) elementos nucleares intercalados cortos pueden combinarse para formar un SINE dimérico. Los elementos nucleares intercalados cortos que no solo poseen una cabeza y una cola se denominan SINE simples, mientras que los elementos nucleares intercalados cortos que también poseen un cuerpo o son una combinación de dos o más SINE son SINE complejos.

Transcripción

Los elementos nucleares intercalados cortos son transcritos por la ARN polimerasa III, que se sabe que transcribe ARN ribosómico y ARNt , dos tipos de ARN vitales para el ensamblaje ribosómico y la traducción del ARNm . Los SINE, como los ARNt y muchos ARN de núcleos pequeños, poseen un promotor interno y, por lo tanto, se transcriben de manera diferente a la mayoría de los genes que codifican proteínas. En otras palabras, los elementos nucleares intercalados cortos tienen sus elementos promotores clave dentro de la propia región transcrita. Aunque transcritos por la ARN polimerasa III, los SINE y otros genes que poseen promotores internos, reclutan diferentes mecanismos y factores de transcripción que los genes que poseen promotores cadena arriba.

Efectos sobre la expresión génica

Los cambios en la estructura cromosómica influyen en la expresión génica principalmente al afectar la accesibilidad de los genes a la maquinaria transcripcional. El cromosoma tiene un sistema jerárquico y muy complejo de organizar el genoma. Este sistema de organización, que incluye histonas , grupos metilo , grupos acetilo y una variedad de proteínas y ARN, permite que diferentes dominios dentro de un cromosoma sean accesibles a polimerasas, factores de transcripción y otras proteínas asociadas en diferentes grados. Además, la forma y densidad de ciertas áreas de un cromosoma pueden afectar la forma y densidad de regiones vecinas (o incluso distantes) en el cromosoma a través de la interacción facilitada por diferentes proteínas y elementos. Los ARN no codificantes, como los elementos nucleares intercalados cortos, que se sabe que se asocian con la estructura de la cromatina y contribuyen a ella, pueden desempeñar un papel muy importante en la regulación de la expresión génica. De manera similar, los elementos nucleares intercalados cortos pueden participar en la regulación génica modificando la arquitectura genómica.

De hecho Usmanova et al. 2008 sugirió que los elementos nucleares intercalados cortos pueden servir como señales directas en el reordenamiento y estructura de la cromatina . El artículo examinó la distribución global de SINE en cromosomas humanos y de ratón y determinó que esta distribución era muy similar a las distribuciones genómicas de genes y motivos CpG . La distribución de los SINE a los genes fue significativamente más similar que la de otros elementos genéticos no codificantes e incluso difirió significativamente de la distribución de elementos nucleares intercalados durante mucho tiempo. Esto sugirió que la distribución SINE no era un mero accidente causado por la retrotransposición mediada por LINE, sino que los SINE tenían un papel en la regulación genética. Además, los SINE contienen con frecuencia motivos para las proteínas polycomb YY1 . YY1 es una proteína con dedos de zinc que actúa como represor transcripcional para una amplia variedad de genes esenciales para el desarrollo y la señalización. Se cree que la proteína Polycomb YY1 media la actividad de las histonas desacetilasas y las histonas acetiltransferasas para facilitar la reorganización de la cromatina; esto suele facilitar la formación de heterocromatina (estado de silenciamiento de genes). Por lo tanto, el análisis sugiere que los elementos nucleares intercalados cortos pueden funcionar como un "refuerzo de señal" en el silenciamiento dependiente de polycomb de conjuntos de genes a través de la reorganización de la cromatina. En esencia, es el efecto acumulativo de muchos tipos de interacciones lo que conduce a la diferencia entre la eucromatina , que no está compacta y generalmente es más accesible para la maquinaria transcripcional, y la heterocromatina , que está compacta y generalmente no es accesible para la maquinaria transcripcional; Los SINE parecen jugar un papel evolutivo en este proceso.

Además de afectar directamente a la estructura de la cromatina, existen varias formas en las que los SINE pueden potencialmente regular la expresión génica. Por ejemplo, el ARN no codificante largo puede interactuar directamente con represores y activadores transcripcionales, atenuando o modificando su función. Este tipo de regulación puede ocurrir de diferentes formas: la transcripción de ARN puede unirse directamente al factor de transcripción como co-regulador; además, el ARN puede regular y modificar la capacidad de los correguladores para asociarse con el factor de transcripción. Por ejemplo, se sabe que Evf-2, un ARN largo no codificante, funciona como coactivador de ciertos factores de transcripción de homeobox que son críticos para el desarrollo y la organización del sistema nervioso. Además, las transcripciones de ARN pueden interferir con la funcionalidad del complejo transcripcional al interactuar o asociarse con las ARN polimerasas durante los procesos de transcripción o carga. Además, los ARN no codificantes como los SINE pueden unirse o interactuar directamente con el dúplex de ADN que codifica el gen y, por lo tanto, evitar su transcripción.

Además, muchos ARN no codificantes se distribuyen cerca de los genes que codifican proteínas, a menudo en la dirección inversa. Esto es especialmente cierto para los elementos nucleares intercalados cortos como se ve en Usmanova et al. Estos ARN no codificantes, que se encuentran adyacentes o se superponen a conjuntos de genes, proporcionan un mecanismo mediante el cual se pueden reclutar factores de transcripción y maquinaria para aumentar o reprimir la transcripción de genes locales. El ejemplo particular de SINE que potencialmente reclutan el represor transcripcional polycomb YY1 se analiza anteriormente. Alternativamente, también proporciona un mecanismo mediante el cual la expresión génica local puede restringirse y regularse porque los complejos transcripcionales pueden dificultar o prevenir la transcripción de genes cercanos. Hay investigaciones que sugieren que este fenómeno se observa particularmente en la regulación genética de células pluripotentes.

En conclusión, los ARN no codificantes, como los SINE, pueden afectar la expresión génica en una multitud de niveles diferentes y de diferentes formas. Se cree que los elementos nucleares intercalados cortos están profundamente integrados en una red reguladora compleja capaz de ajustar la expresión génica en todo el genoma eucariota.

Propagación y regulación

El ARN codificado por el elemento nuclear intercalado corto no codifica ningún producto proteico pero, no obstante , se transcribe de forma inversa y se inserta de nuevo en una región alternativa del genoma. Por esta razón, se cree que los elementos nucleares cortos intercalados han coevolucionado con los elementos nucleares intercalados largos (LINE), ya que los LINE de hecho codifican productos proteicos que les permiten ser transcritos de forma inversa e integrados de nuevo en el genoma. Se cree que los SINE han cooptado las proteínas codificadas por LINE que están contenidas en 2 marcos de lectura. El marco de lectura abierto 1 (ORF 1) codifica una proteína que se une al ARN y actúa como acompañante para facilitar y mantener la estructura del complejo LINE proteína-ARN. El marco de lectura abierto 2 (ORF 2) codifica una proteína que posee actividades tanto de endonucleasa como de transcriptasa inversa. Esto permite que el ARNm de LINE se transcriba de forma inversa en ADN y se integre en el genoma basándose en los motivos de secuencia reconocidos por el dominio de endonucleasa de la proteína.

LINE-1 (L1) se transcribe y retrotranspone con mayor frecuencia en la línea germinal y durante el desarrollo temprano; como resultado, los SINE se mueven más alrededor del genoma durante estos períodos. La transcripción SINE está regulada negativamente por factores de transcripción en las células somáticas después del desarrollo temprano, aunque el estrés puede causar una regulación positiva de los SINE normalmente silenciosos. Los SINE se pueden transferir entre individuos o especies mediante transferencia horizontal a través de un vector viral .

Se sabe que los SINE comparten homología de secuencia con LINES, lo que proporciona una base mediante la cual la maquinaria LINE puede transcribir e integrar transcripciones SINE. Alternativamente, se cree que algunos SINE utilizan un sistema mucho más complejo de integración de nuevo en el genoma; este sistema implica el uso de roturas aleatorias de ADN de doble hebra (en lugar de la endonucleasa codificada por elementos nucleares relacionados intercalados largos que crean un sitio de inserción). Estas roturas de ADN se utilizan para cebar la transcriptasa inversa, integrando finalmente la transcripción SINE nuevamente en el genoma. No obstante, los SINE dependen de enzimas codificadas por otros elementos del ADN y, por lo tanto, se conocen como retrotransposones no autónomos, ya que dependen de la maquinaria de los LINE, que se conocen como retrotransposones autónomos. <

La teoría de que los elementos nucleares intercalados cortos han evolucionado para utilizar la maquinaria de retrotransposón de los elementos nucleares intercalados durante mucho tiempo está respaldada por estudios que examinan la presencia y distribución de LINE y SINE en taxones de diferentes especies. Por ejemplo, LINE y SINE en roedores y primates muestran una homología muy fuerte en el motivo del sitio de inserción. Dicha evidencia es una base para el mecanismo propuesto en el que la integración de la transcripción SINE puede cooptarse con productos proteicos codificados en LINE. Esto se demuestra específicamente mediante un análisis detallado de más de 20 especies de roedores perfiladas LINE y SINE, principalmente L1 y B1 respectivamente; estas son familias de LINE y SINE que se encuentran en altas frecuencias en roedores junto con otros mamíferos. El estudio buscó proporcionar claridad filogenética dentro del contexto de la actividad LINE y SINE.

El estudio llegó a un taxón candidato que se cree que es el primer caso de extinción de L1 LINE; se esperaba que descubrió que no había evidencia que sugiriera que la actividad B1 SINE ocurriera en especies que no tenían actividad L1 LINE. Además, el estudio sugirió que el silenciamiento de elementos nucleares intercalados cortos de B1 de hecho ocurrió antes de la extinción de elementos nucleares intercalados largos de L1; esto se debe al hecho de que los B1 SINE están silenciados en el género más estrechamente relacionado con el género que no contiene L1 LINE activas (aunque el género con silenciamiento B1 SINE todavía contiene L1 LINE activas). También se encontró otro género que de manera similar contenía elementos nucleares activos L1 intercalados largos pero no contenía elementos nucleares B1 intercalados cortos; el escenario opuesto, en el que no se encontraron SINEs B1 activos en un género que no poseía LINEs L1 activos. Este resultado era esperado y apoya firmemente la teoría de que los SINE han evolucionado para cooptar las proteínas de unión al ARN, las endonucleasas y las transcriptasas inversas codificadas por LINE. En taxones que no transcriben y traducen activamente productos proteicos de elementos nucleares intercalados durante mucho tiempo, los SINE no tienen la base teórica por la cual retrotransponerse dentro del genoma. Los resultados obtenidos en Rinehart et al. son, por tanto, muy favorables al modelo actual de retrotransposición SINE.

Efectos de la transposición SINE

La inserción de un SINE corriente arriba de una región codificante puede dar como resultado la reorganización del exón o cambios en la región reguladora del gen. La inserción de un SINE en la secuencia codificante de un gen puede tener efectos deletéreos y la transposición no regulada puede causar una enfermedad genética . Se cree que la transposición y recombinación de SINE y otros elementos nucleares activos es una de las principales contribuciones de la diversidad genética entre linajes durante la especiación.

SINE comunes

Se cree que los elementos nucleares intercalados cortos tienen orígenes parásitos en genomas eucariotas. Estos SINE se han mutado y replicado un gran número de veces en una escala de tiempo evolutiva y, por lo tanto, forman muchos linajes diferentes. Su origen evolutivo temprano ha hecho que sean ubicuos en muchos linajes eucariotas.

Los elementos Alu , elemento nuclear intercalado corto de unos 300 nucleótidos, son el SINE más común en los seres humanos, con> 1.000.000 de copias en todo el genoma, que es más del 10 por ciento del genoma total; esto no es infrecuente entre otras especies. Las diferencias en el número de copias de elementos de Alu pueden usarse para distinguir y construir filogenias de especies de primates. Los caninos difieren principalmente en su abundancia de repeticiones SINEC_Cf en todo el genoma, en lugar de otras mutaciones a nivel de genes o alelos. Estos SINE específicos para perros pueden codificar un sitio aceptor de empalme, alterando las secuencias que aparecen como exones o intrones en cada especie.

Además de los mamíferos, los SINE pueden alcanzar un alto número de copias en una variedad de especies, incluidos los vertebrados no óseos (tiburón elefante) y algunas especies de peces (celacantos). En las plantas, los SINE a menudo están restringidos a especies estrechamente relacionadas y han emergido, decaído y desaparecido con frecuencia durante la evolución. Sin embargo, algunas familias SINE, como las Au-SINE y las Angio-SINE, están inusualmente extendidas en muchas especies de plantas que a menudo no están relacionadas.

Enfermedades

Hay más de 50 enfermedades humanas asociadas con los SINE. Cuando se insertan cerca o dentro del exón, los SINE pueden causar un empalme inadecuado, convertirse en regiones de codificación o cambiar el marco de lectura , lo que a menudo conduce a fenotipos de enfermedades en humanos y otros animales. La inserción de elementos Alu en el genoma humano está asociada con cáncer de mama , cáncer de colon , leucemia , hemofilia , enfermedad de Dent , fibrosis quística , neurofibromatosis y muchos otros.

microARN

El papel de los elementos nucleares intercalados cortos en la regulación génica dentro de las células ha sido respaldado por múltiples estudios. Uno de esos estudios examinó la correlación entre cierta familia de SINE y microARN (en el pez cebra ). La familia específica de SINE que se examinó fue la Anamnia V-SINE; esta familia de elementos nucleares cortos intercalados se encuentra a menudo en la región no traducida del extremo 3 'de muchos genes y está presente en los genomas de vertebrados. El estudio implicó un análisis computacional en el que se examinó la distribución genómica y la actividad de los Anamnia V-SINE en el pez cebra Danio rerio ; además, se analizó el potencial de estos V-SINE para generar nuevos loci de microARN. Se encontró que los genes que se predijo que poseían V-SINE fueron dirigidos por microARN con valores E de hibridación significativamente más altos (en relación con otras áreas del genoma). Los genes que tenían valores de E de hibridación elevados eran genes particularmente implicados en las vías metabólicas y de señalización. Casi todos los miARN identificados por tener una gran capacidad para hibridar con motivos de la secuencia V-SINE putativos en genes han sido identificados (en mamíferos) para tener funciones reguladoras. Estos resultados, que establecen una correlación entre elementos nucleares intercalados cortos y diferentes microARN reguladores, sugieren fuertemente que los V-SINE tienen un papel significativo en la atenuación de las respuestas a diferentes señales y estímulos relacionados con el metabolismo, la proliferación y la diferenciación. Se deben realizar muchos otros estudios para establecer la validez y el alcance del papel de los retrotransposones de elementos nucleares intercalados cortos en las redes reguladoras de expresión génica. En conclusión, aunque no se sabe mucho sobre el papel y el mecanismo por el cual los SINE generan loci de genes de miARN, en general se entiende que los SINE han desempeñado un papel evolutivo significativo en la creación de "genes de ARN", esto también se abordó anteriormente en los SINE. y pseudogenes.

Con tal evidencia que sugiere que los elementos nucleares intercalados cortos han sido fuentes evolutivas para la generación de loci de microARN, es importante discutir más a fondo las posibles relaciones entre los dos, así como el mecanismo por el cual el microARN regula la degradación del ARN y, más ampliamente, la expresión génica. Un microARN es un ARN no codificante generalmente de 22 nucleótidos de longitud. Este oligonucleótido que no codifica proteínas está codificado en sí mismo por una secuencia de ADN nuclear más larga, generalmente transcrita por la ARN polimerasa II, que también es responsable de la transcripción de la mayoría de los ARNm y snRNA en eucariotas. Sin embargo, algunas investigaciones sugieren que algunos microARN que poseen elementos nucleares intercalados cortos en sentido ascendente son transcritos por la ARN polimerasa III, que está ampliamente implicada en el ARN ribosómico y el ARNt, dos transcripciones vitales para la traducción del ARNm. Esto proporciona un mecanismo alternativo por el cual los elementos nucleares intercalados cortos podrían interactuar o mediar en redes de regulación de genes que involucran microARN.

Las regiones que codifican miARN pueden ser genes de ARN independientes que a menudo son antisentido para los genes codificadores de proteínas vecinos, o pueden encontrarse dentro de los intrones de genes codificadores de proteínas. La co-localización de microARN y genes codificadores de proteínas proporciona una base mecanicista mediante la cual el microARN regula la expresión génica. Además, Scarpato et al. revela (como se discutió anteriormente) que los genes que se predice que poseen elementos nucleares intercalados cortos (SINE) a través del análisis de secuencia fueron dirigidos e hibridados por microARN significativamente mayores que otros genes. Esto proporciona una ruta evolutiva por la cual los SINE parasitarios fueron cooptados y utilizados para formar genes de ARN (como microARN) que han evolucionado para desempeñar un papel en redes complejas de regulación de genes.

Los microARN se transcriben como parte de cadenas de ARN más largas de aproximadamente 80 nucleótidos que, a través del emparejamiento de bases complementarias, pueden formar estructuras de bucle en horquilla.Estas estructuras son reconocidas y procesadas en el núcleo por la proteína nuclear DiGeorge Syndrome Critical Region 8 (DGCR8) que recluta y se asocia con la proteína Drosha. Este complejo es responsable de escindir algunas de las estructuras en forma de horquilla del pre-microARN que se transporta al citoplasma. El pre-miARN es procesado por la proteína DICER en un nucleótido bicatenario de 22. A partir de entonces, una de las cadenas se incorpora a un complejo silenciador inducido por ARN de múltiples proteínas (RISC). Entre estas proteínas se encuentran proteínas de la familia Argonaute que son críticas para la capacidad del complejo para interactuar y reprimir la traducción del ARNm diana.

Comprender las diferentes formas en que el microARN regula la expresión génica, incluida la traducción y degradación del ARNm, es clave para comprender el papel evolutivo potencial de los SINE en la regulación génica y en la generación de loci de microARN. Esto, además del papel directo de los SINE en las redes reguladoras (como se analiza en los SINE como ARN largos no codificantes) es crucial para comenzar a comprender la relación entre los SINE y ciertas enfermedades. Múltiples estudios han sugerido que el aumento de la actividad SINE se correlaciona con ciertos perfiles de expresión génica y la regulación postranscripción de ciertos genes. De hecho, Peterson et al. 2013 demostró que una alta expresión de ARN SINE se correlaciona con la regulación negativa postranscripcional de BRCA1 , un supresor de tumores implicado en múltiples formas de cáncer, a saber, el cáncer de mama. Además, los estudios han establecido una fuerte correlación entre la movilización transcripcional de SINE y ciertos cánceres y afecciones como la hipoxia; esto puede deberse a la inestabilidad genómica causada por la actividad SINE, así como a efectos más directos aguas abajo. Los SINE también se han relacionado con otras innumerables enfermedades. En esencia, los elementos nucleares intercalados cortos se han integrado profundamente en innumerables vías reguladoras, metabólicas y de señalización y, por lo tanto, desempeñan un papel inevitable en la causa de enfermedades. Aún queda mucho por saber sobre estos parásitos genómicos, pero está claro que desempeñan un papel importante en los organismos eucariotas.

SINE y pseudogenes

Sin embargo, la actividad de los SINE tiene vestigios genéticos que no parecen jugar un papel significativo, positivo o negativo, y se manifiestan en el genoma como pseudogenes . Sin embargo, los SINE no deben confundirse con los pseudogenes de ARN. En general, los pseudogenes se generan cuando los ARNm procesados ​​de genes que codifican proteínas se transcriben de forma inversa y se vuelven a incorporar al genoma (los pseudogenes de ARN son genes de ARN de transcripción inversa). Los pseudogenes generalmente carecen de función ya que descienden de ARN procesados ​​independientemente de su contexto evolutivo, que incluye intrones y diferentes elementos reguladores que permiten la transcripción y el procesamiento. Estos pseudogenes, aunque no funcionales, pueden en algunos casos todavía poseer promotores, islas CpG y otras características que permiten la transcripción; por tanto, todavía se pueden transcribir y pueden tener un papel en la regulación de la expresión génica (como los SINE y otros elementos no codificantes). Por lo tanto, los pseudogenes se diferencian de los SINE en que se derivan de ARN funcional transcrito, mientras que los SINE son elementos de ADN que se retrotransponen mediante la cooptación de la maquinaria transcripcional de genes de ARN. Sin embargo, hay estudios que sugieren que los elementos retrotransponibles, como los elementos nucleares intercalados cortos, no solo son capaces de copiarse a sí mismos en regiones alternas del genoma, sino que también pueden hacerlo para genes aleatorios. Por lo tanto, los SINE pueden desempeñar un papel vital en la generación de pseudogenes, que se sabe que están involucrados en redes reguladoras. Este es quizás otro medio por el cual los SINE han podido influir y contribuir a la regulación genética.

Referencias