Proteína de unión a ARN - RNA-binding protein

Las proteínas de unión al ARN (a menudo abreviadas como RBP ) son proteínas que se unen al ARN monocatenario o bicatenario en las células y participan en la formación de complejos de ribonucleoproteínas . Las RBP contienen varios motivos estructurales , como el motivo de reconocimiento de ARN (RRM), el dominio de unión del ARNdc , el dedo de zinc y otros. Son proteínas citoplasmáticas y nucleares . Sin embargo, dado que la mayor parte del ARN maduro se exporta del núcleo con relativa rapidez, la mayoría de las RBP en el núcleo existen como complejos de proteína y pre-ARNm llamados partículas de ribonucleoproteína heterogéneas (hnRNP). Las RBP tienen papeles cruciales en varios procesos celulares tales como: función celular, transporte y localización. Ellos juegan un papel especialmente importante en el control post-transcripcional del ARN, tales como: empalme , poliadenilación , ARNm de estabilización, el ARNm de localización y traducción . Las células eucariotas codifican diversas RBP, aproximadamente 500 genes, con una actividad única de unión al ARN y una interacción proteína-proteína . Durante la evolución , la diversidad de RBP aumentó enormemente con el aumento del número de intrones . La diversidad permitió a las células eucariotas utilizar exones de ARN en varias disposiciones, dando lugar a una RNP (ribonucleoproteína) única para cada ARN. Aunque las RBP tienen un papel crucial en la regulación postranscripcional de la expresión génica, se han estudiado de forma sistemática relativamente pocas RBP.

Estructura

Muchas RBP tienen estructuras modulares y están compuestas por múltiples repeticiones de solo unos pocos dominios básicos específicos que a menudo tienen secuencias limitadas. A continuación, estas secuencias se organizan en diversas combinaciones para satisfacer la necesidad de diversidad. El reconocimiento de una proteína específica de un ARN específico ha evolucionado a través del reordenamiento de estos pocos dominios básicos. Cada dominio básico reconoce el ARN, pero muchas de estas proteínas requieren múltiples copias de uno de los muchos dominios comunes para funcionar.

Diversidad

A medida que el ARN nuclear emerge de la ARN polimerasa , las transcripciones de ARN se cubren inmediatamente con proteínas de unión a ARN que regulan todos los aspectos del metabolismo y la función del ARN, incluida la biogénesis, la maduración, el transporte, la localización celular y la estabilidad del ARN. Todas las RBP se unen al ARN, sin embargo, lo hacen con diferentes especificidades y afinidades de secuencia de ARN, lo que permite que las RBP sean tan diversas como sus objetivos y funciones. Estos objetivos incluyen ARNm , que codifica proteínas, así como varios ARN funcionales no codificantes . Los NcRNA casi siempre funcionan como complejos de ribonucleoproteínas y no como RNA desnudos. Estos ARN no codificantes incluyen microARN , ARN de interferencia pequeños (ARNip), así como ARN nuclear pequeño splicesomal (ARNnn).

Función

Procesamiento y modificación de ARN

Splicing alternativo

El empalme alternativo es un mecanismo mediante el cual se generan diferentes formas de ARNm maduros (ARN mensajeros) a partir del mismo gen . Es un mecanismo regulador por el cual las variaciones en la incorporación de los exones en el ARNm conducen a la producción de más de una proteína relacionada, expandiendo así las posibles salidas genómicas. Las prácticas comerciales restrictivas funcionan ampliamente en la regulación de este proceso. Algunas proteínas de unión, como las proteínas de unión a ARN específicas neuronales, a saber, NOVA1 , controlan el corte y empalme alternativo de un subconjunto de ARNh reconociendo y uniéndose a una secuencia específica en el ARN (YCAY, donde Y indica pirimidina, U o C). Estas proteínas luego reclutan proteínas splicesomales a este sitio objetivo. Las proteínas SR también son bien conocidas por su papel en el empalme alternativo a través del reclutamiento de snRNP que forman el empalme , a saber, U1 snRNP y U2AF snRNP. Sin embargo, las prácticas comerciales restrictivas también forman parte del empalme en sí. El splicesome es un complejo de snRNA y subunidades de proteínas y actúa como el agente mecánico que elimina los intrones y liga los exones flanqueantes. Además del complejo de empalme central, las RBP también se unen a los sitios de los elementos de ARN que actúan sobre Cis que influyen en la inclusión o exclusión de exones durante el empalme. Estos sitios se denominan potenciadores de empalme exónico (ESE), silenciadores de empalme exónico (ESS), potenciadores de empalme intrónico (ISE) y silenciadores de empalme intrónico (ISS) y, según su ubicación de unión, los RBP funcionan como silenciadores o potenciadores de empalme.

Edición de ARN

Proteína ADAR.
ADAR  : una proteína de unión de ARN involucrada en eventos de edición de ARN.

La forma más extensamente estudiada de edición de ARN involucra la proteína ADAR . Esta proteína funciona mediante la modificación postranscripcional de las transcripciones de ARNm al cambiar el contenido de nucleótidos del ARN. Esto se hace mediante la conversión de adenosina en inosina en una reacción enzimática catalizada por ADAR. Este proceso cambia efectivamente la secuencia de ARN de la codificada por el genoma y extiende la diversidad de los productos génicos. La mayor parte de la edición de ARN ocurre en regiones no codificantes de ARN; sin embargo, se ha demostrado que algunas transcripciones de ARN que codifican proteínas están sujetas a edición, lo que da como resultado una diferencia en la secuencia de aminoácidos de su proteína. Un ejemplo de esto es el ARNm del receptor de glutamato, donde la glutamina se convierte en arginina, lo que provoca un cambio en la funcionalidad de la proteína.

Poliadenilación

La poliadenilación es la adición de una "cola" de residuos de adenilato a una transcripción de ARN aproximadamente 20 bases cadena abajo de la secuencia AAUAAA dentro de la región sin traducir de tres primos . La poliadenilación de ARNm tiene un fuerte efecto sobre su transporte nuclear , eficiencia de traducción y estabilidad. Todos estos, así como el proceso de poliadenilación, dependen de la unión de RBP específicas. Todos los ARNm eucariotas, con pocas excepciones, se procesan para recibir colas 3 'poli (A) de aproximadamente 200 nucleótidos. Uno de los complejos proteicos necesarios en este proceso es CPSF . El CPSF se une a la secuencia de la cola 3 '(AAUAAA) y, junto con otra proteína llamada proteína de unión a poli (A) , recluta y estimula la actividad de la poli (A) polimerasa . La poli (A) polimerasa es inactiva por sí sola y requiere la unión de estas otras proteínas para funcionar correctamente.

Exportar

Una vez que se completa el procesamiento, el ARNm debe transportarse desde el núcleo celular hasta el citoplasma . Este es un proceso de tres pasos que implica la generación de un complejo de carga y transporte en el núcleo seguido de la translocación del complejo a través del complejo de poros nucleares y finalmente la liberación de la carga en el citoplasma. Posteriormente, el portador se recicla. Se cree que el heterodímero TAP / NXF1: p15 es el actor clave en la exportación de ARNm. La sobreexpresión de TAP en las ranas Xenopus laevis aumenta la exportación de transcripciones que de otro modo se exportarían de manera ineficiente. Sin embargo, TAP necesita proteínas adaptadoras porque no puede interactuar directamente con el ARNm. La proteína Aly / REF interactúa y se une al ARNm reclutando TAP.

localización de ARNm

La localización del ARNm es fundamental para la regulación de la expresión génica al permitir la producción de proteínas regulada espacialmente. A través de la localización del ARNm, las proteínas se transcriben en su sitio objetivo de la célula. Esto es especialmente importante durante el desarrollo temprano cuando las escisiones celulares rápidas dan a diferentes células diversas combinaciones de ARNm que luego pueden conducir a destinos celulares drásticamente diferentes. Las RBP son críticas en la localización de este ARNm que asegura que las proteínas solo se transcriban en sus regiones previstas. Una de estas proteínas es ZBP1 . ZBP1 se une al ARNm de beta-actina en el sitio de transcripción y se mueve con el ARNm hacia el citoplasma. Luego, localiza este ARNm en la región de laminillas de varios tipos de células asimétricas donde luego se puede traducir. FMRP es otro RBP involucrado en la localización de ARN. Se demostró que, además de otras funciones para FMRP en el metabolismo del ARN, FMRP participa en la localización inducida por estímulos de varios ARNm dendríticos en dendritas neuronales.

Traducción

La regulación traslacional proporciona un mecanismo rápido para controlar la expresión génica. En lugar de controlar la expresión génica a nivel transcripcional, el ARNm ya se transcribe, pero el reclutamiento de ribosomas está controlado. Esto permite la generación rápida de proteínas cuando una señal activa la traducción. ZBP1, además de su papel en la localización del ARNm de B-actina, también participa en la represión traduccional del ARNm de beta-actina bloqueando el inicio de la traducción. ZBP1 debe eliminarse del ARNm para permitir que el ribosoma se una correctamente y comience la traducción.

Interacciones proteína-ARN

Las proteínas de unión al ARN exhiben un reconocimiento altamente específico de sus objetivos de ARN al reconocer sus secuencias y estructuras. La unión específica de las proteínas de unión al ARN les permite distinguir sus objetivos y regular una variedad de funciones celulares mediante el control de la generación, maduración y vida útil del transcrito de ARN. Esta interacción comienza durante la transcripción, ya que algunas RBP permanecen unidas al ARN hasta la degradación, mientras que otras solo se unen transitoriamente al ARN para regular el empalme , el procesamiento, el transporte y la localización del ARN . En esta sección, se discutirán tres clases de los dominios de unión de ARN más ampliamente estudiados (motivo de reconocimiento de ARN, motivo de unión de ARN bicatenario, motivo de dedos de zinc).

Motivo de reconocimiento de ARN (RRM)

El motivo de reconocimiento de ARN , que es el motivo de unión al ARN más común, es un pequeño dominio de proteína de 75 a 85 aminoácidos que forma una hoja β de cuatro hebras contra las dos hélices α. Este motivo de reconocimiento ejerce su papel en numerosas funciones celulares, especialmente en el procesamiento de ARNm / ARNr, empalme, regulación de la traducción, exportación de ARN y estabilidad del ARN. Estructuras Diez de un RRM se han identificado a través de espectroscopía de RMN y cristalografía de rayos X . Estas estructuras ilustran la complejidad del reconocimiento proteína-ARN de RRM, ya que implica interacciones ARN-ARN y proteína-proteína, además de interacciones proteína-ARN. A pesar de su complejidad, las diez estructuras tienen algunas características comunes. Se encontró que todas las láminas β de cuatro hebras de las 'superficies proteicas principales' de RRM interactúan con el ARN, que generalmente contacta con dos o tres nucleótidos de una manera específica. Además, se logra una fuerte afinidad de unión de ARN y especificidad hacia la variación a través de una interacción entre el enlazador entre dominios y el ARN y entre los propios RRM. Esta plasticidad del RRM explica por qué RRM es el dominio más abundante y por qué juega un papel importante en varias funciones biológicas.

Motivo de unión a ARN bicatenario

Motivo de unión a ARN bicatenario
PDB 2b7t EBI.jpg
dsRBD de rata ADAR2 proteína ( PDB : 2b7t ).
Identificadores
Símbolo drrm
Pfam PF14709
Clan pfam CL0196
InterPro IPR014720
CATH 1di2
SCOP2 1di2 / SCOPe / SUPFAM
Utilice el clan Pfam para la superfamilia homóloga.

El motivo de unión a ARN bicatenario (dsRM, dsRBD), un dominio de 70 a 75 aminoácidos, desempeña un papel fundamental en el procesamiento del ARN , la localización del ARN , la interferencia del ARN , la edición del ARN y la represión de la traducción. Las tres estructuras del dominio resueltas a partir de 2005 poseen características unificadoras que explican cómo los dsRM solo se unen al dsRNA en lugar de dsDNA. Se encontró que las dsRM interactuaban a lo largo del dúplex de ARN a través de las hélices α y el bucle β1-β2. Además, las tres estructuras dsRBM hacen contacto con la columna vertebral de azúcar-fosfato del surco mayor y de un surco menor, que está mediado por el bucle β1-β2 junto con la región N-terminal de la hélice alfa 2. Esta interacción es una Adaptación única para la forma de una doble hélice de ARN, ya que involucra 2'-hidroxilos y fosfato de oxígeno. A pesar de las características estructurales comunes entre los dsRBM, exhiben marcos químicos distintos, lo que permite la especificidad para una variedad de estructuras de ARN que incluyen bucles de tallo, bucles internos, protuberancias o hélices que contienen desajustes.

Dedos de zinc

Dedo de zinc.
" Dedo de zinc ": representación de dibujos animados del motivo de dedos de zinc de las proteínas. El ion zinc (verde) está coordinado por dos residuos de aminoácidos de histidina y dos de cisteína.

Los dominios de dedos de zinc de tipo CCHH son el dominio de unión al ADN más común dentro del genoma eucariota . Para lograr un alto reconocimiento específico de secuencia de ADN, se utilizan varios dedos de zinc de forma modular. Los dedos de zinc exhiben un pliegue de proteína ββα en el que una horquilla β y una hélice α se unen a través de un Zn2+
ion. Además, la interacción entre las cadenas laterales de proteínas de la hélice α con las bases de ADN en el surco principal permite el reconocimiento específico de la secuencia de ADN. A pesar de su amplio reconocimiento del ADN, ha habido descubrimientos recientes de que los dedos de zinc también tienen la capacidad de reconocer el ARN. Además de los dedos de zinc CCHH, se descubrió recientemente que los dedos de zinc CCCH emplean el reconocimiento específico de secuencia de ARN monocatenario a través de una interacción entre enlaces de hidrógeno intermoleculares y bordes de Watson-Crick de las bases de ARN. Los dedos de zinc de tipo CCHH emplean dos métodos de unión de ARN. Primero, los dedos de zinc ejercen una interacción no específica con la columna vertebral de una doble hélice, mientras que el segundo modo permite que los dedos de zinc reconozcan específicamente las bases individuales que sobresalen. A diferencia del tipo CCHH, el dedo de zinc tipo CCCH muestra otro modo de unión de ARN, en el que el ARN monocatenario se identifica de una manera específica de secuencia. En general, los dedos de zinc pueden reconocer directamente el ADN mediante la unión a la secuencia de dsDNA y el ARN mediante la unión a la secuencia de ssRNA.

Papel en el desarrollo embrionario

Caenorhabditis elegans.
Rastreo de C. elegans gusano hermafrodita

La regulación transcripcional y postranscripcional del ARN de las proteínas de unión al ARN tiene un papel en la regulación de los patrones de expresión génica durante el desarrollo. Una extensa investigación sobre el nematodo C. elegans ha identificado las proteínas de unión al ARN como factores esenciales durante la línea germinal y el desarrollo embrionario temprano. Su función específica implica el desarrollo de tejidos somáticos ( neuronas , hipodermis , músculos y células excretoras), además de proporcionar señales de tiempo para los eventos de desarrollo. Sin embargo, es excepcionalmente desafiante descubrir el mecanismo detrás de la función de los RBP en desarrollo debido a la dificultad para identificar sus objetivos de ARN. Esto se debe a que la mayoría de las RBP suelen tener múltiples objetivos de ARN. Sin embargo, es indiscutible que las prácticas comerciales restrictivas ejercen un control crítico en la regulación de las vías del desarrollo de manera concertada.

Desarrollo de la línea germinal

En Drosophila melanogaster , Elav, Sxl y tra-2 son genes que codifican proteínas de unión a ARN que son fundamentales en la determinación temprana del sexo y el mantenimiento del estado sexual somático. Estos genes imponen efectos a nivel postranscripcional al regular el empalme específico del sexo en Drosophila . Sxl ejerce una regulación positiva del gen feminizante tra para producir un ARNm tra funcional en las hembras. En C. elegans , las proteínas de unión al ARN, incluidas FOG-1, MOG-1 / -4 / -5 y RNP-4, regulan la determinación del sexo somático y de la línea germinal. Además, varias RBP como GLD-1, GLD-3, DAZ-1, PGL-1 y OMA-1 / -2 ejercen sus funciones reguladoras durante la progresión de la profase meiótica , la gametogénesis y la maduración de los ovocitos .

Desarrollo somático

Además de las funciones de las RBP en el desarrollo de la línea germinal, el control postranscripcional también juega un papel importante en el desarrollo somático. A diferencia de las RBP que están involucradas en la línea germinal y el desarrollo embrionario temprano, las RBP que funcionan en el desarrollo somático regulan el corte y empalme alternativo específico del tejido de los objetivos de ARNm. Por ejemplo, MEC-8 y UNC-75 que contienen dominios RRM se localizan en regiones de hipodermis y sistema nervioso, respectivamente. Además, se revela que otro RBP que contiene RRM, EXC-7, se localiza en las células del canal excretor embrionario y en todo el sistema nervioso durante el desarrollo somático.

Desarrollo neuronal

ZBP1 fue mostrado para regular dendritogénesis ( dendrita formación) en las neuronas del hipocampo. Otras proteínas de unión a ARN involucradas en la formación de dendritas son Pumilio y Nanos, FMRP , CPEB y Staufen 1.

Papel en el cáncer

Las RBP están surgiendo para desempeñar un papel crucial en el desarrollo de tumores. Cientos de RBP están marcadamente desreguladas en cánceres humanos y mostraron una regulación descendente predominante en tumores relacionados con tejidos normales. Muchas RBP se expresan de forma diferencial en diferentes tipos de cáncer, por ejemplo, KHDRBS1 (Sam68), ELAVL1 (HuR), FXR1 y UHMK1 . Para algunas RBP, el cambio en la expresión está relacionado con variaciones en el número de copias (CNV), por ejemplo, ganancias de CNV de BYSL en células de cáncer colorrectal y ESRP1, CELF3 en cáncer de mama, RBM24 en cáncer de hígado, IGF2BP2, IGF2BP3 en cáncer de pulmón o pérdidas de CNV de KHDRBS2 en cáncer de pulmón. Algunos cambios de expresión se deben a mutaciones que afectan a proteínas en estos RBP, por ejemplo, NSUN6, ZC3H13, ELAC1, RBMS3 y ZGPAT, SF3B1, SRSF2, RBM10, U2AF1, SF3B1, PPRC1, RBMXL1, HNRNPCL1, etc. expresión de RBP a empalmes alternativos aberrantes en el cáncer.

La investigación actual

CIRBP.
" CIRBP ": Estructura de la proteína CIRBP.

Dado que las proteínas de unión al ARN ejercen un control significativo sobre numerosas funciones celulares, han sido un área de investigación popular para muchos investigadores. Debido a su importancia en el campo biológico, recientemente se han desvelado numerosos descubrimientos sobre el potencial de las proteínas de unión a ARN. El desarrollo reciente en la identificación experimental de proteínas de unión a ARN ha ampliado significativamente el número de proteínas de unión a ARN.

La proteína de unión al ARN Sam68 controla la compartimentación espacial y temporal del metabolismo del ARN para lograr la función sináptica adecuada en las dendritas . La pérdida de Sam68 da como resultado una regulación postranscripcional anormal y, en última instancia, conduce a trastornos neurológicos como el síndrome de ataxia / temblor asociado al cromosoma X frágil . Se encontró que Sam68 interactúa con el ARNm que codifica la β-actina , que regula la formación sináptica de las espinas dendríticas con sus componentes citoesqueléticos . Por lo tanto, Sam68 desempeña un papel fundamental en la regulación del número de sinapsis mediante el control del metabolismo del ARNm de la β-actina postsináptica.

Beta-actina.
" Beta-actina ": Estructura de la proteína ACTB.

La proteína de unión a ARN de la familia CELF específica de neuronas UNC-75 se une específicamente al tramo de ARNm de UUGUUGUGUUGU a través de sus tres motivos de reconocimiento de ARN para la selección del exón 7a en las células neuronales de C. elegans . Como se omite el exón 7a debido a sus débiles sitios de empalme en células no neuronales, se encontró que UNC-75 activaba específicamente el empalme entre el exón 7a y el exón 8 solo en las células neuronales.

La proteína de unión de ARN inducible por frío CIRBP desempeña un papel en el control de la respuesta celular al enfrentar una variedad de tensiones celulares, incluida la luz ultravioleta de longitud de onda corta , la hipoxia y la hipotermia . Esta investigación arrojó implicaciones potenciales para la asociación de estados patológicos con inflamación.

Se encontró que la familia de serina-arginina de la proteína de unión a ARN Slr1 ejerce control sobre el crecimiento polarizado en Candida albicans . Las mutaciones de Slr1 en ratones dan como resultado una disminución de la filamentación y reducen el daño a las células epiteliales y endoteliales que conduce a una tasa de supervivencia extendida en comparación con las cepas de Slr1 de tipo salvaje. Por lo tanto, esta investigación revela que la proteína similar a SR Slr1 juega un papel en la instigación de la formación de hifas y la virulencia en C. albicans .

Ver también

enlaces externos

  • Plataforma starBase : una plataforma para decodificar sitios de unión de proteínas de unión de ARN ( RBP) a partir de conjuntos de datos CLIP-Seq (HITS-CLIP, PAR-CLIP, iCLIP, CLASH) a gran escala .
  • Base de datos RBPDB : una base de datos de proteínas de unión a ARN.
  • oARN : una base de datos de supuestos casos de sitios de unión de RBP en ARN codificante y no codificante en varias especies.
  • Base de datos ATtRACt : una base de datos de proteínas de unión a ARN y motivos asociados.
  • SplicedAid-F : una base de datos de proteínas de unión de ARN humano curadas a mano.
  • RsiteDB : base de datos de sitios de unión de ARN
  • SPOT-Seq-RNA : predicción basada en plantillas de proteínas de unión de ARN y sus estructuras complejas.
  • SPOT-Struct-RNA : predicción de proteínas de unión a ARN a partir de estructuras 3D.
  • Proyecto ENCODE : una colección de conjuntos de datos genómicos (es decir, RNA Bind-n-seq, eCLIP, RBP dirigido a shRNA RNA-seq) para RBP
  • Base de datos de imágenes de RBP : imágenes que muestran la localización celular de las RBP en las células

Referencias