Componente complementario 4 - Complement component 4

componente del complemento 4A (grupo sanguíneo de Rodgers)
Identificadores
Símbolo C4A
Gen NCBI 720
HGNC 1323
OMIM 120810
RefSeq NM_007293
UniProt P0C0L4
Otros datos
Lugar Chr. 6 p21.3
componente del complemento 4B
(grupo sanguíneo Chido)
Identificadores
Símbolo C4B
Gen NCBI 721
HGNC 1324
OMIM 120820
RefSeq NM_000592
UniProt P0C0L5
Otros datos
Lugar Chr. 6 p21.3

El componente 4 del complemento ( C4 ), en humanos, es una proteína involucrada en el intrincado sistema del complemento , que se origina en el sistema de antígeno leucocitario humano (HLA). Cumple una serie de funciones críticas en inmunidad, tolerancia y autoinmunidad con los otros numerosos componentes. Además, es un factor crucial en la conexión de las vías de reconocimiento del sistema general instigado por los complejos anticuerpo-antígeno (Ab-Ag) con las otras proteínas efectoras de la respuesta inmune innata. Por ejemplo, la gravedad de un sistema de complemento disfuncional puede provocar enfermedades e infecciones fatales. Las variaciones complejas de la misma también pueden conducir a la esquizofrenia . Sin embargo, las proteínas se deriva C4 de un simple de dos locus modelo alélica, el C4A - C4B genes, que permite una variación abundante en los niveles de sus proteínas respectivas dentro de una población. Originalmente definido en el contexto del sistema de grupos sanguíneos de Chido / Rodgers, el modelo genético C4A-C4B está bajo investigación por su posible papel en el riesgo y el desarrollo de la esquizofrenia .

Historia

Uno de los estudios genéticos anteriores sobre la proteína C4 identificó dos grupos diferentes, que se encuentran dentro de un suero humano, llamados grupos sanguíneos Chido / Rogers (Ch / Rg). O'Neill y col. han demostrado que dos loci C4 diferentes expresan los diferentes antígenos Ch / Rg en las membranas de los eritrocitos. Más específicamente, las dos proteínas, Ch y Rg, funcionan juntas como un medio para la interacción entre el complejo Ab-Ag y otros componentes del complemento. Además, los dos loci están ligados al HLA, o el análogo humano del complejo principal de histocompatibilidad (MHC) en el brazo corto del cromosoma 6, mientras que anteriormente se creía que se expresaban mediante dos alelos codominantes en un solo locus. En estudios de electroforesis en gel, O'Neill et al. han identificado dos variantes genéticas: F, que significa la presencia (F +) o ausencia (f0 / f0) de cuatro bandas de movimiento rápido, y S, que significa la presencia (S +) o ausencia (s0 / s0) de cuatro bandas de movimiento lento. La homogeneidad o heterogeneidad de los dos loci, con la adición de estos genes nulos (f0, s0), permiten la duplicación / no duplicación de los loci C4. Por lo tanto, tener loci separados para C4, C4F y C4S (posteriormente identificados como C4A o C4B, respectivamente), posiblemente explica la producción de múltiples formas alélicas, lo que lleva a una gran variación en el tamaño y el número de copias .

Dos contribuyentes importantes, Carroll y Porter, en su estudio de la clonación del gen C4 humano mostraron que sus seis clones contenían el mismo gen C4. La proteína C4 consta de 3 subunidades (α, β y γ) que tienen pesos moleculares (PM) de ~ 95 000, 78 000 y 31 000, respectivamente, y todas están unidas por puentes disulfuro intercatenarios. En un estudio de Roos et al., Se encontró que las cadenas α entre C4A y C4B eran ligeramente diferentes (PM de ~ 96.000 y 94.000, respectivamente), lo que demuestra que en realidad existe una diferencia estructural entre las dos variantes. Además, implicaron que la falta de actividad de C4 podría atribuirse a las diferencias estructurales entre las cadenas α. Sin embargo, Carroll y Porter demostraron que existe una región de 1.500 pb que actúa como intrón en la secuencia genómica, que creían que era la región C4d conocida, un subproducto de la actividad C4. Carroll y col. Posteriormente se publicó un trabajo que caracterizaba la estructura y organización de los genes C4, que están situados en la región HLA clase III y vinculados con C2 y factor B en el cromosoma. A través de experimentos que involucran mapeo de restricción, análisis de secuencia de nucleótidos e hibridación con C4A y C4B, encontraron que los genes son en realidad bastante similares, aunque tienen sus diferencias. Por ejemplo, se detectaron polimorfismos de un solo nucleótido, lo que permitió que fueran diferencias de clase entre C4A y C4B. Además, las diferencias de clase y alélicas afectarían el desempeño de las proteínas C4 con el complejo inmune. Finalmente, mediante la superposición de fragmentos clonados de ADNc, pudieron determinar que los loci C4, de una longitud estimada de 16 kilobase (kb), están espaciados por 10 kb y alineados a 30 kb del locus del factor B.

En el mismo año, los estudios identificaron de manera relacionada una región de 98 kb del cromosoma; los cuatro genes de clase III (que expresan C4A, C4B, C2 y factor B) están estrechamente vinculados, lo que no permite que se produzcan cruces. Usando variantes de proteínas visualizadas por electroforesis, los cuatro genes estructurales se ubicaron entre HLA-B y HLA-D. Más específicamente, verificaron el mapa molecular propuesto en el que el orden de los genes pasaba del factor B , C4B, C4A y C2 con C2 más cercano a HLA-B. En otro estudio, Law et al. luego continuó profundizando, esta vez comparando las propiedades tanto del C4A como del C4B, los cuales son actores importantes en el sistema de inmunidad humana. Mediante métodos que incluyen incubación, diferentes niveles de pH y tratamiento con metilamina, habían ilustrado bioquímicamente las diferentes reactividades de los genes C4. Más específicamente, el C4B ha demostrado reaccionar de manera mucho más eficiente y efectiva a pesar de la diferencia de 7 kb entre C4A y C4B. En todo el suero, los alelos C4B se comportaron a una velocidad varias veces mayor durante la actividad hemolítica, en comparación directa con los alelos C4A. Bioquímicamente, también encontraron que C4A reaccionaba de manera más constante con las cadenas laterales de aminoácidos de un anticuerpo y los antígenos que son grupos amino, mientras que C4B reaccionaba mejor con los grupos hidroxilo de carbohidratos. Por tanto, tras el análisis de las diferentes reactividades, propusieron que el polimorfismo excepcional de los genes C4 puede producir algunas ventajas biológicas (es decir, la activación del complemento con una gama más amplia de complejos Ab-Ag formados tras las infecciones). Aunque en este momento, la secuencia de aminoácidos genómica y derivada de C4A o C4B aún no se había determinado.

Estructura

Los primeros estudios ampliaron enormemente el conocimiento del complejo C4, sentando las bases que allanaron el camino para descubrir las estructuras de genes y proteínas. C. Yu determinó con éxito la secuencia completa del gen C4A del componente del complemento humano. En los hallazgos, se encontró que todo el genoma tenía 41 exones, con un total de 1744 residuos (a pesar de evitar la secuencia de un gran Intron 9). La proteína C4 se sintetiza en un precursor monocatenario, que luego sufre una escisión proteolítica en tres cadenas (en orden de cómo están encadenadas, β-α-γ).

La cadena β consta de 656 residuos, codificados por los exones 1-16. El aspecto más destacado de la cadena β es la presencia de un intrón grande, que varía de seis a siete kilobases de tamaño. Está presente en el primer locus (que codifica C4A) para todos los genes C4 y en el segundo locus (que codifica C4B) sólo en unos pocos genes C4. La cadena α consta de los residuos 661-1428, que codifican los exones 16-33. Dentro de esta cadena, dos sitios de escisión marcados por los exones 23 y 30 producen el fragmento C4d (donde se encuentran el tioéster, los antígenos Ch / Rg y los residuos isotípicos); además, la mayoría de los sitios polimórficos se agrupan en esta región. La cadena γ consta de 291 residuos, que codifican los exones 33-41. Desafortunadamente, no se ha atribuido ninguna función específica a la cadena γ.

El estudio realizado por Vaishnaw et al. buscó identificar la región clave y los factores relacionados con los esfuerzos de expresión génica del gen C4. Su investigación concluyó con el hecho de que el sitio de unión de Sp1 (ubicado entre -59 y -49) juega un papel importante en el inicio preciso de la transcripción basal de C4. La utilización de ensayos de cambio de electromovilidad y análisis de huella de ADNasa I demostró correlaciones específicas de ADN-proteína del promotor C4 en el factor nuclear 1, dos cajas E (-98 a -93 y -78 a -73) y dominios de unión Sp1. Estos hallazgos se agregaron más tarde en otro estudio extenso, que encontró un tercer sitio de caja E. Además, los mismos hallazgos postularon que dos entidades físicas dentro de la secuencia del gen podrían tener un papel en los niveles de expresión de C4A y C4B humanos, que incluyen la presencia del retrovirus endógeno que puede tener influencias reguladoras positivas o negativas que afectan la transcripción de C4 y el entorno genético variable (dependiendo de qué componente modular genético esté presente) posición pasada -1524.

Para proporcionar más contexto, en el último estudio, la estructura bimodular mencionada anteriormente (C4A-C4B) se ha actualizado a una estructura cuadrimodular de uno a cuatro segmentos discretos, que contiene uno o más módulos RP-C4-CYP21-TNX (RCCX). El tamaño del gen C4A o C4B puede ser de 21 kb (largo, L) o 14,6 kb (corto, S). Además, el gen C4 largo contiene únicamente un retrovirus HERV-K (C4) en su intrón 9 que impone la transcripción de 6,36 kb adicionales, de ahí la cadena de genes "más larga". Por tanto, los genes C4 tienen un patrón complejo de variación en el tamaño del gen, el número de copias y los polimorfismos. Ejemplos de estas estructuras mono, bi, tri y cuadrimodulares incluyen: L o S (monomodular con un gen C4 largo o corto), LL o LS o SS (bimodular con una combinación de L o S homocigotos o heterocigotos genes), LLL o LLS o LSS (RCCX trimodular con tres genes L o S C4), LLLL (estructura cuadrimodular con cuatro genes L o S C4). No todos los grupos estructurales tienen el mismo porcentaje de apariencia, posiblemente incluso más diferencias dentro de grupos étnicos separados. Por ejemplo, la población caucásica estudiada mostró un 69% de configuración bimodular (C4A-C4B, C4A-C4A o C4B-C4B) y un 31% de configuración trimodular (dividida igualmente entre LLL como C4A-C4A-C4B o LSS como C4A-C4B-C4B ). Con respecto al polimorfismo de la secuencia de la proteína C4, se encontraron un total de 24 residuos polimórficos. Entre ellos, la cadena β expresada en cinco, ya que la cadena α y la cadena γ produjeron 18 y uno, respectivamente. Estos polimorfismos se pueden clasificar adicionalmente en grupos: 1) cuatro residuos isotípicos en posiciones específicas, 2) determinantes antigénicos Ch / Rg en posiciones específicas, 3) sitios de unión C5, 4) residuos alélicos privados.

Además, el mismo estudio identificó la expresión de transcripciones de C4 del complemento humano en múltiples tejidos. Los resultados de un análisis de transferencia Northern, utilizando una sonda C4d y una sonda RD como control positivo, mostraron que el hígado contiene la mayoría de las transcripciones en todo el cuerpo. Aun así, se expresaron cantidades moderadas en cortezas suprarrenales / médula, tiroides y riñón.

Función y mecanismo

Dos vías de la cascada del complemento. Componentes y enzimas de las vías clásicas y alternativas de la cascada del complemento, que proporciona un medio complementario para que los humanos y otros sistemas se defiendan de patógenos extraños (ver texto). No se muestran elementos de la vía de la lectina . Tenga en cuenta que, si bien las letras adjuntas en esta figura son minúsculas, son sinónimos de las mismas designaciones que aparecen en mayúsculas en el texto.

Como se señaló, C4 (mezcla de C4A y C4B) participa en las tres vías del complemento (clásica, alternativa y lectina); la ruta alternativa se "activa espontáneamente", mientras que las rutas clásica y de lectina se desencadenan en respuesta al reconocimiento de microbios particulares. Las tres vías convergen en un paso en el que la proteína del complemento C3 se escinde en las proteínas C3a y C3b, lo que da como resultado una vía lítica y la formación de un ensamblaje macromolecular de múltiples proteínas, denominado complejo de ataque a la membrana (MAC), que sirve como un poro en la membrana del patógeno objetivo, lo que lleva a la alteración de la célula invasora y, finalmente, a la lisis.

En la vía clásica, el componente del complemento, en lo sucesivo abreviado por la "C" que precede al número de proteína, denominado C1s, una serina proteasa , se activa mediante pasos ascendentes de la vía, lo que da como resultado su escisión del original nativo ~ 200 kilodalton ( kDa) Proteína C4: compuesta de tres cadenas. El C4 es escindido por la proteasa en dos partes, un péptido C4a (pequeño a ~ 9 kDa y anafilotóxico ) y la proteína C4b de mayor peso molecular, a aproximadamente 190 kDa. La escisión del C4 da como resultado que C4b tenga un grupo funcional tioéster [-SC (O) -]: el trabajo en la década de 1980 en C3, y luego en C4, indicó la presencia, dentro de las estructuras parentales C3 y C4, de una proteína única modificación, un anillo de tionolactona de 15 átomos (15 miembros) que sirve para conectar la cadena lateral tiol del aminoácido cisteína (Cys) en una secuencia -Cys-Gly-Glu-Glx- con un grupo acilo de cadena lateral de lo que comenzó como una cadena lateral de glutamina (Glx, aquí) que residía en tres residuos de aminoácidos corriente abajo (donde los átomos restantes de los 15 eran átomos de la cadena principal y de la cadena lateral); tras la escisión, esta estructura de anillo de tionolactona única queda expuesta en la superficie de la nueva proteína C4b. Debido a la proximidad a la superficie microbiana, una parte de las proteínas C4b liberadas, con esta tionolactona reactiva, reacciona con las cadenas laterales de aminoácidos nucleofílicos y otros grupos en la superficie celular del microbio extraño, lo que resulta en la unión covalente de la proteína C4b ligeramente modificada a la superficie celular, a través del residuo Glx original de C4.

C4b tiene más funciones. Interactúa con la proteína C2; la misma proteasa invocada anteriormente, C1s, luego escinde C2 en dos partes, denominadas C2a y C2b, liberando C2b y quedando C2a en asociación con C4b; el complejo C4b-C2a de las dos proteínas luego exhibe una actividad proteasa asociada al sistema adicional hacia la proteína C3 (escindiéndola), con la posterior liberación de ambas proteínas, C4b y C2a, de su complejo (después de lo cual C4b puede unirse a otra proteína C2, y realice estos pasos nuevamente). Debido a que C4b se regenera y se crea un ciclo, el complejo C4b-C2a con actividad proteasa se ha denominado convertasa C3. La proteína 4b se puede escindir adicionalmente en 4c y 4d.

Significación clínica

Modelo de genes estructurales comunes y su posible contribución al desarrollo de la esquizofrenia (como se define detalladamente en el artículo de Sekar et al.)

Aunque se han implicado otras enfermedades (es decir, lupus eritematoso sistémico ), el gen C4 también se está investigando por el papel que puede desempeñar en el riesgo y el desarrollo de la esquizofrenia. En el Wu et al. estudio, utilizaron la reacción en cadena de la polimerasa en tiempo real (rt-PCR) como un ensayo para determinar la varianza del número de copias (CNV) o la diversidad genética de C4. En consecuencia, con estos resultados, los pronósticos, brotes y remisiones futuros serán más factibles de determinar. Los resultados muestran básicamente variantes del número de copias como un mecanismo para afectar la diversidad genética. Como se discutió antes, los diferentes fenotipos permitidos por la variedad genética variable del complemento C4 incluyen una amplia gama de proteínas C4 plasmáticas o séricas entre dos isotipos, C4A y C4B, con múltiples alotipos de proteínas que pueden tener funciones fisiológicas únicas. Las CNV son fuentes de diversidad genética inherente y participan en la interacción gen-ambiente. Las CNV (y los polimorfismos asociados) juegan un papel en llenar el vacío hacia la comprensión de la base genética de los rasgos cuantitativos y las diferentes susceptibilidades a enfermedades autoinmunes y neurobiológicas.

Se han recopilado y analizado datos sustanciales de todo el mundo para determinar que la esquizofrenia, de hecho, tiene una fuerte relación genética con una región en el locus del MHC en el brazo 6 del cromosoma.

Los datos y la información recopilados a nivel internacional pueden arrojar luz sobre los misterios de la esquizofrenia . Sekar y col. analizaron polimorfismos de un solo nucleótido (SNP) de 40 cohortes en 22 países, sumando en total casi 29.000 casos. Descubrieron dos características: 1) un gran número de SNP que alcanzan solo 2 Mb en el extremo, 2) un pico de asociación centrado en C4, que predice que los niveles de expresión de C4A están más fuertemente correlacionados con la esquizofrenia. Además, han descubierto un mecanismo por el cual la esquizofrenia podría surgir de la predisposición genética del complemento humano C4. Como se muestra en la Figura 1, cuatro variaciones estructurales comunes descubiertas en los estudios de estudios de asociación de todo el genoma (GWAS) han apuntado a la alta participación de la esquizofrenia. Posiblemente, los niveles más altos de expresión de la proteína C4 debido al patrón de variantes del gen C4, permiten el aumento no deseado de la poda sináptica (un efecto producido por las proteínas efectoras del sistema del complemento en el que participa el C4).

Ver también

Referencias

Otras lecturas