Gene - Gene

La imagen de arriba contiene enlaces en los que se puede hacer clic
Un gen es una región del ADN que codifica la función. Un cromosoma consta de una cadena larga de ADN que contiene muchos genes. Un cromosoma humano puede tener hasta 500 millones de pares de bases de ADN con miles de genes.

En biología , un gen (de genos ( griego ) que significa generación o nacimiento o género ) es una unidad básica de herencia y una secuencia de nucleótidos en el ADN que codifica la síntesis de un producto génico , ya sea ARN o proteína .

Durante la expresión génica , el ADN se copia primero en ARN . El ARN puede ser directamente funcional o ser la plantilla intermedia de una proteína que realiza una función. La transmisión de genes a la descendencia de un organismo es la base de la herencia de rasgos fenotípicos . Estos genes forman diferentes secuencias de ADN llamadas genotipos . Los genotipos junto con los factores ambientales y de desarrollo determinan cuáles serán los fenotipos. La mayoría de los rasgos biológicos están bajo la influencia de polygenes (muchos genes diferentes) así como de interacciones gen-ambiente . Algunos rasgos genéticos son visibles instantáneamente, como el color de ojos o la cantidad de miembros, y otros no, como el tipo de sangre , el riesgo de enfermedades específicas o los miles de procesos bioquímicos básicos que constituyen la vida .

Los genes pueden adquirir mutaciones en su secuencia, dando lugar a diferentes variantes, conocidas como alelos , en la población . Estos alelos codifican versiones ligeramente diferentes de una proteína, que causan diferentes rasgos fenotípicos . El uso del término "que tiene un gen" (por ejemplo, "buenos genes", "gen del color del cabello") se refiere típicamente a contener un alelo diferente del mismo gen compartido. Los genes evolucionan debido a la selección natural / supervivencia del más apto y la deriva genética de los alelos.

El concepto de gen sigue perfeccionándose a medida que se descubren nuevos fenómenos. Por ejemplo, las regiones reguladoras de un gen pueden estar muy alejadas de sus regiones codificantes y las regiones codificantes pueden dividirse en varios exones . Algunos virus almacenan su genoma en ARN en lugar de ADN y algunos productos génicos son ARN funcionales no codificantes . Por lo tanto, una definición de trabajo amplia y moderna de un gen es cualquier locus discreto de secuencia genómica hereditaria que afecta los rasgos de un organismo al expresarse como un producto funcional o mediante la regulación de la expresión génica .

El término gen fue introducido por el botánico , fisiólogo vegetal y genetista danés Wilhelm Johannsen en 1909. Está inspirado en el griego antiguo : γόνος, gonos , que significa descendencia y procreación.

Historia

Fotografía de Gregor Mendel
Gregor Mendel

Descubrimiento de unidades heredadas discretas

Gregor Mendel (1822-1884) sugirió por primera vez la existencia de unidades heredables discretas . De 1857 a 1864, en Brno , Imperio austríaco (actual República Checa), estudió los patrones de herencia en 8000 plantas de guisantes comestibles comunes , rastreando rasgos distintivos de padres a hijos. Los describió matemáticamente como 2 n  combinaciones donde n es el número de características diferentes en los guisantes originales. Aunque no utilizó el término gen , explicó sus resultados en términos de unidades heredadas discretas que dan lugar a características físicas observables. Esta descripción prefiguraba la distinción de Wilhelm Johannsen entre genotipo (el material genético de un organismo) y fenotipo (los rasgos observables de ese organismo). Mendel también fue el primero en demostrar el surtido independiente , la distinción entre rasgos dominantes y recesivos , la distinción entre heterocigoto y homocigoto y el fenómeno de la herencia discontinua.

Antes del trabajo de Mendel, la teoría dominante de la herencia fue una de la herencia de mezcla , lo que sugiere que cada padre contribuyó líquidos para el proceso de fertilización y que los rasgos de los padres mezclan y se mezclan para producir la descendencia. Charles Darwin desarrolló una teoría de la herencia que denominó pangénesis , del griego pan ("todo, todo") y génesis ("nacimiento") / genos ("origen"). Darwin usó el término gemmule para describir partículas hipotéticas que se mezclarían durante la reproducción.

El trabajo de Mendel pasó en gran parte desapercibido después de su primera publicación en 1866, pero fue redescubierto a fines del siglo XIX por Hugo de Vries , Carl Correns y Erich von Tschermak , quienes (afirmaron haberlo hecho) llegaron a conclusiones similares en su propia investigación. Específicamente, en 1889, Hugo de Vries publicó su libro Intracellular Pangenesis , en el que postuló que diferentes caracteres tienen portadores hereditarios individuales y que la herencia de rasgos específicos en los organismos viene en partículas. De Vries llamó a estas unidades " pangenes " ( Pangens en alemán), después de la teoría de la pangénesis de Darwin de 1868.

Veinte años después, en 1909, Wilhelm Johannsen introdujo el término 'gen' y en 1906, William Bateson , el de ' genética ', mientras que Eduard Strasburger , entre otros, todavía usaba el término 'pangene' para la unidad física y funcional fundamental de la herencia. .

Descubrimiento de ADN

Los avances en la comprensión de los genes y la herencia continuaron a lo largo del siglo XX. Se demostró que el ácido desoxirribonucleico (ADN) era el depósito molecular de información genética mediante experimentos en las décadas de 1940 a 1950. La estructura del ADN fue estudiada por Rosalind Franklin y Maurice Wilkins utilizando cristalografía de rayos X , lo que llevó a James D. Watson y Francis Crick a publicar un modelo de la molécula de ADN bicatenario cuyas bases de nucleótidos emparejadas indicaban una hipótesis convincente para el mecanismo de replicación genética.

A principios de la década de 1950, la opinión predominante era que los genes de un cromosoma actuaban como entidades discretas, indivisibles por recombinación y dispuestas como cuentas en un hilo. Los experimentos de Benzer con mutantes defectuosos en la región rII del bacteriófago T4 (1955-1959) mostraron que los genes individuales tienen una estructura lineal simple y es probable que sean equivalentes a una sección lineal de ADN.

En conjunto, este cuerpo de investigación estableció el dogma central de la biología molecular , que establece que las proteínas se traducen a partir del ARN , que se transcribe a partir del ADN . Desde entonces, se ha demostrado que este dogma tiene excepciones, como la transcripción inversa en retrovirus . El estudio moderno de la genética a nivel del ADN se conoce como genética molecular .

En 1972, Walter Fiers y su equipo fueron los primeros en determinar la secuencia de un gen: la de la proteína de la cubierta del bacteriófago MS2 . El posterior desarrollo de la secuenciación de ADN de terminación de cadena en 1977 por Frederick Sanger mejoró la eficiencia de la secuenciación y la convirtió en una herramienta de laboratorio de rutina. Se utilizó una versión automatizada del método Sanger en las primeras fases del Proyecto Genoma Humano .

Síntesis moderna y sus sucesores

Las teorías desarrolladas a principios del siglo XX para integrar la genética mendeliana con la evolución darwiniana se denominan síntesis moderna , un término introducido por Julian Huxley .

Los biólogos evolucionistas han modificado posteriormente este concepto, como la visión de la evolución centrada en los genes de George C. Williams . Propuso un concepto evolutivo del gen como una unidad de selección natural con la definición: "aquello que segrega y recombina con una frecuencia apreciable". Desde este punto de vista, el gen molecular se transcribe como una unidad y el gen evolutivo hereda como una unidad. Richard Dawkins popularizó ideas relacionadas que enfatizaban la centralidad de los genes en la evolución .

Base molecular

Diagrama de la estructura química del ADN que muestra cómo la doble hélice consta de dos cadenas de esqueleto de azúcar-fosfato con bases apuntando hacia adentro y específicamente emparejamiento de bases A a T y C a G con enlaces de hidrógeno.
La estructura química de un fragmento de cuatro pares de bases de una doble hélice de ADN . Las cadenas de la columna vertebral de azúcar - fosfato corren en direcciones opuestas con las bases apuntando hacia adentro, emparejando A con T y C con G con enlaces de hidrógeno .

ADN

La gran mayoría de los organismos codifican sus genes en largas cadenas de ADN (ácido desoxirribonucleico). El ADN consta de una cadena formada por cuatro tipos de subunidades de nucleótidos , cada una compuesta por: un azúcar de cinco carbonos ( 2-desoxirribosa ), un grupo fosfato y una de las cuatro bases , adenina , citosina , guanina y timina .

Dos cadenas de ADN se retuercen entre sí para formar una doble hélice de ADN con la columna vertebral de fosfato-azúcar en espiral alrededor del exterior, y las bases apuntando hacia adentro con la base de adenina emparejándose con timina y guanina con citosina. La especificidad del emparejamiento de bases se produce porque la adenina y la timina se alinean para formar dos enlaces de hidrógeno , mientras que la citosina y la guanina forman tres enlaces de hidrógeno. Las dos hebras en una doble hélice deben, por tanto, ser complementarias , con su secuencia de bases coincidente de modo que las adeninas de una hebra estén emparejadas con las timinas de la otra hebra, y así sucesivamente.

Debido a la composición química de los residuos de pentosa de las bases, las hebras de ADN tienen direccionalidad. Un extremo de un polímero de ADN contiene un grupo hidroxilo expuesto en la desoxirribosa ; esto se conoce como el extremo 3 ' de la molécula. El otro extremo contiene un grupo fosfato expuesto ; este es el final de 5 ' . Las dos hebras de una doble hélice corren en direcciones opuestas. La síntesis de ácidos nucleicos, incluida la replicación y transcripción del ADN, se produce en la dirección 5 '→ 3', porque se agregan nuevos nucleótidos mediante una reacción de deshidratación que utiliza el hidroxilo 3 'expuesto como nucleófilo .

La expresión de genes codificados en el ADN comienza transcribiendo el gen en ARN , un segundo tipo de ácido nucleico que es muy similar al ADN, pero cuyos monómeros contienen el azúcar ribosa en lugar de desoxirribosa . El ARN también contiene la base uracilo en lugar de timina . Las moléculas de ARN son menos estables que el ADN y normalmente son monocatenarias. Los genes que codifican proteínas están compuestos por una serie de secuencias de tres nucleótidos llamadas codones , que sirven como "palabras" en el "lenguaje" genético. El código genético especifica la correspondencia durante la traducción de proteínas entre codones y aminoácidos . El código genético es casi el mismo para todos los organismos conocidos.

Cromosomas

Una imagen de microscopía de 46 cromosomas rayados con bandas rojas y verdes
Imagen de microscopía fluorescente de un cariotipo femenino humano , que muestra 23 pares de cromosomas. El ADN está teñido de rojo y las regiones ricas en genes de mantenimiento se tiñen de verde. Los cromosomas más grandes tienen alrededor de 10 veces el tamaño de los más pequeños.

El complemento total de genes en un organismo o célula se conoce como su genoma , que puede almacenarse en uno o más cromosomas . Un cromosoma consta de una única hélice de ADN muy larga en la que se codifican miles de genes. La región del cromosoma en la que se encuentra un gen en particular se denomina locus . Cada locus contiene un alelo de un gen; sin embargo, los miembros de una población pueden tener diferentes alelos en el locus, cada uno con una secuencia genética ligeramente diferente.

La mayoría de los genes eucariotas se almacenan en un conjunto de cromosomas lineales grandes. Los cromosomas están empaquetados dentro del núcleo en un complejo con proteínas de almacenamiento llamadas histonas para formar una unidad llamada nucleosoma . El ADN empaquetado y condensado de esta manera se llama cromatina . La forma en que el ADN se almacena en las histonas, así como las modificaciones químicas de la propia histona, regulan si una región particular del ADN es accesible para la expresión génica . Además de los genes, los cromosomas eucariotas contienen secuencias implicadas en garantizar que el ADN se copie sin degradación de las regiones terminales y se clasifique en células hijas durante la división celular: orígenes de replicación , telómeros y centrómero . Los orígenes de la replicación son las regiones de secuencia donde se inicia la replicación del ADN para hacer dos copias del cromosoma. Los telómeros son largos tramos de secuencias repetitivas que cubren los extremos de los cromosomas lineales y previenen la degradación de las regiones codificadoras y reguladoras durante la replicación del ADN . La longitud de los telómeros disminuye cada vez que se replica el genoma y se ha visto implicado en el proceso de envejecimiento . El centrómero es necesario para unir las fibras del huso para separar las cromátidas hermanas en células hijas durante la división celular .

Los procariotas ( bacterias y arqueas ) suelen almacenar sus genomas en un único cromosoma circular grande . De manera similar, algunos orgánulos eucariotas contienen un cromosoma circular remanente con una pequeña cantidad de genes. Los procariotas a veces complementan su cromosoma con pequeños círculos adicionales de ADN llamados plásmidos , que generalmente codifican solo unos pocos genes y son transferibles entre individuos. Por ejemplo, los genes de resistencia a los antibióticos se codifican normalmente en plásmidos bacterianos y pueden transmitirse entre células individuales, incluso de diferentes especies, mediante transferencia horizontal de genes .

Mientras que los cromosomas de los procariotas son relativamente densos en genes, los de los eucariotas a menudo contienen regiones de ADN que no tienen ninguna función obvia. Los eucariotas unicelulares simples tienen cantidades relativamente pequeñas de dicho ADN, mientras que los genomas de organismos multicelulares complejos , incluidos los humanos, contienen una mayoría absoluta de ADN sin una función identificada. Este ADN se ha denominado a menudo " ADN basura ". Sin embargo, análisis más recientes sugieren que, aunque el ADN que codifica proteínas constituye apenas el 2% del genoma humano , alrededor del 80% de las bases del genoma pueden expresarse, por lo que el término "ADN basura" puede ser un nombre inapropiado.

Estructura y función

Estructura

La imagen de arriba contiene enlaces en los que se puede hacer clic
La estructura de un gen codificante de proteínas eucariotas . La secuencia reguladora controla cuándo y dónde se produce la expresión de la región codificante de la proteína (rojo). Las regiones promotoras y potenciadoras (amarillas) regulan la transcripción del gen en un pre-ARNm que se modifica para eliminar los intrones (gris claro) y agregar una tapa 5 'y una cola poli-A (gris oscuro). Las regiones no traducidas 5 ' y 3' del ARNm (azul) regulan la traducción al producto proteico final.

La estructura de un gen consta de muchos elementos de los cuales la secuencia de codificación de la proteína real a menudo es solo una pequeña parte. Estos incluyen regiones de ADN que no se transcriben, así como regiones no traducidas del ARN.

Flanqueando el marco de lectura abierto, los genes contienen una secuencia reguladora necesaria para su expresión. Primero, los genes requieren una secuencia promotora . El promotor es reconocido y unido por factores de transcripción que reclutan y ayudan a la ARN polimerasa a unirse a la región para iniciar la transcripción. El reconocimiento ocurre típicamente como una secuencia de consenso como la caja TATA . Un gen puede tener más de un promotor, lo que da como resultado ARN mensajeros ( ARNm ) que difieren en la extensión en el extremo 5 '. Los genes altamente transcritos tienen secuencias promotoras "fuertes" que forman fuertes asociaciones con factores de transcripción, iniciando así la transcripción a un ritmo elevado. Otros genes tienen promotores "débiles" que forman asociaciones débiles con factores de transcripción e inician la transcripción con menos frecuencia. Las regiones promotoras eucariotas son mucho más complejas y difíciles de identificar que los promotores procariotas .

Además, los genes pueden tener regiones reguladoras de muchas kilobases corriente arriba o corriente abajo del marco de lectura abierto que alteran la expresión. Éstos actúan uniéndose a factores de transcripción que luego hacen que el ADN haga un bucle de modo que la secuencia reguladora (y el factor de transcripción unido) se acerquen al sitio de unión de la ARN polimerasa. Por ejemplo, los potenciadores aumentan la transcripción uniendo una proteína activadora que luego ayuda a reclutar la ARN polimerasa al promotor; a la inversa, los silenciadores se unen a proteínas represoras y hacen que el ADN esté menos disponible para la ARN polimerasa.

El transcrito pre-mRNA contiene regiones no traducidas en ambos extremos que contienen sitios de unión para los ribosomas , proteínas de unión a ARN , miARN , así como terminador , y comenzar y codones de parada . Además, la mayoría de los marcos de lectura abiertos eucariotas contienen intrones sin traducir , que se eliminan, y exones , que se conectan entre sí en un proceso conocido como empalme de ARN . Por último, los extremos de las transcripciones de genes se definen mediante sitios de escisión y poliadenilación (CPA) , donde se escinde el pre-ARNm recién producido y se agrega una cadena de ~ 200 monofosfatos de adenosina en el extremo 3 '. La cola de poli (A) protege el ARNm maduro de la degradación y tiene otras funciones que afectan la traducción, localización y transporte de la transcripción desde el núcleo. El empalme, seguido de CPA, genera el ARNm maduro final , que codifica la proteína o el producto de ARN. Aunque se conocen los mecanismos generales que definen las ubicaciones de los genes humanos, la identificación de los factores exactos que regulan estos procesos celulares es un área de investigación activa. Por ejemplo, las características de secuencia conocidas en 3'-UTR solo pueden explicar la mitad de todos los extremos de genes humanos.

Muchos genes procarióticos están organizados en operones , con múltiples secuencias codificantes de proteínas que se transcriben como una unidad. Los genes de un operón se transcriben como un ARN mensajero continuo , denominado ARNm policistrónico . El término cistrón en este contexto es equivalente a gen. La transcripción del ARNm de un operón a menudo está controlada por un represor que puede ocurrir en un estado activo o inactivo dependiendo de la presencia de metabolitos específicos. Cuando está activo, el represor se une a una secuencia de ADN al comienzo del operón, llamada región del operador , y reprime la transcripción del operón ; cuando el represor está inactivo, puede producirse la transcripción del operón (véase, por ejemplo, el operón Lac ). Los productos de los genes del operón típicamente tienen funciones relacionadas y están involucrados en la misma red reguladora .

Definiciones funcionales

Es difícil definir exactamente qué sección de una secuencia de ADN comprende un gen. Las regiones reguladoras de un gen, como los potenciadores , no tienen que estar necesariamente cerca de la secuencia codificante de la molécula lineal porque el ADN que interviene puede formar un bucle para acercar el gen y su región reguladora. De manera similar, los intrones de un gen pueden ser mucho más grandes que sus exones. Las regiones reguladoras pueden incluso estar en cromosomas completamente diferentes y operar en trans para permitir que las regiones reguladoras de un cromosoma entren en contacto con genes diana en otro cromosoma.

Los primeros trabajos en genética molecular sugirieron el concepto de que un gen produce una proteína . Este concepto (originalmente llamado la hipótesis de un gen y una enzima ) surgió de un influyente artículo de 1941 de George Beadle y Edward Tatum sobre experimentos con mutantes del hongo Neurospora crassa . Norman Horowitz , uno de los primeros colegas en la investigación de Neurospora , recordó en 2004 que “estos experimentos fundaron la ciencia de lo que Beadle y Tatum llamaron genética bioquímica . En realidad, demostraron ser el arma de apertura en lo que se convirtió en genética molecular y todos los desarrollos que se han seguido a partir de eso ". El concepto de un gen-una proteína se ha perfeccionado desde el descubrimiento de genes que pueden codificar múltiples proteínas mediante empalme alternativo y secuencias de codificación divididas en secciones cortas a lo largo del genoma cuyos ARNm se concatenan mediante empalme trans .

A veces se utiliza una amplia definición operativa para abarcar la complejidad de estos diversos fenómenos, donde un gen se define como una unión de secuencias genómicas que codifican un conjunto coherente de productos funcionales potencialmente superpuestos. Esta definición clasifica los genes por sus productos funcionales (proteínas o ARN) en lugar de sus loci de ADN específicos, con elementos reguladores clasificados como regiones asociadas a genes .

Superposición entre genes

También es posible que los genes se superpongan a la misma secuencia de ADN y se consideren genes distintos pero superpuestos . La definición actual de un gen superpuesto es diferente en eucariotas, procariotas y virus. En eucariotas se han definido recientemente como "cuando al menos un nucleótido se comparte entre los límites más externos de las transcripciones primarias de dos o más genes, de modo que una mutación de la base del ADN en el punto de superposición afectaría a las transcripciones de todos los genes involucrados en la superposición." En Procariotas y Virus se han definido recientemente como "cuando las secuencias codificantes de dos genes comparten un nucleótido en la misma cadena o en la opuesta".

La expresion genica

En todos los organismos, se requieren dos pasos para leer la información codificada en el ADN de un gen y producir la proteína que especifica. Primero, el ADN del gen se transcribe a ARN mensajero ( ARNm ). En segundo lugar, ese ARNm se traduce en proteína. Los genes que codifican el ARN aún deben pasar por el primer paso, pero no se traducen en proteínas. El proceso de producción de una molécula biológicamente funcional de ARN o proteína se denomina expresión génica y la molécula resultante se denomina producto génico .

Codigo genetico

Molécula de ARN que consta de nucleótidos.  Los grupos de tres nucleótidos se indican como codones, y cada uno corresponde a un aminoácido específico.
Esquema de una molécula de ARN monocatenario que ilustra una serie de codones de tres bases . Cada codón de tres nucleótidos corresponde a un aminoácido cuando se traduce en proteína.

La secuencia de nucleótidos del ADN de un gen especifica la secuencia de aminoácidos de una proteína a través del código genético . Conjuntos de tres nucleótidos, conocidos como codones , cada uno corresponde a un aminoácido específico. El principio de que tres bases secuenciales de ADN codifican para cada aminoácido se demostró en 1961 utilizando mutaciones de desplazamiento del marco de lectura en el gen rIIB del bacteriófago T4 (véase el experimento de Crick, Brenner et al. ).

Además, un " codón de inicio " y tres " codones de terminación " indican el comienzo y el final de la región codificante de la proteína . Hay 64 codones posibles (cuatro nucleótidos posibles en cada una de las tres posiciones, por lo tanto, 4 3  codones posibles) y solo 20 aminoácidos estándar; por tanto, el código es redundante y múltiples codones pueden especificar el mismo aminoácido. La correspondencia entre codones y aminoácidos es casi universal entre todos los organismos vivos conocidos.

Transcripción

La transcripción produce una molécula de ARN monocatenario conocida como ARN mensajero , cuya secuencia de nucleótidos es complementaria al ADN a partir del cual se transcribió. El ARNm actúa como intermediario entre el gen del ADN y su producto proteico final. El ADN del gen se utiliza como plantilla para generar un ARNm complementario . El ARNm coincide con la secuencia de la hebra codificante del ADN del gen porque se sintetiza como complemento de la hebra molde . La transcripción la realiza una enzima llamada ARN polimerasa , que lee la hebra molde en la dirección 3 ' a 5'  y sintetiza el ARN de 5 ' a 3' . Para iniciar la transcripción, la polimerasa primero reconoce y se une a una región promotora del gen. Por tanto, un mecanismo principal de regulación génica es el bloqueo o secuestro de la región promotora, ya sea mediante la unión estrecha de moléculas represoras que bloquean físicamente la polimerasa o bien organizando el ADN de modo que la región promotora no sea accesible.

En procariotas , la transcripción ocurre en el citoplasma ; para transcripciones muy largas, la traducción puede comenzar en el extremo 5 'del ARN mientras que el extremo 3' todavía se está transcribiendo. En eucariotas , la transcripción ocurre en el núcleo, donde se almacena el ADN de la célula. La molécula de ARN producida por la polimerasa se conoce como transcripción primaria y sufre modificaciones postranscripcionales antes de ser exportada al citoplasma para su traducción. Una de las modificaciones realizadas es el corte y empalme de intrones que son secuencias en la región transcrita que no codifican una proteína. Los mecanismos de corte y empalme alternativos pueden dar como resultado transcripciones maduras del mismo gen que tienen diferentes secuencias y, por lo tanto, codifican diferentes proteínas. Esta es una forma importante de regulación en las células eucariotas y también ocurre en algunos procariotas.

Traducción

Un gen que codifica una proteína en el ADN que se transcribe y traduce a una proteína funcional o un gen que no codifica una proteína que se transcribe a un ARN funcional
Los genes que codifican proteínas se transcriben a un ARNm intermedio y luego se traducen a una proteína funcional . Los genes que codifican el ARN se transcriben a un ARN funcional no codificante . ( PDB : 3BSE , 1OBB , 3TRA )

La traducción es el proceso mediante el cual se utiliza una molécula de ARNm maduro como plantilla para sintetizar una nueva proteína . La traducción es realizada por ribosomas , grandes complejos de ARN y proteína encargados de llevar a cabo las reacciones químicas para agregar nuevos aminoácidos a una cadena polipeptídica en crecimiento mediante la formación de enlaces peptídicos . El código genético se lee tres nucleótidos a la vez, en unidades llamadas codones , a través de interacciones con moléculas de ARN especializadas llamadas ARN de transferencia (ARNt). Cada ARNt tiene tres bases desaparecidas conocidas como anticodón que son complementarias al codón que lee en el ARNm. El tRNA también se une covalentemente al aminoácido especificado por el codón complementario. Cuando se une el tRNA a su codón complementaria en un ARNm hebra, el ribosoma concede su carga de aminoácidos a la nueva cadena de polipéptido, que se sintetiza a partir de amino terminal a carboxi terminal . Durante y después de la síntesis, la mayoría de las proteínas nuevas deben plegarse a su estructura tridimensional activa antes de que puedan llevar a cabo sus funciones celulares.

Regulación

Los genes están regulados para que se expresen solo cuando se necesita el producto, ya que la expresión se basa en recursos limitados. Una célula regula su expresión génica en función de su entorno externo (por ejemplo , nutrientes disponibles , temperatura y otras tensiones ), su entorno interno (por ejemplo , ciclo de división celular , metabolismo , estado de infección ) y su función específica en un organismo multicelular . La expresión génica puede regularse en cualquier paso: de iniciación de la transcripción , para el procesamiento del ARN , a modificación post-traduccional de la proteína. La regulación de los genes del metabolismo de la lactosa en E. coli ( operón lac ) fue el primer mecanismo de este tipo que se describió en 1961.

Genes de ARN

Un gen codificador de proteínas típico se copia primero en ARN como intermediario en la fabricación del producto proteico final. En otros casos, las moléculas de ARN son los productos funcionales reales, como en la síntesis de ARN ribosómico y ARN de transferencia . Algunos ARN conocidos como ribozimas tienen una función enzimática y el microARN tiene una función reguladora. Las secuencias de ADN a partir de las cuales se transcriben dichos ARN se conocen como genes de ARN no codificantes .

Algunos virus almacenan sus genomas completos en forma de ARN y no contienen ADN en absoluto. Debido a que utilizan ARN para almacenar genes, sus huéspedes celulares pueden sintetizar sus proteínas tan pronto como se infectan y sin demora en esperar la transcripción. Por otro lado, los retrovirus de ARN , como el VIH , requieren la transcripción inversa de su genoma de ARN a ADN antes de que sus proteínas puedan sintetizarse. La herencia epigenética mediada por ARN también se ha observado en plantas y muy raramente en animales.

Herencia

Ilustración de herencia autosómica recesiva.  Cada padre tiene un alelo azul y un alelo blanco.  Cada uno de sus 4 hijos hereda un alelo de cada padre, de modo que un hijo termina con dos alelos azules, un hijo tiene dos alelos blancos y dos hijos tienen uno de cada alelo.  Solo el niño con ambos alelos azules muestra el rasgo porque el rasgo es recesivo.
Herencia de un gen que tiene dos alelos diferentes (azul y blanco). El gen se encuentra en un cromosoma autosómico . El alelo blanco es recesivo al alelo azul. La probabilidad de cada resultado en la generación de los niños es una cuarta parte o el 25 por ciento.

Los organismos heredan sus genes de sus padres. Los organismos asexuales simplemente heredan una copia completa del genoma de sus padres. Los organismos sexuales tienen dos copias de cada cromosoma porque heredan un juego completo de cada padre.

Herencia mendeliana

Según la herencia mendeliana , las variaciones en el fenotipo de un organismo (características físicas y de comportamiento observables) se deben en parte a variaciones en su genotipo (conjunto particular de genes). Cada gen especifica un rasgo particular con una secuencia diferente de un gen ( alelos ) dando lugar a diferentes fenotipos. La mayoría de los organismos eucariotas (como las plantas de guisantes en las que trabajó Mendel) tienen dos alelos para cada rasgo, uno heredado de cada padre.

Los alelos en un locus pueden ser dominantes o recesivos ; los alelos dominantes dan lugar a sus fenotipos correspondientes cuando se emparejan con cualquier otro alelo para el mismo rasgo, mientras que los alelos recesivos dan lugar a su fenotipo correspondiente solo cuando se emparejan con otra copia del mismo alelo. Si conoce los genotipos de los organismos, puede determinar qué alelos son dominantes y cuáles son recesivos. Por ejemplo, si el alelo que especifica tallos altos en plantas de guisantes es dominante sobre el alelo que especifica tallos cortos, entonces las plantas de guisantes que heredan un alelo alto de un padre y un alelo corto del otro padre también tendrán tallos altos. El trabajo de Mendel demostró que los alelos se clasifican de forma independiente en la producción de gametos o células germinales , lo que garantiza la variación en la próxima generación. Aunque la herencia mendeliana sigue siendo un buen modelo para muchos rasgos determinados por genes únicos (incluidos varios trastornos genéticos bien conocidos ), no incluye los procesos físicos de replicación del ADN y división celular.

Replicación del ADN y división celular.

El crecimiento, desarrollo y reproducción de organismos se basa en la división celular ; el proceso por el cual una sola célula se divide en dos células hijas generalmente idénticas . Esto requiere primero hacer una copia duplicada de cada gen del genoma en un proceso llamado replicación del ADN . Las copias se hacen mediante enzimas especializadas conocidas como ADN polimerasas , que "leen" una hebra del ADN de doble hélice, conocida como hebra molde, y sintetizan una nueva hebra complementaria. Debido a que la doble hélice de ADN se mantiene unida por apareamiento de bases , la secuencia de una hebra especifica completamente la secuencia de su complemento; por lo tanto, la enzima solo debe leer una hebra para producir una copia fiel. El proceso de replicación del ADN es semiconservador ; es decir, la copia del genoma heredada por cada célula hija contiene una hebra de ADN original y una recién sintetizada.

La tasa de replicación del ADN en células vivas se midió primero como la tasa de elongación del ADN del fago T4 en E. coli infectada con fagos y se encontró que era impresionantemente rápida. Durante el período de aumento exponencial del ADN a 37 ° C, la tasa de alargamiento fue de 749 nucleótidos por segundo.

Una vez que se completa la replicación del ADN, la célula debe separar físicamente las dos copias del genoma y dividirse en dos células unidas a la membrana distintas. En los procariotas  ( bacterias y arqueas ) esto suele ocurrir a través de un proceso relativamente simple llamado fisión binaria , en el que cada genoma circular se adhiere a la membrana celular y se separa en las células hijas a medida que la membrana se invagina para dividir el citoplasma en dos porciones unidas a la membrana. . La fisión binaria es extremadamente rápida en comparación con las tasas de división celular en eucariotas . La división de células eucariotas es un proceso más complejo conocido como ciclo celular ; La replicación del ADN se produce durante una fase de este ciclo conocido como la fase S , mientras que el proceso de segregación de los cromosomas y la división del citoplasma se produce durante la fase M .

Herencia molecular

La duplicación y transmisión de material genético de una generación de células a la siguiente es la base de la herencia molecular y el vínculo entre las imágenes clásicas y moleculares de los genes. Los organismos heredan las características de sus padres porque las células de la descendencia contienen copias de los genes en las células de sus padres. En los organismos que se reproducen asexualmente , la descendencia será una copia genética o un clon del organismo parental. En los organismos que se reproducen sexualmente , una forma especializada de división celular llamada meiosis produce células llamadas gametos o células germinales que son haploides o contienen solo una copia de cada gen. Los gametos producidos por las hembras se denominan huevos u óvulos, y los producidos por los machos se denominan espermatozoides . Dos gametos se fusionan para formar un óvulo fertilizado diploide , una sola célula que tiene dos conjuntos de genes, con una copia de cada gen de la madre y otra del padre.

Durante el proceso de división celular meiótica, a veces puede ocurrir un evento llamado recombinación genética o cruce , en el que una longitud de ADN en una cromátida se intercambia con una longitud de ADN en la cromátida no hermana homóloga correspondiente. Esto puede resultar en un reordenamiento de alelos que de otro modo estarían vinculados. El principio mendeliano del surtido independiente afirma que cada uno de los dos genes de un padre para cada rasgo se clasificará independientemente en gametos; qué alelo hereda un organismo para un rasgo no está relacionado con qué alelo hereda para otro rasgo. De hecho, esto solo es cierto para los genes que no residen en el mismo cromosoma o que están ubicados muy lejos unos de otros en el mismo cromosoma. Cuanto más cerca estén dos genes del mismo cromosoma, más estrechamente estarán asociados en los gametos y más a menudo aparecerán juntos (lo que se conoce como ligamiento genético ). Esencialmente, los genes que están muy cerca nunca se separan porque es extremadamente improbable que ocurra un punto de cruce entre ellos.

Evolución molecular

Mutación

La replicación del ADN es en su mayor parte extremadamente precisa, sin embargo, ocurren errores ( mutaciones ). La tasa de error en las células eucariotas puede ser tan baja como 10 −8 por nucleótido por replicación, mientras que para algunos virus de ARN puede ser tan alta como 10 −3 . Esto significa que cada generación, cada genoma humano acumula 1-2 nuevas mutaciones. Las pequeñas mutaciones pueden ser causadas por la replicación del ADN y las secuelas del daño del ADN e incluyen mutaciones puntuales en las que se altera una sola base y mutaciones con desplazamiento del marco de lectura en las que se inserta o elimina una sola base. Cualquiera de estas mutaciones puede cambiar el gen sin sentido (cambiar un codón para codificar un aminoácido diferente) o sin sentido (un codón de parada prematuro ). Las mutaciones más grandes pueden ser causadas por errores en la recombinación para causar anomalías cromosómicas, incluida la duplicación , deleción, reordenamiento o inversión de grandes secciones de un cromosoma. Además, los mecanismos de reparación del ADN pueden introducir errores mutacionales al reparar el daño físico a la molécula. La reparación, incluso con mutación, es más importante para la supervivencia que restaurar una copia exacta, por ejemplo, al reparar roturas de doble hebra .

Cuando en la población de una especie están presentes varios alelos diferentes para un gen, se denomina polimórfico . La mayoría de los diferentes alelos son funcionalmente equivalentes, sin embargo, algunos alelos pueden dar lugar a diferentes rasgos fenotípicos . El alelo más común de un gen se llama tipo salvaje y los alelos raros se llaman mutantes . La variación genética en las frecuencias relativas de diferentes alelos en una población se debe tanto a la selección natural como a la deriva genética . El alelo de tipo salvaje no es necesariamente el antepasado de alelos menos comunes, ni es necesariamente más apto .

La mayoría de las mutaciones dentro de los genes son neutrales y no tienen ningún efecto sobre el fenotipo del organismo ( mutaciones silenciosas ). Algunas mutaciones no cambian la secuencia de aminoácidos porque varios codones codifican el mismo aminoácido ( mutaciones sinónimas ). Otras mutaciones pueden ser neutrales si conducen a cambios en la secuencia de aminoácidos, pero la proteína aún funciona de manera similar con el nuevo aminoácido (por ejemplo, mutaciones conservadoras ). Sin embargo, muchas mutaciones son perjudiciales o incluso letales y se eliminan de las poblaciones por selección natural. Los trastornos genéticos son el resultado de mutaciones deletéreas y pueden deberse a una mutación espontánea en el individuo afectado o pueden ser hereditarios. Finalmente, una pequeña fracción de las mutaciones son beneficiosas , mejoran la aptitud del organismo y son extremadamente importantes para la evolución, ya que su selección direccional conduce a la evolución adaptativa .

Homología de secuencia

Una secuencia de alineación, producida por ClustalO , de proteínas histonas de mamíferos

Los genes con un ancestro común más reciente y, por lo tanto, un ancestro evolutivo compartido, se conocen como homólogos . Estos genes aparecen por duplicación de genes dentro del genoma de un organismo, donde se conocen como genes parálogos, o son el resultado de la divergencia de los genes después de un evento de especiación , donde se conocen como genes ortólogos, y a menudo realizan las mismas funciones o funciones similares. en organismos relacionados. A menudo se asume que las funciones de los genes ortólogos son más similares que las de los genes parálogos, aunque la diferencia es mínima.

La relación entre genes se puede medir comparando la secuencia de alineación de su ADN. El grado de similitud de secuencia entre genes homólogos se denomina secuencia conservada . La mayoría de los cambios en la secuencia de un gen no afectan su función, por lo que los genes acumulan mutaciones a lo largo del tiempo por evolución molecular neutra . Además, cualquier selección de un gen hará que su secuencia diverja a un ritmo diferente. Los genes sometidos a selección estabilizadora están restringidos y, por tanto, cambian más lentamente, mientras que los genes sometidos a selección direccional cambian de secuencia más rápidamente. Las diferencias de secuencia entre genes se pueden utilizar para análisis filogenéticos para estudiar cómo han evolucionado esos genes y cómo se relacionan los organismos de los que provienen.

Orígenes de nuevos genes

Destino evolutivo de genes duplicados.

La fuente más común de nuevos genes en los linajes eucariotas es la duplicación de genes , que crea una variación en el número de copias de un gen existente en el genoma. Los genes resultantes (parálogos) pueden entonces divergir en secuencia y función. Los conjuntos de genes formados de esta manera componen una familia de genes . Las duplicaciones y pérdidas de genes dentro de una familia son comunes y representan una fuente importante de biodiversidad evolutiva . A veces, la duplicación de genes puede resultar en una copia no funcional de un gen, o una copia funcional puede estar sujeta a mutaciones que resultan en la pérdida de la función; estos genes no funcionales se denominan pseudogenes .

Los genes "huérfanos" , cuya secuencia no muestra ninguna similitud con los genes existentes, son menos comunes que los genes duplicados. El genoma humano contiene una estimación de 18 a 60 genes sin homólogos identificables fuera de los humanos. Los genes huérfanos surgen principalmente de la aparición de novo de una secuencia previamente no codificante o de la duplicación de genes seguida de un cambio de secuencia tan rápido que la relación original se vuelve indetectable. Los genes de novo son típicamente más cortos y de estructura más simple que la mayoría de los genes eucariotas, con pocos o ningún intrón. Durante largos períodos de tiempo evolutivo, el nacimiento de genes de novo puede ser responsable de una fracción significativa de familias de genes taxonómicamente restringidas.

La transferencia horizontal de genes se refiere a la transferencia de material genético a través de un mecanismo distinto de la reproducción . Este mecanismo es una fuente común de nuevos genes en procariotas , a veces se piensa que contribuye más a la variación genética que a la duplicación de genes. Es un medio común de propagar la resistencia a los antibióticos , la virulencia y las funciones metabólicas adaptativas . Aunque la transferencia horizontal de genes es rara en eucariotas, se han identificado ejemplos probables de genomas de protistas y algas que contienen genes de origen bacteriano.

Genoma

El genoma es el material genético total de un organismo e incluye tanto los genes como las secuencias no codificantes . Los genes eucariotas se pueden anotar usando FINDER.

Numero de genes

Representación de números de genes para plantas representativas (verde), vertebrados (azul), invertebrados (naranja), hongos (amarillo), bacterias (violeta) y virus (gris). Un recuadro a la derecha muestra los genomas más pequeños expandidos 100 veces en el área.

El tamaño del genoma y la cantidad de genes que codifica varían ampliamente entre organismos. Los genomas más pequeños se encuentran en virus y viroides (que actúan como un solo gen de ARN no codificante). Por el contrario, las plantas pueden tener genomas extremadamente grandes, y el arroz contiene más de 46.000 genes que codifican proteínas. Se estima que el número total de genes que codifican proteínas (el proteoma de la Tierra ) es de 5 millones de secuencias.

Aunque el número de pares de bases de ADN en el genoma humano se conoce desde la década de 1960, el número estimado de genes ha cambiado con el tiempo a medida que se han perfeccionado las definiciones de genes y los métodos para detectarlos. Las predicciones teóricas iniciales sobre el número de genes humanos llegaban a los 2.000.000. Las primeras medidas experimentales indicaron que había entre 50.000 y 100.000 genes transcritos ( etiquetas de secuencia expresadas ). Posteriormente, la secuenciación en el Proyecto del Genoma Humano indicó que muchas de estas transcripciones eran variantes alternativas de los mismos genes, y el número total de genes que codifican proteínas se redujo a ~ 20.000 con 13 genes codificados en el genoma mitocondrial . Con el proyecto de anotación GENCODE , esa estimación ha seguido cayendo a 19.000. Del genoma humano, sólo el 1-2% consta de secuencias codificantes de proteínas, y el resto es ADN "no codificante" , como intrones , retrotransposones y ARN no codificantes . Cada organismo multicelular tiene todos sus genes en cada célula de su cuerpo, pero no todos los genes funcionan en todas las células.

Genes esenciales

Funciones génicas en el genoma mínimo del organismo sintético , Syn 3 .

Los genes esenciales son el conjunto de genes que se cree que son críticos para la supervivencia de un organismo. Esta definición asume la abundante disponibilidad de todos los nutrientes relevantes y la ausencia de estrés ambiental. Solo una pequeña parte de los genes de un organismo son esenciales. En las bacterias, se estima que entre 250 y 400 genes son esenciales para Escherichia coli y Bacillus subtilis , que es menos del 10% de sus genes. La mitad de estos genes son ortólogos en ambos organismos y participan en gran medida en la síntesis de proteínas . En la levadura en ciernes Saccharomyces cerevisiae, el número de genes esenciales es ligeramente mayor, a 1000 genes (~ 20% de sus genes). Aunque el número es más difícil de medir en eucariotas superiores, se estima que los ratones y los seres humanos tienen alrededor de 2000 genes esenciales (~ 10% de sus genes). El organismo sintético, Syn 3 , tiene un genoma mínimo de 473 genes esenciales y genes cuasi-esenciales (necesarios para un crecimiento rápido), aunque 149 tienen una función desconocida.

Los genes esenciales incluyen genes de mantenimiento (críticos para las funciones celulares básicas), así como genes que se expresan en diferentes momentos del desarrollo o ciclo de vida de los organismos . Los genes de mantenimiento se utilizan como controles experimentales al analizar la expresión génica , ya que se expresan constitutivamente a un nivel relativamente constante.

Nomenclatura genética y genómica

La nomenclatura genética ha sido establecida por el Comité de Nomenclatura Genética de HUGO (HGNC), un comité de la Organización del Genoma Humano , para cada gen humano conocido en la forma de un nombre y símbolo de gen aprobado (abreviatura abreviada ), al que se puede acceder a través de una base de datos mantenida por HGNC. Los símbolos se eligen para que sean únicos y cada gen tiene un solo símbolo (aunque los símbolos aprobados a veces cambian). Los símbolos se mantienen preferiblemente consistentes con otros miembros de una familia de genes y con homólogos en otras especies, particularmente el ratón debido a su papel como organismo modelo común .

Ingeniería genética

Comparación del fitomejoramiento convencional con la modificación genética transgénica y cisgénica.

La ingeniería genética es la modificación del genoma de un organismo a través de la biotecnología . Desde la década de 1970, se han desarrollado una variedad de técnicas para agregar, eliminar y editar genes en un organismo de manera específica. Las técnicas de ingeniería del genoma desarrolladas recientemente utilizan enzimas nucleasas diseñadas para crear una reparación de ADN dirigida en un cromosoma para alterar o editar un gen cuando se repara la ruptura. El término relacionado biología sintética se usa a veces para referirse a la ingeniería genética extensa de un organismo.

La ingeniería genética es ahora una herramienta de investigación de rutina con organismos modelo . Por ejemplo, los genes se agregan fácilmente a las bacterias y se utilizan linajes de ratones knockout con una función de un gen específico alterada para investigar la función de ese gen. Muchos organismos han sido modificados genéticamente para aplicaciones en agricultura , biotecnología industrial y medicina .

En el caso de los organismos multicelulares, normalmente se modifica el embrión que se convierte en el organismo adulto modificado genéticamente . Sin embargo, los genomas de las células de un organismo adulto se pueden editar utilizando técnicas de terapia génica para tratar enfermedades genéticas.

Ver también

Referencias

Citas

Fuentes

Libro de texto principal

Otras lecturas

enlaces externos