Codigo genetico - Genetic code

El código genético es el conjunto de reglas que utilizan las células vivas para traducir la información codificada dentro del material genético ( secuencias de ADN o ARNm de tripletes de nucleótidos o codones ) en proteínas . La traducción se realiza mediante el ribosoma , que une los aminoácidos proteinogénicos en un orden especificado por el ARN mensajero (ARNm), utilizando moléculas de ARN de transferencia (ARNt) para transportar aminoácidos y leer el ARNm tres nucleótidos a la vez. El código genético es muy similar entre todos los organismos y se puede expresar en una tabla simple con 64 entradas.

Serie de codones que forman parte de una molécula de ARN mensajero (ARNm). Cada codón consta de tres nucleótidos , que generalmente corresponden a un solo aminoácido . Los nucleótidos se abrevian con las letras A, U, G y C. Este es ARNm, que usa U ( uracilo ). El ADN usa T ( timina ) en su lugar. Esta molécula de ARNm instruirá a un ribosoma para que sintetice una proteína de acuerdo con este código.

Los codones especifican qué aminoácido se agregará a continuación durante la síntesis de proteínas . Con algunas excepciones, un codón de tres nucleótidos en una secuencia de ácido nucleico especifica un solo aminoácido. La gran mayoría de genes están codificados con un solo esquema (consulte la tabla de codones de ARN ). Ese esquema a menudo se conoce como el código genético canónico o estándar, o simplemente el código genético, aunque existen códigos variantes (como en las mitocondrias ).

El código genético es una instancia de Code . Compare con el código fuente , el código legal y el idioma .

Historia

El codigo genetico

Los esfuerzos para comprender cómo se codifican las proteínas comenzaron después de que se descubrió la estructura del ADN en 1953. George Gamow postuló que se deben emplear conjuntos de tres bases para codificar los 20 aminoácidos estándar utilizados por las células vivas para construir proteínas, lo que permitiría un máximo de 4 3 = 64 aminoácidos.

Codones

El experimento de Crick, Brenner, Barnett y Watts-Tobin demostró por primera vez que los codones constan de tres bases de ADN. Marshall Nirenberg y Heinrich J. Matthaei fueron los primeros en revelar la naturaleza de un codón en 1961.

Se utilizó un sistema libre de células para traducir un poli- uracilo secuencia de ARN (es decir, UUUUU ...) y descubrió que el polipéptido que habían sintetizado consistía en sólo el amino ácido fenilalanina . De ese modo dedujeron que el codón UUU especificaba el aminoácido fenilalanina.

Esto fue seguido por experimentos en Severo Ochoa laboratorio 's que demostró que el poli- adenina secuencia de ARN (AAAAA ...) codificado para el polipéptido poli- lisina y que la poli- citosina secuencia de ARN (CCCCC ...) codificado para el polipeptídicos poli- prolina . Por tanto, el codón AAA especificó el aminoácido lisina y el codón CCC especificó el aminoácido prolina . Usando varios copolímeros, se determinaron luego la mayoría de los codones restantes.

El trabajo posterior de Har Gobind Khorana identificó el resto del código genético. Poco después, Robert W. Holley determinó la estructura del ARN de transferencia (ARNt), la molécula adaptadora que facilita el proceso de traducción del ARN en proteína. Este trabajo se basó en los estudios anteriores de Ochoa, lo que le valió a este último el Premio Nobel de Fisiología o Medicina en 1959 por su trabajo sobre la enzimología de la síntesis de ARN.

Ampliando este trabajo, Nirenberg y Philip Leder revelaron la naturaleza triplete del código y descifraron sus codones. En estos experimentos, se pasaron varias combinaciones de ARNm a través de un filtro que contenía ribosomas , los componentes de las células que traducen el ARN en proteína. Los tripletes únicos promovieron la unión de ARNt específicos al ribosoma. Leder y Nirenberg pudieron determinar las secuencias de 54 de 64 codones en sus experimentos. Khorana, Holley y Nirenberg recibieron el Nobel de 1968 por su trabajo.

Los tres codones de parada fueron nombrados por los descubridores Richard Epstein y Charles Steinberg. "Amber" lleva el nombre de su amigo Harris Bernstein, cuyo apellido significa "ámbar" en alemán. Los otros dos codones de parada se denominaron "ocre" y "ópalo" para mantener el tema de los "nombres de color".

Códigos genéticos expandidos (biología sintética)

En una amplia audiencia académica, el concepto de la evolución del código genético desde el código genético original y ambiguo a un código bien definido ("congelado") con el repertorio de 20 (+2) aminoácidos canónicos es ampliamente aceptado. Sin embargo, existen diferentes opiniones, conceptos, enfoques e ideas, que es la mejor forma de cambiarlo experimentalmente. Incluso se proponen modelos que predicen "puntos de entrada" para la invasión de aminoácidos sintéticos del código genético.

Desde 2001, se han agregado 40 aminoácidos no naturales a la proteína creando un codón único (recodificación) y un par de ARN de transferencia correspondiente: aminoacil - ARNt-sintetasa para codificarlo con diversas propiedades fisicoquímicas y biológicas para ser utilizado como una herramienta para explorar la estructura y función de las proteínas o para crear proteínas nuevas o mejoradas.

H. Murakami y M. Sisido extendieron algunos codones para tener cuatro y cinco bases. Steven A. Benner construyó un codón 65 funcional ( in vivo ).

En 2015 N. Budisa , D. Söll y colaboradores informaron de la sustitución completa de los 20.899 residuos de triptófano (codones UGG) con tienopirrol-alanina no natural en el código genético de la bacteria Escherichia coli .

En 2016 se creó el primer organismo semisintético estable. Era una bacteria (unicelular) con dos bases sintéticas (llamadas X e Y). Las bases sobrevivieron a la división celular.

En 2017, investigadores de Corea del Sur informaron que habían diseñado un ratón con un código genético extendido que puede producir proteínas con aminoácidos no naturales.

En mayo de 2019, los investigadores, en un esfuerzo histórico, informaron sobre la creación de una nueva forma sintética (posiblemente artificial ) de vida viable , una variante de la bacteria Escherichia coli , al reducir el número natural de 64 codones en el genoma bacteriano a 59 codones. en cambio, para codificar 20 aminoácidos .

Características

Lectura de marcos en la secuencia de ADN de una región del genoma mitocondrial humano que codifica los genes MT-ATP8 y MT-ATP6 (en negro: posiciones 8.525 a 8.580 en la secuencia de acceso NC_012920). Hay tres posibles marcos de lectura en la dirección de avance 5 '→ 3', comenzando en la primera (+1), segunda (+2) y tercera posición (+3). Para cada codón (corchetes), el aminoácido viene dado por el código mitocondrial de vertebrados , ya sea en el marco +1 para MT-ATP8 (en rojo) o en el marco +3 para MT-ATP6 (en azul). Los genes MT-ATP8 terminan con el codón de parada TAG (punto rojo) en el marco +1. El gen MT-ATP6 comienza con el codón ATG (círculo azul para el aminoácido M) en el marco +3.

Marco de lectura

Un marco de lectura se define por el triplete inicial de nucleótidos a partir del cual comienza la traducción. Establece el marco para una serie de codones sucesivos que no se superponen, lo que se conoce como " marco de lectura abierto " (ORF). Por ejemplo, la cadena 5'-AAATGAACG-3 '(ver figura), si se lee desde la primera posición, contiene los codones AAA, TGA y ACG; si se lee desde la segunda posición, contiene los codones AAT y GAA; y si se lee desde la tercera posición, contiene los codones ATG y AAC. Por tanto, cada secuencia puede leerse en su dirección 5 '→ 3' en tres marcos de lectura , cada uno de los cuales produce una secuencia de aminoácidos posiblemente distinta: en el ejemplo dado, Lys (K) -Trp (W) -Thr (T), Asn (N) -Glu (E) o Met (M) -Asn (N), respectivamente (cuando se traduce con el código mitocondrial de vertebrados). Cuando el ADN es de doble hebra, se definen seis posibles marcos de lectura , tres en la orientación directa en una hebra y tres en sentido inverso en la hebra opuesta. Los marcos de codificación de proteínas se definen mediante un codón de inicio , generalmente el primer codón AUG (ATG) en la secuencia de ARN (ADN).

En eucariotas , los ORF en los exones a menudo son interrumpidos por intrones .

Codones de inicio y parada

La traducción comienza con un codón de inicio de cadena o un codón de inicio . El codón de inicio solo no es suficiente para comenzar el proceso. También se requieren secuencias cercanas como la secuencia de Shine-Dalgarno en E. coli y factores de iniciación para iniciar la traducción. El codón de inicio más común es AUG, que se lee como metionina o, en bacterias, como formilmetionina . Los codones de inicio alternativos que dependen del organismo incluyen "GUG" o "UUG"; estos codones normalmente representan valina y leucina , respectivamente, pero como codones de inicio se traducen como metionina o formilmetionina.

Los tres codones de parada tienen nombres: UAG es ámbar , UGA es ópalo (a veces también llamado ámbar ) y UAA es ocre . Los codones de parada también se denominan codones de "terminación" o "sin sentido". Señalan la liberación del polipéptido naciente del ribosoma porque ningún ARNt afín tiene anticodones complementarios a estas señales de parada, lo que permite que un factor de liberación se una al ribosoma.

Efecto de mutaciones

Ejemplos de mutaciones notables que pueden ocurrir en humanos.

Durante el proceso de replicación del ADN , ocasionalmente ocurren errores en la polimerización de la segunda hebra. Estos errores, mutaciones , pueden afectar el fenotipo de un organismo , especialmente si ocurren dentro de la secuencia de codificación de proteínas de un gen. Las tasas de error suelen ser de 1 error por cada 10 a 100 millones de bases, debido a la capacidad de "corrección de pruebas" de las ADN polimerasas .

Las mutaciones sin sentido y las mutaciones sin sentido son ejemplos de mutaciones puntuales que pueden causar enfermedades genéticas como la anemia de células falciformes y la talasemia, respectivamente. Las mutaciones sin sentido clínicamente importantes generalmente cambian las propiedades del residuo de aminoácido codificado entre estados básicos, ácidos, polares o no polares, mientras que las mutaciones sin sentido dan como resultado un codón de terminación .

Las mutaciones que alteran la secuencia del marco de lectura mediante indeles ( inserciones o deleciones ) de un no múltiplo de 3 bases de nucleótidos se conocen como mutaciones de desplazamiento del marco de lectura . Estas mutaciones generalmente dan como resultado una traducción completamente diferente de la original y probablemente causan la lectura de un codón de terminación , lo que trunca la proteína. Estas mutaciones pueden alterar la función de la proteína y, por tanto, son raras en secuencias codificantes de proteínas in vivo . Una razón por la que la herencia de mutaciones por desplazamiento del marco de lectura es rara es que, si la proteína que se traduce es esencial para el crecimiento bajo las presiones selectivas que enfrenta el organismo, la ausencia de una proteína funcional puede causar la muerte antes de que el organismo se vuelva viable. Las mutaciones por desplazamiento de marco pueden provocar enfermedades genéticas graves como la enfermedad de Tay-Sachs .

Aunque la mayoría de las mutaciones que cambian las secuencias de proteínas son dañinas o neutrales, algunas mutaciones tienen beneficios. Estas mutaciones pueden permitir al organismo mutante resistir tensiones ambientales particulares mejor que los organismos de tipo salvaje , o reproducirse más rápidamente. En estos casos, una mutación tenderá a volverse más común en una población a través de la selección natural . Los virus que utilizan ARN como su material genético tienen tasas de mutación rápidas, lo que puede ser una ventaja, ya que estos virus evolucionan rápidamente y, por lo tanto, evaden las respuestas defensivas del sistema inmunológico . En grandes poblaciones de organismos que se reproducen asexualmente, por ejemplo, E. coli , pueden coexistir múltiples mutaciones beneficiosas. Este fenómeno se denomina interferencia clonal y provoca competencia entre las mutaciones.

Degeneración

Agrupación de codones por volumen molar de residuos de aminoácidos e hidropática . Una versión más detallada está disponible.
Los ejes 1, 2, 3 son la primera, segunda y tercera posiciones en el codón. Los 20 aminoácidos y los codones de parada (X) se muestran en un código de una sola letra .

La degeneración es la redundancia del código genético. Este término fue dado por Bernfield y Nirenberg. El código genético tiene redundancia pero no ambigüedad (consulte las tablas de codones a continuación para ver la correlación completa). Por ejemplo, aunque los codones GAA y GAG especifican ácido glutámico (redundancia), ninguno especifica otro aminoácido (sin ambigüedad). Los codones que codifican un aminoácido pueden diferir en cualquiera de sus tres posiciones. Por ejemplo, el aminoácido leucina se especifica mediante codones Y U R o CU N (UUA, UUG, CUU, CUC, CUA o CUG) (la diferencia en la primera o tercera posición se indica mediante la notación IUPAC ), mientras que el aminoácido serina se especifica mediante codones UC N o AG Y (UCA, UCG, UCC, UCU, AGU o AGC) (diferencia en la primera, segunda o tercera posición). Una consecuencia práctica de la redundancia es que los errores en la tercera posición del codón triplete provocan sólo una mutación silenciosa o un error que no afectaría a la proteína porque la hidrofilicidad o hidrofobicidad se mantiene mediante la sustitución equivalente de aminoácidos; por ejemplo, un codón de NUN (donde N = cualquier nucleótido) tiende a codificar aminoácidos hidrófobos. NCN produce residuos de aminoácidos que son de tamaño pequeño y de hidropatía moderada ; NAN codifica residuos hidrófilos de tamaño medio. El código genético está tan bien estructurado para la hidropatía que un análisis matemático ( Descomposición de valores singulares ) de 12 variables (4 nucleótidos x 3 posiciones) produce una correlación notable (C = 0,95) para predecir la hidropática del aminoácido codificado directamente a partir de la secuencia de triplete de nucleótidos, sin traducción. Observe que en la tabla siguiente, ocho aminoácidos no se ven afectados en absoluto por mutaciones en la tercera posición del codón, mientras que en la figura anterior, es probable que una mutación en la segunda posición provoque un cambio radical en las propiedades fisicoquímicas del codón. aminoácido codificado. Sin embargo, los cambios en la primera posición de los codones son más importantes que los cambios en la segunda posición a escala global. La razón puede ser que la inversión de carga (de una carga positiva a una negativa o viceversa) solo puede ocurrir con mutaciones en la primera posición de ciertos codones, pero no con cambios en la segunda posición de cualquier codón. Tal inversión de carga puede tener consecuencias dramáticas para la estructura o función de una proteína. Este aspecto puede haber sido subestimado en gran medida por estudios previos.

Sesgo de uso de codones

La frecuencia de codones, también conocida como sesgo de uso de codones , puede variar de una especie a otra con implicaciones funcionales para el control de la traducción .

Tabla de frecuencias de codones del genoma humano
Frecuencia de codones del genoma humano
Codón Automóvil club británico Fracción Frec Número Codón Automóvil club británico Fracción Frec Número Codón Automóvil club británico Fracción Frec Número Codón Automóvil club británico Fracción Frec Número
UUU F 0,46 17,6 714,298 UCU S 0,19 15,2 618,711 UAU Y 0,44 12,2 495,699 UGU C 0,46 10,6 430,311
UUC F 0,54 20,3 824,692 UCC S 0,22 17,7 718,892 UAC Y 0,56 15,3 622,407 CGU C 0,54 12,6 513,028
UUA L 0,08 7.7 311,881 UCA S 0,15 12,2 496,448 UAA * 0,30 1.0 40,285 UGA * 0,47 1,6 63,237
UUG L 0,13 12,9 525,688 UCG S 0,05 4.4 179,419 UAG * 0,24 0,8 32,109 UGG W 1,00 13,2 535,595
CUU L 0,13 13,2 536,515 CCU PAG 0,29 17,5 713,233 CAU H 0,42 10,9 441,711 CGU R 0,08 4.5 184.609
CUC L 0,20 19,6 796,638 CCC PAG 0,32 19,8 804,620 CAC H 0,58 15,1 613,713 CGC R 0,18 10,4 423,516
CUA L 0,07 7.2 290,751 CCA PAG 0,28 16,9 688.038 CAA Q 0,27 12,3 501,911 CGA R 0,11 6.2 250,760
CUG L 0,40 39,6 1,611,801 CCG PAG 0,11 6,9 281,570 CAG Q 0,73 34,2 1,391,973 CGG R 0,20 11,4 464,485
AUU I 0,36 16,0 650,473 ACU T 0,25 13,1 533,609 AAU norte 0,47 17.0 689,701 AGU S 0,15 12,1 493,429
AUC I 0,47 20,8 846,466 ACC T 0,36 18,9 768.147 CAA norte 0,53 19,1 776,603 AGC S 0,24 19,5 791,383
AUA I 0,17 7.5 304,565 ACA T 0,28 15,1 614,523 AAA K 0,43 24,4 993,621 AGA R 0,21 12,2 494,682
AGO METRO 1,00 22,0 896,005 ACG T 0,11 6.1 246,105 AAG K 0,57 31,9 1,295,568 AGG R 0,21 12,0 486,463
GUU V 0,18 11,0 448,607 GCU A 0,27 18,4 750,096 GAU D 0,46 21,8 885,429 GGU GRAMO 0,16 10,8 437,126
GUC V 0,24 14,5 588,138 GCC A 0,40 27,7 1.127.679 GAC D 0,54 25,1 1.020.595 GGC GRAMO 0,34 22,2 903,565
GUA V 0,12 7.1 287,712 GCA A 0,23 15,8 643,471 GAA mi 0,42 29,0 1,177,632 GGA GRAMO 0,25 16,5 669,873
GUG V 0,46 28,1 1,143,534 GCG A 0,11 7.4 299,495 MORDAZA mi 0,58 39,6 1,609,975 GGG GRAMO 0,25 16,5 669,768

Códigos genéticos alternativos

Aminoácidos no estándar

En algunas proteínas, los aminoácidos no estándar se sustituyen por codones de parada estándar, dependiendo de las secuencias señal asociadas en el ARN mensajero. Por ejemplo, UGA puede codificar selenocisteína y UAG puede codificar pirrolisina . La selenocisteína llegó a ser vista como el 21º aminoácido y la pirrolisina como el 22º. A diferencia de la selenocisteína, la UAG codificada por pirrolisina se traduce con la participación de una aminoacil-tRNA sintetasa dedicada . Tanto la selenocisteína como la pirrolisina pueden estar presentes en el mismo organismo. Aunque el código genético normalmente está fijado en un organismo, el procariota aceto Acetohalobium arabaticum puede expandir su código genético de 20 a 21 aminoácidos (al incluir pirrolisina) en diferentes condiciones de crecimiento.

Variaciones

Logotipo del código genético del genoma mitocondrial de Globobulimina pseudospinescens . El logotipo muestra los 64 codones de izquierda a derecha, alternativas predichas en rojo (en relación con el código genético estándar). Línea roja: codones de parada. La altura de cada aminoácido en la pila muestra la frecuencia con la que se alinea con el codón en dominios de proteínas homólogos. La altura de la pila indica el apoyo a la predicción.

Se predijeron variaciones en el código estándar en la década de 1970. El primero fue descubierto en 1979 por investigadores que estudiaban genes mitocondriales humanos . A partir de entonces se descubrieron muchas variantes leves, incluidos varios códigos mitocondriales alternativos. Estas variantes menores, por ejemplo, implican la traducción del codón UGA como triptófano en especies de Mycoplasma y la traducción de CUG como serina en lugar de leucina en levaduras del "clado CTG" (como Candida albicans ). Debido a que los virus deben usar el mismo código genético que sus huéspedes, las modificaciones del código genético estándar podrían interferir con la síntesis o el funcionamiento de las proteínas virales. Sin embargo, virus como los totivirus se han adaptado a la modificación del código genético del huésped. En bacterias y arqueas , GUG y UUG son codones de inicio comunes. En casos raros, ciertas proteínas pueden usar codones de inicio alternativos. Sorprendentemente, también existen variaciones en la interpretación del código genético en genes humanos codificados por el núcleo: en 2016, los investigadores que estudiaron la traducción de malato deshidrogenasa encontraron que en aproximadamente el 4% de los ARNm que codifican esta enzima, el codón de terminación se usa naturalmente para codificar la aminoácidos triptófano y arginina. Este tipo de recodificación es inducida por un contexto de codón de terminación de alta lectura y se denomina lectura traslacional funcional .

Los códigos genéticos variantes utilizados por un organismo se pueden inferir identificando genes altamente conservados codificados en ese genoma y comparando su uso de codones con los aminoácidos en proteínas homólogas de otros organismos. Por ejemplo, el programa FACIL infiere un código genético buscando qué aminoácidos en dominios de proteínas homólogos se alinean más a menudo con cada codón. Las probabilidades de aminoácidos resultantes para cada codón se muestran en un logotipo de código genético, que también muestra el soporte para un codón de terminación.

A pesar de estas diferencias, todos los códigos conocidos de origen natural son muy similares. El mecanismo de codificación es el mismo para todos los organismos: codones de tres bases, tRNA , ribosomas, lectura en una sola dirección y traducción de codones simples en aminoácidos simples. Las variaciones más extremas ocurren en ciertos ciliados donde el significado de los codones de terminación depende de su posición dentro del ARNm. Cuando están cerca del extremo 3 'actúan como terminadores, mientras que en posiciones internas codifican aminoácidos como en Condylostoma magnum o desencadenan un cambio de marco ribosómico como en Euplotes .

Origen

El código genético es una parte clave de la historia de la vida , según una versión de la cual las moléculas de ARN autorreplicantes precedieron a la vida tal como la conocemos. Esta es la hipótesis del mundo del ARN . Bajo esta hipótesis, cualquier modelo de aparición del código genético está íntimamente relacionado con un modelo de transferencia de ribozimas (enzimas de ARN) a proteínas como enzimas principales en las células. De acuerdo con la hipótesis del mundo del ARN, las moléculas de ARN de transferencia parecen haber evolucionado antes que las modernas sintetasas de aminoacil-ARNt , por lo que esta última no puede ser parte de la explicación de sus patrones.

Un código genético hipotético evolucionado aleatoriamente motiva aún más un modelo bioquímico o evolutivo para su origen. Si los aminoácidos se asignaran aleatoriamente a codones triplete, habría 1,5 × 10 84 códigos genéticos posibles. Este número se obtiene calculando el número de formas en que se pueden colocar 21 elementos (20 aminoácidos más una parada) en 64 contenedores, en los que cada elemento se usa al menos una vez. Sin embargo, la distribución de las asignaciones de codones en el código genético no es aleatoria. En particular, el código genético agrupa determinadas asignaciones de aminoácidos.

Los aminoácidos que comparten la misma vía biosintética tienden a tener la misma primera base en sus codones. Esto podría ser una reliquia evolutiva de un código genético temprano más simple con menos aminoácidos que luego evolucionó para codificar un conjunto más grande de aminoácidos. También podría reflejar propiedades estéricas y químicas que tuvieron otro efecto en el codón durante su evolución. Los aminoácidos con propiedades físicas similares también tienden a tener codones similares, lo que reduce los problemas causados ​​por mutaciones puntuales y errores de traducción.

Dado el esquema de codificación de tripletes genéticos no aleatorios, una hipótesis defendible para el origen del código genético podría abordar múltiples aspectos de la tabla de codones, como la ausencia de codones para D-aminoácidos, patrones de codones secundarios para algunos aminoácidos, confinamiento de sinónimos posiciones a la tercera posición, el pequeño conjunto de sólo 20 aminoácidos (en lugar de un número cercano a 64), y la relación de los patrones de codones de terminación con los patrones de codificación de aminoácidos.

Tres hipótesis principales abordan el origen del código genético. Muchos modelos pertenecen a uno de ellos o a un híbrido:

  • Congelación aleatoria: el código genético se creó aleatoriamente. Por ejemplo, las primeras ribozimas similares al ARNt pueden haber tenido diferentes afinidades por los aminoácidos, con codones que emergen de otra parte de la ribozima que presenta una variabilidad aleatoria. Una vez que se codificaron suficientes péptidos , cualquier cambio aleatorio importante en el código genético habría sido letal; de ahí que se "congelara".
  • Afinidad estereoquímica: el código genético es el resultado de una alta afinidad entre cada aminoácido y su codón o anti-codón; la última opción implica que las moléculas de pre-ARNt coincidían con sus correspondientes aminoácidos por esta afinidad. Más tarde, durante la evolución, este emparejamiento fue reemplazado gradualmente por emparejamiento por aminoacil-tRNA sintetasas.
  • Optimidad: el código genético continuó evolucionando después de su creación inicial, de modo que el código actual maximiza alguna función de aptitud , generalmente algún tipo de minimización de errores.

Las hipótesis han abordado una variedad de escenarios:

  • Los principios químicos gobiernan la interacción específica del ARN con los aminoácidos. Los experimentos con aptámeros mostraron que algunos aminoácidos tienen una afinidad química selectiva por sus codones. Los experimentos mostraron que de los 8 aminoácidos probados, 6 muestran alguna asociación de triplete de ARN-aminoácido.
  • Expansión biosintética. El código genético creció de un código anterior más simple a través de un proceso de "expansión biosintética". La vida primordial "descubrió" nuevos aminoácidos (por ejemplo, como subproductos del metabolismo ) y más tarde incorporó algunos de ellos a la maquinaria de la codificación genética. Aunque se ha encontrado mucha evidencia circunstancial que sugiere que se usaron menos tipos de aminoácidos en el pasado, las hipótesis precisas y detalladas sobre qué aminoácidos ingresaron al código en qué orden son controvertidas. Sin embargo, varios estudios han sugerido que Gly, Ala, Asp, Val, Ser, Pro, Glu, Leu, Thr pueden pertenecer a un grupo de aminoácidos de adición temprana, mientras que Cys, Met, Tyr, Trp, His, Phe pueden pertenecer a un grupo de aminoácidos de adición posterior.
  • La selección natural ha llevado a asignaciones de codones del código genético que minimizan los efectos de las mutaciones . Una hipótesis reciente sugiere que el código triplete se derivó de códigos que usaban codones más largos que los tripletes (como los codones cuádruples). Una decodificación más larga que la de tripletes aumentaría la redundancia de codones y sería más resistente a errores. Esta característica podría permitir una decodificación precisa en ausencia de maquinaria de traducción compleja, como el ribosoma , como antes de que las células comenzaran a producir ribosomas.
  • Canales de información: los enfoques teóricos de la información modelan el proceso de traducción del código genético en los aminoácidos correspondientes como un canal de información propenso a errores. El ruido inherente (es decir, el error) en el canal plantea al organismo una pregunta fundamental: ¿cómo se puede construir un código genético para resistir el ruido mientras traduce la información de manera precisa y eficiente? Estos modelos de "distorsión de la velocidad" sugieren que el código genético se originó como resultado de la interacción de las tres fuerzas evolutivas en conflicto: las necesidades de diversos aminoácidos, la tolerancia a errores y el costo mínimo de los recursos. El código surge en una transición cuando el mapeo de codones a aminoácidos se vuelve no aleatorio. La aparición del código se rige por la topología definida por los errores probables y está relacionada con el problema de coloración del mapa .
  • Teoría de juegos: los modelos basados ​​en juegos de señalización combinan elementos de teoría de juegos, selección natural y canales de información. Estos modelos se han utilizado para sugerir que los primeros polipéptidos probablemente eran cortos y tenían una función no enzimática. Los modelos de la teoría de juegos sugirieron que la organización de cadenas de ARN en células pudo haber sido necesaria para evitar el uso "engañoso" del código genético, es decir, evitar que el antiguo equivalente de los virus abrumara el mundo del ARN.
  • Códigos de parada: los codones para paradas de traducción también son un aspecto interesante del problema del origen del código genético. Como ejemplo para abordar la evolución del codón de parada, se ha sugerido que los codones de parada son tales que es más probable que terminen la traducción temprano en el caso de un error de cambio de marco . Por el contrario, algunos modelos moleculares estereoquímicos explican el origen de los codones de terminación como "no asignables".

Ver también

Referencias

Otras lecturas

enlaces externos