Código genético ampliado - Expanded genetic code

No debe haber diafonía entre el nuevo par de ARNt / sintasa y las moléculas de ARNt / sintasa existentes, solo con los ribosomas.

Un código genético expandido es un código genético modificado artificialmente en el que se han reasignado uno o más codones específicos para codificar un aminoácido que no se encuentra entre los 22 aminoácidos proteinogénicos codificados naturalmente comunes .

Los requisitos previos clave para expandir el código genético son:

  • el aminoácido no estándar para codificar,
  • un codón no utilizado para adoptar,
  • un ARNt que reconoce este codón, y
  • una ARNt sintetasa que reconoce solo ese ARNt y solo el aminoácido no estándar.

La expansión del código genético es un área de investigación de la biología sintética , una disciplina biológica aplicada cuyo objetivo es diseñar sistemas vivos con fines útiles. La expansión del código genético enriquece el repertorio de herramientas útiles disponibles para la ciencia.

En mayo de 2019, los investigadores, en un esfuerzo histórico, informaron sobre la creación de una nueva forma sintética (posiblemente artificial ) de vida viable , una variante de la bacteria Escherichia coli , al reducir el número natural de 64 codones en el genoma bacteriano a 61 codones. (eliminando dos de los seis codones que codifican la serina y uno de los tres codones de terminación), de los cuales 59 codificaban 20 aminoácidos .

Introducción

Es de destacar que el código genético de todos los organismos es básicamente el mismo, por lo que todos los seres vivos utilizan el mismo "lenguaje genético". En general, la introducción de nuevos aminoácidos funcionales no naturales en las proteínas de las células vivas rompe la universalidad del lenguaje genético, que idealmente conduce a formas de vida alternativas. Las proteínas se producen gracias a las moléculas del sistema de traducción, que decodifican los mensajes de ARN en una cadena de aminoácidos. Los ribosomas catalizan la traducción de la información genética contenida en el ARN mensajero (ARNm) en una proteína . Los ARN de transferencia (ARNt) se utilizan como claves para decodificar el ARNm en su polipéptido codificado . El tRNA reconoce un codón específico de tres nucleótidos en el mRNA con una secuencia complementaria llamada anticodón en uno de sus bucles. Cada codón de tres nucleótidos se traduce en uno de los veinte aminoácidos naturales. Hay al menos un ARNt para cualquier codón y, a veces, varios codones codifican el mismo aminoácido. Muchos ARNt son compatibles con varios codones. Una enzima llamada aminoacil tRNA sintetasa une covalentemente el aminoácido al tRNA apropiado. La mayoría de las células tienen una sintetasa diferente para cada aminoácido (20 o más sintetasas). Por otro lado, algunas bacterias tienen menos de 20 aminoacil tRNA sintetasas e introducen el aminoácido "faltante" mediante la modificación de un aminoácido estructuralmente relacionado por una enzima aminotransferasa . Una característica explotada en la expansión del código genético es el hecho de que la aminoacil tRNA sintetasa a menudo no reconoce al anticodón, sino a otra parte del tRNA, lo que significa que si el anticodón mutase, la codificación de ese aminoácido cambiaría a un nuevo codón. En el ribosoma, la información del ARNm se traduce en un aminoácido específico cuando el codón del ARNm coincide con el anticodón complementario de un ARNt, y el aminoácido unido se agrega a una cadena polipeptídica en crecimiento. Cuando se libera del ribosoma, la cadena polipeptídica se pliega en una proteína funcional.

Para incorporar un nuevo aminoácido al código genético se requieren varios cambios. Primero, para una traducción exitosa de un nuevo aminoácido, el codón al que se asigna el nuevo aminoácido no puede codificar uno de los 20 aminoácidos naturales. Por lo general, se usa un codón sin sentido ( codón de terminación ) o un codón de cuatro bases. En segundo lugar, se requiere un nuevo par de ARNt y aminoacil ARNt sintetasa, que se denominan conjunto ortogonal. El conjunto ortogonal no debe dialogar con los conjuntos de ARNt y sintetasa endógenos, mientras sigue siendo funcionalmente compatible con el ribosoma y otros componentes del aparato de traducción. El sitio activo de la sintetasa se modifica para aceptar solo el nuevo aminoácido. Muy a menudo, se analiza una biblioteca de sintetasas mutantes para encontrar una que cargue el ARNt con el aminoácido deseado. La sintetasa también se modifica para reconocer solo el ARNt ortogonal. El par de ARNt sintetasa a menudo se modifica por ingeniería genética en otras bacterias o células eucariotas.

En esta área de investigación, los 20 aminoácidos proteinogénicos codificados se denominan aminoácidos estándar o, alternativamente, aminoácidos naturales o canónicos, mientras que los aminoácidos agregados se denominan aminoácidos no estándar (NSAA) o aminoácidos no naturales ( uAA; término no utilizado en artículos que tratan de aminoácidos naturales no proteinogénicos, como la fosfoserina ) o aminoácidos no canónicos.

Aminoácidos no estándar

Tirosina y algunas variantes de tirosina sintética utilizadas para el etiquetado de proteínas. Se han sintetizado diferentes variantes de tirosina y se pueden incorporar a proteínas utilizando un código genético expandido. Todas las variantes que se muestran aquí se utilizan para enlaces químicos o fotoquímicos. Esto significa que el AA incorporado reacciona específicamente con un grupo químico particular (como hidrazidas, aminas, azidas o tioles) o puede activarse con UV para reticularse con otros AA.

El primer elemento del sistema es el aminoácido que se agrega al código genético de una determinada cepa de organismo.

Se han agregado más de 71 AINE diferentes a diferentes cepas de E. coli , células de levadura o de mamíferos. Debido a los detalles técnicos (síntesis química más fácil de NSAA, menos diafonía y evolución más fácil de la aminoacil-tRNA sintasa), los NSAA son generalmente más grandes que los aminoácidos estándar y la mayoría de las veces tienen un núcleo de fenilalanina pero con una gran variedad de sustituyentes diferentes. Estos permiten un gran repertorio de nuevas funciones, como el marcaje (ver figura), como un indicador fluorescente ( por ejemplo, dansilalanina) o para producir proteínas de traducción en E. coli con modificaciones postraduccionales eucariotas ( por ejemplo , fosfoserina, fosfotreonina y fosfotirosina).

El trabajo fundacional fue informado por Rolf Furtner, quien utilizó por sí solo un par de levadura ARNt Phe / PheRS para incorporar p-yodofenilalanina en E. coli .

Los aminoácidos no naturales incorporados en proteínas incluyen aminoácidos que contienen átomos pesados ​​para facilitar ciertos estudios cristalográficos de rayos X; aminoácidos con nuevas propiedades estéricas / empaquetadas y electrónicas; aminoácidos de fotorreticulación que pueden usarse para sondear interacciones proteína-proteína in vitro o in vivo; aminoácidos que contienen ceto, acetileno, azida y boronato que pueden usarse para introducir selectivamente un gran número de sondas biofísicas, etiquetas y nuevos grupos funcionales químicos en proteínas in vitro o in vivo ; aminoácidos activos redox para sondear y modular la transferencia de electrones; aminoácidos fotoenjaulados y fotoisomerizables para fotorregular procesos biológicos; aminoácidos de unión a metales para catálisis y detección de iones metálicos; aminoácidos que contienen cadenas laterales activas fluorescentes o infrarrojas para sondear la estructura y la dinámica de las proteínas; α-hidroxiácidos y D -aminoácidos como sondas de la conformación del esqueleto y las interacciones de enlace de hidrógeno; y aminoácidos sulfatados y miméticos de aminoácidos fosforilados como sondas de modificaciones postraduccionales.

La disponibilidad del aminoácido no estándar requiere que el organismo lo importe del medio o lo biosintetice. En el primer caso, el aminoácido no natural se sintetiza primero químicamente en su forma L ópticamente pura . Luego se agrega al medio de crecimiento de la célula. Normalmente se prueba una biblioteca de compuestos para su uso en la incorporación del nuevo aminoácido, pero esto no siempre es necesario, por ejemplo, varios sistemas de transporte pueden manejar aminoácidos no naturales con cadenas laterales apolares. En el segundo caso, es necesario diseñar una vía biosintética, por ejemplo, una cepa de E. coli que biosintetice un aminoácido nuevo (p-aminofenilalanina) a partir de fuentes de carbono básico y lo incluya en su código genético. Otro ejemplo: la producción de fosfoserina, un metabolito natural, y en consecuencia requirió la alteración de su vía de flujo para incrementar su producción.

Asignación de codones

Otro elemento del sistema es un codón para asignar al nuevo aminoácido.

Un problema importante para la expansión del código genético es que no hay codones libres. El código genético tiene un diseño no aleatorio que muestra signos reveladores de varias fases de la evolución primordial, sin embargo, desde entonces se ha congelado en su lugar y se conserva casi universalmente. Sin embargo, algunos codones son más raros que otros. De hecho, en E. coli (y en todos los organismos) el uso de codones no es igual, pero presenta varios codones raros (ver tabla), siendo el más raro el codón de parada ámbar (UAG).

Supresión del codón ámbar

Normanly et al. Se dieron cuenta de la posibilidad de reasignar codones . en 1990, cuando una cepa mutante viable de E. coli leyó el codón de terminación UAG ("ámbar") . Esto fue posible gracias a la rareza de este codón y al hecho de que el factor de liberación 1 solo hace que el codón ámbar termine la traducción. Más tarde, en el laboratorio de Schultz , se utilizó la tRNATyr / tirosil-tRNA sintetasa (TyrRS) de Methanococcus jannaschii , una arqueobacteria, para introducir una tirosina en lugar de STOP, el valor predeterminado del codón ámbar. Esto fue posible debido a las diferencias entre las sintasas bacterianas endógenas y la sintasa arquea ortóloga, que no se reconocen entre sí. Posteriormente, el grupo desarrolló el par de ARNt / sintasa ortologonal para utilizar el aminoácido no estándar O- metiltirosina. A esto le siguió la naftilalanina más grande y la benzoilfenilalanina fotorreticulante, que demostró la utilidad potencial del sistema.

El codón ámbar es el codón menos utilizado en Escherichia coli , pero secuestrarlo da como resultado una pérdida sustancial de aptitud. Un estudio, de hecho, encontró que había al menos 83 péptidos más afectados por la lectura. Además, el etiquetado estaba incompleto. Como consecuencia, se han creado varias cepas para reducir el costo de aptitud, incluida la eliminación de todos los codones ámbar del genoma. En la mayoría de las cepas de E. coli K-12 (es decir, Escherichia coli (biología molecular) para las genealogías de cepas) hay 314 codones de terminación UAG. En consecuencia, se ha invertido una enorme cantidad de trabajo en el reemplazo de estos. Un enfoque iniciado por el grupo del profesor George Church de Harvard, se denominó MAGE in CAGE: se basó en una transformación multiplex y la posterior recombinación de cepas para eliminar todos los codones UAG; la última parte presentó un punto de interrupción en un primer artículo, pero fue superar. Esto dio como resultado la cepa C321.ΔA de E. coli , que carece de todos los codones UAG y RF1. Esto permitió que se hiciera un experimento con esta cepa para hacerla "adicta" al aminoácido bifenilalanina al desarrollar varias enzimas clave para requerirla estructuralmente, poniendo así su código genético expandido bajo selección positiva.

Reasignación de codones de sentido raro

Además del codón ámbar, también se ha considerado el uso de codones de sentido raro. El codón AGG codifica la arginina, pero se ha modificado con éxito una cepa para que codifique la 6- N -aliloxicarbonil-lisina. Otro candidato es el codón AUA, que es inusual en el sentido de que su ARNt respectivo tiene que diferenciarse de AUG que codifica la metionina (primordialmente, isoleucina, de ahí su ubicación). Para hacer esto, el ARNt de AUA tiene una base especial, lisidina. La deleción de la sintasa ( tilS ) fue posible gracias a la sustitución del ARNt nativo por el de Mycoplasma mobile (sin lisidina). La aptitud reducida es un primer paso para presionar a la cepa para que pierda todas las instancias de AUA, lo que permite su uso para la expansión del código genético.

Codones de cuatro bases

Otros enfoques incluyen la adición de pares de bases adicionales o el uso de ribosomas ortólogos que aceptan, además del código genético triplete regular, ARNt con código cuádruple. Esto permitió el uso simultáneo de dos aminoácidos no naturales, p- azidofenilalanina (pAzF) y N6 - [(2-propiniloxi) carbonil] lisina (CAK), que se entrecruzan entre sí mediante cicloadición de Huisgen . La decodificación cuadriplicada en cepas de tipo salvaje no recodificadas es muy ineficaz. Esto se debe al hecho de que la interacción entre los ARNt manipulados con complejos ternarios u otros componentes de traducción no es tan favorable y fuerte como con los elementos de traducción endógenos de las células. Este problema puede superarse mediante la ingeniería específica y la evolución del ARNt que puede decodificar codones cuádruples en cepas no recodificadas. De esta manera se pueden generar hasta 4 pares de ARNt / ARNt sintetasa ortogonales cuádruples diferentes.

par de ARNt / sintetasa

Otro elemento clave es el par tRNA / sintetasa.

El conjunto ortólogo de sintetasa y tRNA se puede mutar y cribar mediante evolución dirigida para cargar el tRNA con un aminoácido diferente, incluso nuevo. Las mutaciones en el plásmido que contiene el par se pueden introducir mediante PCR propensa a errores o mediante cebadores degenerados para el sitio activo de la sintetasa. La selección implica múltiples rondas de un proceso de dos pasos, donde el plásmido se transfiere a las células que expresan cloranfenicol acetil transferasa con un codón ámbar prematuro. En presencia de cloranfenicol tóxico y el aminoácido no natural, las células supervivientes habrán anulado el codón ámbar utilizando el ARNt ortogonal aminoacilado con los aminoácidos estándar o con el no natural. Para eliminar el primero, el plásmido se inserta en células con un gen barnasa (tóxico) con un codón ámbar prematuro pero sin el aminoácido no natural, eliminando todas las sintasas ortogonales que no reconocen específicamente el aminoácido no natural. Además de la recodificación del ARNt en un codón diferente, se pueden mutar para reconocer un codón de cuatro bases, lo que permite opciones de codificación libres adicionales. El aminoácido no natural, como resultado, introduce diversas propiedades fisicoquímicas y biológicas con el fin de ser utilizado como una herramienta para explorar la estructura y función de las proteínas o para crear proteínas nuevas o mejoradas con fines prácticos.

Se han desarrollado varios métodos para seleccionar la sintetasa que acepta solo el aminoácido no natural. Uno de los cuales es mediante el uso de una combinación de selección positiva y negativa.

Conjuntos ortogonales en organismos modelo

Los pares ortogonales de sintetasa y tRNA que funcionan para un organismo pueden no funcionar para otro, ya que la sintetasa puede mal aminoacilar los tRNA endógenos o el tRNA puede ser mal aminoacilado por una sintetasa endógena. Como resultado, los conjuntos creados hasta la fecha difieren entre organismos.

Par Fuente E. coli Levadura Mamíferos notas y referencias
tRNA Tyr -TyrRS Methanococcus jannaschii No No
tRNA Lys –LysRS Pyrococcus horikoshii No No
tRNA Glu –GluRS Pyrococcus horikoshii No No
ARNt Leu –LeuRS ARNt: Halobacterium sp. mutante .
RS: Methanobacterium thermoautotrophicum
No No
ARNt Ámbar -PylRS Methanosarcina barkeri y Methanosarcina mazei
tRNA Ámbar - 3-yodotirosil -RS RS: variante Methanocaldococcus jannaschii aaRS No No
tRNA Tyr / Ámbar -TyrRS Escherichia coli No No Reportado en 2003, mencionado en 2014 LeuRS
ARNt i Met -GlnRS ARNt: humano
RS: Escherichia coli
No No Cambiado al codón ámbar.
ARNt i fMet -TyrRS ARNt: Escherichia coli
RS: S. cerevisiae
No Cambiado al codón ámbar.
ARNt Leu / ámbar -LeuRS Escherichia coli No Informó en 2004 y mutado para el ácido 2-aminooctanoico, o metil tirosina, y o -nitrobencilo cisteína. Evolucionado en levadura para la 4,5-dimetoxi-2-nitrobencil serina, probado en ratones y células de mamíferos con 4,5-dimetoxi-2-nitrobencil-cisteína fotosensible.
tRNA Tyr -TyrRS Bacillus stearothermophilus No No
ARNt Trp -TrpRS Bacillus subtilis , RS modificado No No El nuevo AA es 5-OH Trp.

En 2017, se informó sobre un ratón diseñado con un código genético extendido que puede producir proteínas con aminoácidos no naturales.

Ribosomas ortogonales

De manera similar a los ARNt ortogonales y las aminoacil ARNt sintetasas (aaRS), los ribosomas ortogonales se han diseñado para trabajar en paralelo a los ribosomas naturales. Los ribosomas ortogonales idealmente usan diferentes transcripciones de ARNm que sus contrapartes naturales y, en última instancia, también deberían basarse en un grupo separado de ARNt. Esto debería aliviar parte de la pérdida de aptitud que en la actualidad todavía surge de técnicas como la supresión del codón ámbar. Además, los ribosomas ortogonales se pueden mutar y optimizar para tareas particulares, como el reconocimiento de codones cuádruples. Tal optimización no es posible, o es muy desventajosa para los ribosomas naturales.

o-ribosoma

En 2005 se publicaron tres conjuntos de ribosomas, que no reconocían el ARNm natural, sino que traducían un grupo separado de ARNm ortogonal (o-ARNm). Esto se logró cambiando la secuencia de reconocimiento del ARNm, la secuencia de Shine-Dalgarno y la secuencia de reconocimiento correspondiente en el ARNr 16S de los ribosomas, la denominada Secuencia Anti-Shine-Darlgarno. De esta manera, el emparejamiento de bases, que generalmente se pierde si se muta alguna secuencia, permanece disponible. Sin embargo, las mutaciones en el ARNr 16S no se limitaron a los nucleótidos obviamente emparejados de bases de la secuencia clásica Anti-Shine-Darlgarno.

Ribo-X

En 2007, el grupo de Jason W. Chin presentó un ribosoma ortogonal, que fue optimizado para la supresión del codón ámbar. El ARNr 16S se mutó de tal manera que se unió al factor de liberación RF1 con menos fuerza que el ribosoma natural. Este ribosoma no eliminó el problema de la disminución de la aptitud celular provocada por la supresión de los codones de parada en las proteínas naturales. Sin embargo, a través de la especificidad mejorada, aumentó significativamente los rendimientos de la proteína diana sintetizada correctamente (de ~ 20% a> 60% por ciento para un codón ámbar a suprimir y de <1% a> 20% para dos codones ámbar).

Ribo-Q

En 2010, el grupo de Jason W. Chin presentó una versión optimizada del ribosoma ortogonal. El Ribo-Q es un ARNr 16S optimizado para reconocer los ARNt, que tienen anticodones cuádruples para reconocer codones cuádruples, en lugar de los codones tripletes naturales. Con este enfoque, el número de posibles codones aumenta de 64 a 256. Incluso teniendo en cuenta una variedad de codones de terminación, más de 200 aminoácidos diferentes podrían potencialmente codificarse de esta manera.

Grapado de ribosomas

Todos los ribosomas ortogonales descritos anteriormente se centran en optimizar el ARNr 16S. Hasta ahora, este ARNr 16S optimizado se combinó con subunidades grandes naturales para formar ribosomas ortogonales. Si el ARNr 23S, el principal componente de ARN de la subunidad ribosómica grande, también se va a optimizar, hay que asegurarse de que no haya diafonía en el ensamblaje de los ribosomas ortogonales y naturales (ver figura X B). Para garantizar que el rRNA 23S optimizado solo se formaría en ribosomas con el rRNA 16S optimizado, los dos rRNA se combinaron en una transcripción. Al insertar la secuencia del rRNA 23S en una región de bucle de la secuencia del rRNA 16S, ambas subunidades aún adoptan pliegues funcionales. Dado que los dos ARNr están unidos y, por tanto, en constante proximidad, se unen preferiblemente entre sí, no a otras subunidades ribosómicas flotantes libres.

Centro de peptidil transferasa de ingeniería

En 2014 se demostró que al alterar el centro de la peptidil transferasa del ARNr 23S, se podían crear ribosomas que se basaban en grupos ortogonales de ARNt. El extremo 3 'de los ARNt se conserva universalmente como CCA. Las dos citidinas se emparejan con dos guaninas, el ARNr 23S para unir el ARNt al ribosoma. Esta interacción es necesaria para la fidelidad traslacional. Sin embargo, mediante la co-mutación de los nucleótidos de unión de tal manera que aún puedan formar pares de bases, se puede conservar la fidelidad de traducción. El extremo 3 'del ARNt se muta de CCA a CGA, mientras que dos nucleótidos de citidina en los sitios A y P de los ribosomas se mutan a guanidina. Esto conduce a ribosomas que no aceptan ARNt de origen natural como sustratos y a ARNt, que los ribosomas naturales no pueden utilizar como sustrato.
Para utilizar dichos ARNt de forma eficaz, tendrían que ser aminoacilados mediante aaRS ortogonales específicos. La mayoría de los aaRS de origen natural reconocen el extremo 3 'de su correspondiente ARNt. Los aaRS para estos ARNt mutados en 3 'aún no están disponibles. Hasta ahora, este sistema sólo se ha demostrado que funciona en un entorno de traducción in vitro en el que se logró la aminoacilación del ARNt ortogonal utilizando los denominados "flexizymes".Las flexizimas son ribozimas con actividad de tRNA-amino-aclilación.

Aplicaciones

Con un código genético expandido, el aminoácido no natural puede dirigirse genéticamente a cualquier sitio elegido en la proteína de interés. La alta eficiencia y fidelidad de este proceso permite un mejor control de la colocación de la modificación en comparación con la modificación postraduccional de la proteína, que, en general, se dirigirá a todos los aminoácidos del mismo tipo, como el grupo tiol de la cisteína y el grupo amino de la lisina. Además, un código genético expandido permite realizar modificaciones in vivo . La capacidad de dirigir de manera específica al sitio restos químicos sintetizados en laboratorio a proteínas permite muchos tipos de estudios que de otro modo serían extremadamente difíciles, tales como:

  • Sondeo de la estructura y función de la proteína: mediante el uso de aminoácidos con un tamaño ligeramente diferente, como O -metiltirosina o dansilalanina en lugar de tirosina, y mediante la inserción de restos informadores codificados genéticamente (que cambian de color y / o espín activos) en sitios de proteínas seleccionados, información química acerca de la estructura y función de la proteína se puede medir.
  • Sondear el papel de las modificaciones postraduccionales en la estructura y función de las proteínas: mediante el uso de aminoácidos que imitan modificaciones postraduccionales como la fosfoserina, se pueden obtener proteínas biológicamente activas y la naturaleza específica del sitio de la incorporación de aminoácidos puede conducir a información sobre cómo la posición, densidad y distribución de la fosforilación de proteínas afectan la función de las proteínas.
  • Identificación y regulación de la actividad de las proteínas: mediante el uso de aminoácidos fotocajados, la función de las proteínas se puede "activar" o desactivar iluminando el organismo.
  • Cambiar el modo de acción de una proteína: se puede comenzar con el gen de una proteína que se une a una determinada secuencia de ADN y, al insertar un aminoácido químicamente activo en el sitio de unión, convertirlo en una proteína que corta el ADN en lugar de atarlo.
  • Mejora de la inmunogenicidad y superación de la autotolerancia : reemplazando tirosinas elegidas estratégicamente con p -nitrofenilalanina, una autoproteína tolerada puede volverse inmunogénica.
  • Destrucción selectiva de componentes celulares seleccionados: utilizando un código genético expandido, se pueden incorporar restos químicos destructivos y antinaturales (a veces llamados "ojivas químicas") en proteínas que se dirigen a componentes celulares específicos.
  • Producción de mejor proteína: la evolución de bacteriófagos T7 en una cepa de E. coli no evolutiva que codificaba 3-yodotirosina en el codón ámbar, resultó en una población más apta que la de tipo salvaje gracias a la presencia de yodotirosina en su proteoma
  • Sondando la localización de proteínas y la interacción proteína-proteína en bacterias.

Futuro

La expansión del código genético aún está en pañales. La metodología actual usa solo un aminoácido no estándar a la vez, mientras que idealmente se podrían usar múltiples. De hecho, el grupo de Jason Chin ha batido recientemente el récord de una cepa de E. coli recodificada genéticamente que puede incorporar simultáneamente hasta 4 aminoácidos no naturales. Además, se ha desarrollado un software que permite la combinación de ribosomas ortogonales y pares de ARNt / RS no naturales para mejorar el rendimiento y la fidelidad de las proteínas.

Genoma sintético recodificado

Una forma de lograr la codificación de múltiples aminoácidos no naturales es sintetizar un genoma reescrito. En 2010, a un costo de $ 40 millones , se construyó un organismo, Mycoplasma laboratorium , que estaba controlado por un genoma sintético, pero no recodificado. El primer organismo recodificado genéticamente fue creado por una colaboración entre los laboratorios de George Church y Farren Isaacs, cuando la E. coli MG1655 de tipo salvaje se recodificó de tal manera que los 321 codones de parada conocidos (UAG) se sustituyeron por codones UAA sinónimos y se liberaron el factor 1 se eliminó para eliminar la interacción con el codón de parada exógeno y mejorar la síntesis de proteínas no naturales. En 2019, se creó Escherichia coli Syn61, con un genoma recodificado de 4 megabase que consta de solo 61 codones en lugar de los 64 naturales. Además de la eliminación del uso de codones raros, la especificidad del sistema debe aumentarse tanto como más tRNA reconocer varios codones

Alfabeto genético ampliado

Otro enfoque es expandir el número de nucleobases para aumentar la capacidad de codificación.

Un par de bases no naturales (UBP) es una subunidad diseñada (o nucleobase ) de ADN que se crea en un laboratorio y no ocurre en la naturaleza. El grupo de Ichiro Hirao en el instituto RIKEN de Japón logró una demostración de UBP in vitro . En 2002, desarrollaron un par de bases no naturales entre 2-amino-8- (2-tienil) purina (s) y piridina-2-ona (y) que funciona in vitro en la transcripción y traducción para la incorporación específica de sitio de no -Aminoácidos estándar en proteínas. En 2006, crearon 7- (2-tienil) imidazo [4,5-b] piridina (Ds) y pirrol-2-carbaldehído (Pa) como un tercer par de bases para la replicación y la transcripción. Posteriormente, Ds y 4- [3- (6-aminohexanamido) -1-propinil] -2-nitropirrol (Px) se descubrió como un par de alta fidelidad en la amplificación por PCR. En 2013, aplicaron el par Ds-Px a la generación de aptámeros de ADN mediante selección in vitro (SELEX) y demostraron que la expansión del alfabeto genético aumentaba significativamente las afinidades de los aptámeros de ADN por las proteínas diana.

En 2012, un grupo de científicos estadounidenses dirigido por Floyd Romesberg, biólogo químico del Instituto de Investigación Scripps en San Diego, California, publicó que su equipo diseñó un par de bases no naturales (UBP). Los dos nuevos nucleótidos artificiales o par de bases no naturales (UBP) se denominaron " d5SICS " y " dNaM ". Más técnicamente, estos nucleótidos artificiales que llevan nucleobases hidrófobas , presentan dos anillos aromáticos fusionados que forman un complejo (d5SICS – dNaM) o un par de bases en el ADN. En 2014, el mismo equipo del Instituto de Investigación Scripps informó que sintetizaron un tramo de ADN circular conocido como un plásmido que contiene pares de bases TA y CG naturales junto con el laboratorio de UBP Romesberg de mejor rendimiento que había diseñado, y lo insertaron en células de los comunes. bacteria E. coli que reprodujo con éxito los pares de bases no naturales a través de múltiples generaciones. Este es el primer ejemplo conocido de un organismo vivo que transmite un código genético ampliado a las generaciones posteriores. Esto se logró en parte mediante la adición de un gen de algas de apoyo que expresa un transportador de trifosfato de nucleótidos que importa eficientemente los trifosfatos de d5SICSTP y dNaMTP a la bacteria E. coli . Luego, las vías de replicación bacteriana natural las utilizan para replicar con precisión el plásmido que contiene d5SICS – dNaM.

La incorporación exitosa de un tercer par de bases en un microorganismo vivo es un avance significativo hacia el objetivo de expandir en gran medida el número de aminoácidos que pueden ser codificados por el ADN, expandiendo así el potencial de los organismos vivos para producir proteínas nuevas . Las cadenas artificiales de ADN aún no codifican nada, pero los científicos especulan que podrían diseñarse para fabricar nuevas proteínas que podrían tener usos industriales o farmacéuticos.

En mayo de 2014, los investigadores anunciaron que habían introducido con éxito dos nuevos nucleótidos artificiales en el ADN bacteriano y, al incluir nucleótidos artificiales individuales en los medios de cultivo, pudieron pasar las bacterias 24 veces; no crearon ARNm ni proteínas capaces de utilizar los nucleótidos artificiales.

Métodos relacionados

Método de incorporación de presión selectiva (SPI) para la producción de aloproteínas

Ha habido muchos estudios que han producido proteínas con aminoácidos no estándar, pero no alteran el código genético. Estas proteínas, llamadas aloproteínas , se elaboran incubando células con un aminoácido no natural en ausencia de un aminoácido codificado similar para que el primero se incorpore a la proteína en lugar del segundo, por ejemplo , ácido L -2-aminohexanoico ( Ahx) para metionina (Met).

Estos estudios se basan en la actividad promiscua natural de la aminoacil tRNA sintetasa para añadir a su tRNA diana un aminoácido no natural (es decir, un análogo) similar al sustrato natural, por ejemplo, la metionil-tRNA sintasa confundiendo isoleucina con metionina. En la cristalografía de proteínas, por ejemplo, la adición de selenometionina al medio de un cultivo de una cepa auxotrófica de metionina da como resultado proteínas que contienen selenometionina en oposición a metionina ( es decir, dispersión anómala de longitud de onda múltiple por una razón). Otro ejemplo es que se añaden fotoleucina y fotometionina en lugar de leucina y metionina a la proteína de marcación cruzada. De manera similar, algunos hongos tolerantes al telurio pueden incorporar telurocisteína y telurometionina en su proteína en lugar de cisteína y metionina. El objetivo de expandir el código genético es más radical ya que no reemplaza un aminoácido, pero agrega uno o más al código. Por otro lado, las sustituciones de todo el proteoma se realizan de forma más eficaz mediante sustituciones globales de aminoácidos. Por ejemplo, en E. coli y B. subtilis se han intentado sustituciones globales de aminoácidos naturales con análogos fluorados en todo el proteoma . Budisa y Söll informaron en 2015 de una sustitución completa del triptófano por tienopirrol-alanina en respuesta a los codones 20899 UGG en E. coli . Además, muchos fenómenos biológicos, como el plegamiento y la estabilidad de proteínas, se basan en efectos sinérgicos en muchas posiciones de la secuencia de proteínas.

En este contexto, el método SPI genera variantes de proteínas recombinantes o aloproteínas directamente mediante la sustitución de aminoácidos naturales con contrapartes no naturales. Un huésped de expresión auxotrófica de aminoácidos se complementa con un análogo de aminoácido durante la expresión de la proteína diana. Este enfoque evita las trampas de los métodos basados ​​en la supresión y es superior en términos de eficiencia, reproducibilidad y una configuración experimental extremadamente simple. Numerosos estudios demostraron cómo la sustitución global de aminoácidos canónicos con varios análogos isostéricos causó perturbaciones estructurales mínimas pero cambios dramáticos en las propiedades termodinámicas, de plegamiento, de agregación espectrales y de la actividad enzimática.

síntesis in vitro

La expansión del código genético descrita anteriormente es in vivo . Una alternativa es el cambio de codificación de experimentos de traducción in vitro . Esto requiere el agotamiento de todos los ARNt y la reintroducción selectiva de ciertos ARNt aminoacilados, algunos químicamente aminoacilados.

Síntesis química

Existen varias técnicas para producir péptidos químicamente, generalmente mediante la química de protección en fase sólida. Esto significa que se puede agregar cualquier aminoácido (protegido) a la secuencia naciente.

En noviembre de 2017, un equipo del Instituto de Investigación Scripps informó haber construido un genoma de bacteria de E. coli semisintético utilizando seis ácidos nucleicos diferentes (frente a los cuatro que se encuentran en la naturaleza). Las dos 'letras' adicionales forman un tercer par de bases antinatural. Los organismos resultantes pudieron prosperar y sintetizar proteínas utilizando "aminoácidos no naturales". El par de bases no naturales utilizado es dNaM –dTPT3. Este par de bases no natural se ha demostrado anteriormente, pero este es el primer informe de transcripción y traducción de proteínas utilizando un par de bases no natural.

Ver también

Referencias