Alineación estructural - Structural alignment

Alineación estructural de tiorredoxinas de humanos y la mosca Drosophila melanogaster . Las proteínas se muestran como cintas, con la proteína humana en rojo y la proteína de la mosca en amarillo. Generado a partir de PDB 3TRX y 1XWC .

La alineación estructural intenta establecer homología entre dos o más estructuras poliméricas basándose en su forma y conformación tridimensional . Este proceso generalmente se aplica a estructuras terciarias de proteínas , pero también se puede usar para moléculas de ARN grandes . En contraste con la superposición estructural simple, donde se conocen al menos algunos residuos equivalentes de las dos estructuras, la alineación estructural no requiere un conocimiento a priori de posiciones equivalentes. La alineación estructural es una herramienta valiosa para la comparación de proteínas con baja similitud de secuencia, donde las relaciones evolutivas entre proteínas no pueden detectarse fácilmente mediante técnicas de alineación de secuencia estándar . Por tanto, la alineación estructural se puede utilizar para implicar relaciones evolutivas entre proteínas que comparten muy poca secuencia común. Sin embargo, se debe tener precaución al utilizar los resultados como evidencia de ascendencia evolutiva compartida debido a los posibles efectos de confusión de la evolución convergente por la cual múltiples secuencias de aminoácidos no relacionadas convergen en una estructura terciaria común .

Los alineamientos estructurales pueden comparar dos secuencias o múltiples secuencias . Debido a que estas alineaciones se basan en información sobre las conformaciones tridimensionales de todas las secuencias de consulta, el método solo se puede utilizar en secuencias en las que se conocen estas estructuras. Por lo general, se encuentran mediante cristalografía de rayos X o espectroscopía de RMN . Es posible realizar una alineación estructural en estructuras producidas por métodos de predicción de estructuras . De hecho, la evaluación de tales predicciones a menudo requiere una alineación estructural entre el modelo y la verdadera estructura conocida para evaluar la calidad del modelo. Los alineamientos estructurales son especialmente útiles en el análisis de datos de los esfuerzos de genómica y proteómica estructural , y pueden usarse como puntos de comparación para evaluar alineamientos producidos por métodos bioinformáticos puramente basados ​​en secuencias .

Los resultados de una alineación estructural son una superposición de los conjuntos de coordenadas atómicas y una desviación mínima de la raíz cuadrada media ( RMSD ) entre las estructuras. El RMSD de dos estructuras alineadas indica su divergencia entre sí. El alineamiento estructural puede complicarse por la existencia de múltiples dominios proteicos dentro de una o más de las estructuras de entrada, porque los cambios en la orientación relativa de los dominios entre dos estructuras que se van a alinear pueden inflar artificialmente el RMSD.

Datos producidos por alineación estructural

La información mínima producida a partir de una alineación estructural exitosa es un conjunto de residuos que se consideran equivalentes entre las estructuras. Este conjunto de equivalencias se utiliza normalmente para superponer las coordenadas tridimensionales para cada estructura de entrada. (Tenga en cuenta que un elemento de entrada puede fijarse como referencia y, por lo tanto, sus coordenadas superpuestas no cambian). Las estructuras ajustadas se pueden usar para calcular valores RMSD mutuos, así como otras medidas más sofisticadas de similitud estructural, como la prueba de distancia global. (GDT, la métrica utilizada en CASP ). La alineación estructural también implica una alineación de secuencia unidimensional correspondiente a partir de la cual se puede calcular una identidad de secuencia, o el porcentaje de residuos que son idénticos entre las estructuras de entrada, como una medida de cuán estrechamente están relacionadas las dos secuencias.

Tipos de comparaciones

Debido a que las estructuras proteicas están compuestas de aminoácidos cuyas cadenas laterales están unidas por una estructura proteica común, se pueden usar varios subconjuntos diferentes posibles de los átomos que componen una macromolécula proteica para producir una alineación estructural y calcular los valores de RMSD correspondientes. Al alinear estructuras con secuencias muy diferentes, los átomos de la cadena lateral generalmente no se tienen en cuenta porque sus identidades difieren entre muchos residuos alineados. Por esta razón, es común que los métodos de alineación estructural usen por defecto solo los átomos de la cadena principal incluidos en el enlace peptídico . Por simplicidad y eficiencia, a menudo solo se consideran las posiciones del carbono alfa , ya que el enlace peptídico tiene una conformación plana mínimamente variante . Solo cuando las estructuras a alinear son muy similares o incluso idénticas, es significativo alinear las posiciones de los átomos de la cadena lateral, en cuyo caso la RMSD refleja no solo la conformación de la estructura de la proteína sino también los estados rotaméricos de las cadenas laterales. Otros criterios de comparación que reducen el ruido y refuerzan las coincidencias positivas incluyen la asignación de estructuras secundarias , mapas de contacto nativos o patrones de interacción de residuos, medidas de empaquetamiento de cadenas laterales y medidas de retención de enlaces de hidrógeno .

Superposición estructural

La comparación más básica posible entre las estructuras de proteínas no intenta alinear las estructuras de entrada y requiere una alineación precalculada como entrada para determinar cuáles de los residuos de la secuencia están destinados a ser considerados en el cálculo de RMSD. La superposición estructural se usa comúnmente para comparar múltiples conformaciones de la misma proteína (en cuyo caso no es necesario alineamiento, ya que las secuencias son las mismas) y para evaluar la calidad de los alineamientos producidos usando solo información de secuencia entre dos o más secuencias cuyas estructuras son conocidas. . Este método utiliza tradicionalmente un algoritmo de ajuste de mínimos cuadrados simple, en el que las rotaciones y traslaciones óptimas se encuentran minimizando la suma de las distancias al cuadrado entre todas las estructuras en la superposición. Más recientemente, los métodos bayesianos y de máxima verosimilitud han aumentado en gran medida la precisión de las rotaciones, traslaciones y matrices de covarianza estimadas para la superposición.

Se han desarrollado algoritmos basados ​​en rotaciones multidimensionales y cuaterniones modificados para identificar relaciones topológicas entre estructuras de proteínas sin la necesidad de una alineación predeterminada. Tales algoritmos han identificado con éxito pliegues canónicos como el paquete de cuatro hélices . El método SuperPose es lo suficientemente extensible para corregir las rotaciones de dominio relativas y otros errores estructurales.

Evaluar la similitud

A menudo, el propósito de buscar una superposición estructural no es tanto la superposición en sí misma, sino una evaluación de la similitud de dos estructuras o la confianza en una alineación remota. Una distinción sutil pero importante de la superposición estructural máxima es la conversión de una alineación en una puntuación de similitud significativa. La mayoría de los métodos generan algún tipo de "puntuación" que indica la calidad de la superposición. Sin embargo, lo que uno realmente quiere no es simplemente un "puntaje Z" estimado o un valor E estimado de ver la superposición observada por casualidad, sino que desea que el valor E estimado esté estrechamente correlacionado con el valor E verdadero. Críticamente, incluso si el valor E estimado de un método es precisamente correcto en promedio , si carece de una desviación estándar baja en su proceso de generación de valor estimado, entonces el orden de clasificación de las similitudes relativas de una proteína de consulta con un conjunto de comparación rara vez estará de acuerdo con el "verdadero" orden.

Los diferentes métodos superpondrán diferentes números de residuos porque utilizan diferentes garantías de calidad y diferentes definiciones de "superposición"; algunos solo incluyen residuos que cumplen múltiples criterios de superposición local y global y otros son más codiciosos, flexibles y promiscuos. Un mayor número de átomos superpuestos puede significar más similitud, pero puede que no siempre produzca el mejor valor E cuantificando la improbabilidad de la superposición y, por lo tanto, no es tan útil para evaluar la similitud, especialmente en homólogos remotos.

Complejidad algorítmica

Solucion optima

Se ha demostrado que el " enhebrado " óptimo de una secuencia de proteína en una estructura conocida y la producción de un alineamiento de secuencia múltiple óptimo es NP-completo . Sin embargo, esto no implica que el problema de alineación estructural sea NP-completo. Estrictamente hablando, una solución óptima al problema de alineación de la estructura de la proteína solo se conoce para ciertas medidas de similitud de la estructura de la proteína, como las medidas utilizadas en los experimentos de predicción de la estructura de la proteína, GDT_TS y MaxSub. Estas medidas se pueden optimizar rigurosamente utilizando un algoritmo capaz de maximizar el número de átomos en dos proteínas que se pueden superponer bajo un límite de distancia predefinido. Desafortunadamente, el algoritmo para la solución óptima no es práctico, ya que su tiempo de ejecución depende no solo de las longitudes sino también de la geometría intrínseca de las proteínas de entrada.

Solución aproximada

Se han desarrollado algoritmos de tiempo polinómico aproximado para la alineación estructural que producen una familia de soluciones "óptimas" dentro de un parámetro de aproximación para una función de puntuación dada. Aunque estos algoritmos clasifican teóricamente el problema de alineación de la estructura de la proteína aproximada como "manejable", siguen siendo computacionalmente demasiado caros para el análisis de la estructura de la proteína a gran escala. Como consecuencia, no existen algoritmos prácticos que converjan a las soluciones globales de la alineación, dada una función de puntuación. La mayoría de los algoritmos son, por lo tanto, heurísticos, pero se han desarrollado algoritmos que garantizan la convergencia al menos a los maximizadores locales de las funciones de puntuación y que son prácticos.

Representación de estructuras

Las estructuras de proteínas deben estar representadas en algún espacio independiente de coordenadas para que sean comparables. Esto se logra típicamente mediante la construcción de una matriz secuencia a secuencia o una serie de matrices que abarcan métricas comparativas: en lugar de distancias absolutas relativas a un espacio de coordenadas fijas. Una representación intuitiva es la matriz de distancia , que es una matriz bidimensional que contiene todas las distancias por pares entre algún subconjunto de átomos en cada estructura (como los carbonos alfa ). La matriz aumenta en dimensionalidad a medida que aumenta el número de estructuras que deben alinearse simultáneamente. Reducir la proteína a una métrica gruesa, como elementos de estructura secundaria (SSE) o fragmentos estructurales, también puede producir alineaciones sensibles, a pesar de la pérdida de información de las distancias de descarte, ya que el ruido también se descarta. La elección de una representación para facilitar el cálculo es fundamental para desarrollar un mecanismo de alineación eficiente.

Métodos

Se han utilizado técnicas de alineación estructural para comparar estructuras individuales o conjuntos de estructuras, así como en la producción de bases de datos de comparación "de todos a todos" que miden la divergencia entre cada par de estructuras presentes en el Protein Data Bank (PDB). Estas bases de datos se utilizan para clasificar proteínas por su pliegue .

DALI

Ilustración de los vectores átomo a átomo calculados en SSAP. A partir de estos vectores se construiría una serie de diferencias de vectores, por ejemplo, entre (FA) en la Proteína 1 y (SI) en la Proteína 2. Las dos secuencias se trazan en las dos dimensiones de una matriz para formar una matriz de diferencia entre las dos proteínas. La programación dinámica se aplica a todas las posibles matrices de diferencias para construir una serie de rutas de alineación local óptimas que luego se suman para formar la matriz de resumen, en la que se realiza una segunda ronda de programación dinámica.

Un método de alineación estructural común y popular es el DALI, o método de alineación de matriz de distancia, que rompe las estructuras de entrada en fragmentos de hexapéptidos y calcula una matriz de distancia evaluando los patrones de contacto entre fragmentos sucesivos. Las características de la estructura secundaria que involucran residuos que son contiguos en secuencia aparecen en la diagonal principal de la matriz ; otras diagonales en la matriz reflejan contactos espaciales entre residuos que no están cerca unos de otros en la secuencia. Cuando estas diagonales son paralelas a la diagonal principal, las características que representan son paralelas; cuando son perpendiculares, sus características son antiparalelas. Esta representación requiere mucha memoria porque las características en la matriz cuadrada son simétricas (y por lo tanto redundantes) con respecto a la diagonal principal.

Cuando las matrices de distancia de dos proteínas comparten características iguales o similares en aproximadamente las mismas posiciones, se puede decir que tienen pliegues similares con bucles de longitud similar que conectan sus elementos de estructura secundaria. El proceso de alineación real de DALI requiere una búsqueda de similitudes después de que se construyen las matrices de distancia de las dos proteínas; esto se realiza normalmente a través de una serie de submatrices superpuestas de tamaño 6x6. Luego, las coincidencias de submatrices se vuelven a ensamblar en una alineación final a través de un algoritmo estándar de maximización de puntajes: la versión original de DALI utilizó una simulación de Monte Carlo para maximizar una puntuación de similitud estructural que es una función de las distancias entre los átomos correspondientes putativos. En particular, los átomos más distantes dentro de las características correspondientes se reducen exponencialmente para reducir los efectos del ruido introducido por la movilidad del bucle, las torsiones helicoidales y otras variaciones estructurales menores. Debido a que DALI se basa en una matriz de distancia de todos a todos, puede tener en cuenta la posibilidad de que las características alineadas estructuralmente puedan aparecer en diferentes órdenes dentro de las dos secuencias que se comparan.

El método DALI también se ha utilizado para construir una base de datos conocida como FSSP (clasificación de pliegues basada en la alineación estructura-estructura de proteínas, o familias de proteínas estructuralmente similares) en la que todas las estructuras proteicas conocidas se alinean entre sí para determinar sus vecinos estructurales y clasificación de pliegues. Existe una base de datos de búsqueda basada en DALI, así como un programa descargable y búsqueda web basada en una versión independiente conocida como DaliLite.

Extensión combinatoria

El método de extensión combinatoria (CE) es similar a DALI en que también divide cada estructura en el conjunto de consultas en una serie de fragmentos que luego intenta reensamblar en una alineación completa. Una serie de combinaciones por pares de fragmentos llamados pares de fragmentos alineados, o AFP, se utilizan para definir una matriz de similitud a través de la cual se genera una ruta óptima para identificar la alineación final. Solo las AFP que cumplen determinados criterios de similitud local se incluyen en la matriz como un medio para reducir el espacio de búsqueda necesario y, por lo tanto, aumentar la eficiencia. Son posibles varias métricas de similitud; La definición original del método CE incluía solo superposiciones estructurales y distancias entre residuos, pero desde entonces se ha ampliado para incluir propiedades ambientales locales como estructura secundaria, exposición a disolventes, patrones de enlaces de hidrógeno y ángulos diedros .

Una ruta de alineación se calcula como la ruta óptima a través de la matriz de similitud progresando linealmente a través de las secuencias y extendiendo la alineación con el siguiente par de AFP de alta puntuación posible. El par de AFP inicial que nuclea el alineamiento puede ocurrir en cualquier punto de la matriz de secuencia. Luego, las extensiones continúan con el siguiente AFP que cumpla con los criterios de distancia dados que restringen la alineación a tamaños de espacio bajos. El tamaño de cada AFP y el tamaño máximo de la brecha son parámetros de entrada obligatorios, pero generalmente se establecen en valores determinados empíricamente de 8 y 30 respectivamente. Al igual que DALI y SSAP, CE se ha utilizado para construir una base de datos de clasificación completa a partir de las estructuras proteicas conocidas en el PDB.

El RCSB AP ha publicado recientemente una versión actualizada de la CE, Mammoth, y FATCAT como parte de la proteína RCSB AP Herramienta de comparación . Proporciona una nueva variación de CE que puede detectar permutaciones circulares en estructuras de proteínas.

Mamut

MAMMOTH aborda el problema de la alineación desde un objetivo diferente al de casi todos los demás métodos. En lugar de intentar encontrar un alineamiento que superponga al máximo el mayor número de residuos, busca el subconjunto del alineamiento estructural con menos probabilidades de ocurrir por casualidad. Para hacer esto, marca una alineación de motivo local con banderas para indicar qué residuos satisfacen simultáneamente criterios más estrictos: 1) Superposición de la estructura local 2) Estructura secundaria regular 3) Superposición 3D 4) El mismo orden en la secuencia primaria. Convierte las estadísticas del número de residuos con coincidencias de alta confianza y el tamaño de la proteína para calcular un valor de expectativa para el resultado por azar. Sobresale en hacer coincidir homólogos remotos, particularmente estructuras generadas por predicción de estructura ab initio para familias de estructuras como SCOP, porque enfatiza la extracción de una subalineación estadísticamente confiable y no en lograr la alineación de secuencia máxima o la superposición 3D máxima.

Para cada ventana superpuesta de 7 residuos consecutivos, calcula el conjunto de vectores unitarios de dirección de desplazamiento entre residuos C-alfa adyacentes. Los motivos locales de todos contra todos se comparan en función de la puntuación URMS. Estos valores se convierten en las entradas de puntuación de alineación de pares para la programación dinámica que produce una alineación de residuos por pares de semillas. La segunda fase utiliza un algoritmo MaxSub modificado: se utiliza un solo par alineado de 7 residencias en cada proteína para orientar las dos estructuras de proteínas de longitud completa para superponer al máximo estas solo estas 7 C-alfa, luego en esta orientación busca pares alineados adicionales que están cerca en 3D. Reorienta las estructuras para superponer este conjunto expandido e itera hasta que no coincidan más pares en 3D. Este proceso se reinicia por cada ventana de 7 residuos en la alineación de semillas. La salida es el número máximo de átomos encontrados en cualquiera de estas semillas iniciales. Esta estadística se convierte en un valor E calibrado para la similitud de las proteínas.

Mammoth no intenta repetir la alineación inicial ni extender el subconjunto de alta calidad. Por lo tanto, la alineación de semillas que muestra no se puede comparar de manera justa con la alineación DALI o TM, ya que se formó simplemente como una heurística para podar el espacio de búsqueda. (Se puede usar si se desea una alineación basada únicamente en la similitud de estructura-motivo local agnóstica de alineación atómica de cuerpo rígido de largo alcance). Debido a esa misma parsimonia, es más de diez veces más rápida que DALI, CE y TM-align. A menudo se usa junto con estas herramientas más lentas para preseleccionar grandes bases de datos para extraer las mejores estructuras relacionadas con el valor E para una superposición más exhaustiva o cálculos costosos.

Ha sido particularmente exitoso en el análisis de estructuras "señuelo" a partir de la predicción de estructuras ab initio. Estos señuelos son conocidos por conseguir que la estructura del motivo del fragmento local sea correcta y por formar algunos núcleos de la estructura terciaria 3D correcta, pero por obtener la estructura terciaria de longitud completa de forma incorrecta. En este régimen de homología remota crepuscular, se ha demostrado que los valores e de Mammoth para la evaluación de predicción de la estructura de la proteína CASP están significativamente más correlacionados con la clasificación humana que SSAP o DALI. La capacidad de los mamuts para extraer las superposiciones parciales de varios criterios con proteínas de estructura conocida y clasificarlas con valores E adecuados, combinada con su velocidad, facilita el escaneo de un gran número de modelos de señuelos contra la base de datos de PDB para identificar los señuelos correctos más probables en función de sus características. homología remota con proteínas conocidas.

SSAP

El método SSAP (Sequential Structure Alignment Program) utiliza una doble programación dinámica para producir una alineación estructural basada en vectores átomo a átomo en el espacio de la estructura. En lugar de los carbonos alfa que se utilizan normalmente en la alineación estructural, SSAP construye sus vectores a partir de los carbonos beta para todos los residuos excepto la glicina, un método que, por tanto, tiene en cuenta el estado rotamérico de cada residuo, así como su ubicación a lo largo de la columna vertebral. SSAP funciona construyendo primero una serie de vectores de distancia entre residuos entre cada residuo y sus vecinos no contiguos más cercanos en cada proteína. Luego se construye una serie de matrices que contienen las diferencias de vectores entre vecinos para cada par de residuos para los que se construyeron vectores. La programación dinámica aplicada a cada matriz resultante determina una serie de alineaciones locales óptimas que luego se suman en una matriz de "resumen" a la que se aplica de nuevo la programación dinámica para determinar la alineación estructural general.

SSAP originalmente produjo solo alineaciones por pares, pero desde entonces también se ha extendido a múltiples alineaciones. Se ha aplicado de manera integral para producir un esquema de clasificación de pliegues jerárquicos conocido como CATH (clase, arquitectura, topología, homología), que se ha utilizado para construir la base de datos de clasificación de estructura de proteínas CATH .

Desarrollos recientes

Las mejoras en los métodos de alineación estructural constituyen un área activa de investigación y, a menudo, se proponen métodos nuevos o modificados que, según se afirma, ofrecen ventajas sobre las técnicas más antiguas y más ampliamente distribuidas. Un ejemplo reciente, TM-align, utiliza un método novedoso para ponderar su matriz de distancias, al que luego se aplica la programación dinámica estándar . Se propone la ponderación para acelerar la convergencia de la programación dinámica y corregir los efectos que surgen de las longitudes de alineación. En un estudio de evaluación comparativa, se ha informado que TM-align mejora tanto en velocidad como en precisión sobre DALI y CE.

Otros métodos prometedores de alineación estructural son los métodos de alineación estructural local. Estos proporcionan una comparación de partes preseleccionadas de proteínas (por ejemplo, sitios de unión, motivos estructurales definidos por el usuario) con sitios de unión o bases de datos estructurales de proteínas completas. Los servidores MultiBind y MAPPIS permiten la identificación de arreglos espaciales comunes de propiedades fisicoquímicas tales como donante de enlace H, aceptor, alifático, aromático o hidrofóbico en un conjunto de sitios de unión de proteínas proporcionados por el usuario definidos por interacciones con moléculas pequeñas (MultiBind) o en un conjunto de interfaces proteína-proteína proporcionadas por el usuario (MAPPIS). Otros proporcionan una comparación de estructuras de proteínas completas con una serie de estructuras enviadas por el usuario o con una gran base de datos de estructuras de proteínas en un tiempo razonable ( ProBiS ). A diferencia de los enfoques de alineación global, los enfoques de alineación estructural local son adecuados para la detección de patrones de grupos funcionales conservados localmente, que a menudo aparecen en los sitios de unión y tienen una participación significativa en la unión del ligando. Como ejemplo, comparando G-Losa, una herramienta de alineación de estructura local, con TM-align, un método basado en alineación de estructura global. Si bien G-Losa predice las posiciones de ligandos similares a fármacos en dianas de proteínas de cadena única con mayor precisión que TM-align, la tasa de éxito general de TM-align es mejor.

Sin embargo, a medida que las mejoras algorítmicas y el rendimiento de la computadora han eliminado las deficiencias puramente técnicas en los enfoques más antiguos, ha quedado claro que no existe un criterio universal para la alineación estructural "óptima". TM-align, por ejemplo, es particularmente robusto en la cuantificación de comparaciones entre conjuntos de proteínas con grandes disparidades en las longitudes de secuencia, pero solo captura indirectamente el enlace de hidrógeno o la conservación del orden de la estructura secundaria, que podrían ser mejores métricas para la alineación de proteínas relacionadas evolutivamente. Por lo tanto, los desarrollos recientes se han centrado en optimizar atributos particulares como la velocidad, la cuantificación de puntajes, la correlación con patrones de oro alternativos o la tolerancia a la imperfección en datos estructurales o modelos estructurales ab initio. Una metodología alternativa que está ganando popularidad es utilizar el consenso de varios métodos para determinar las similitudes estructurales de las proteínas.

Alineación estructural de ARN

Las técnicas de alineación estructural se han aplicado tradicionalmente exclusivamente a las proteínas, como las macromoléculas biológicas primarias que asumen estructuras tridimensionales características. Sin embargo, las moléculas de ARN grandes también forman estructuras terciarias características , que están mediadas principalmente por enlaces de hidrógeno formados entre pares de bases , así como por apilamiento de bases . Las moléculas de ARN no codificantes funcionalmente similares pueden ser especialmente difíciles de extraer de los datos genómicos porque la estructura está más fuertemente conservada que la secuencia en el ARN, así como en las proteínas, y el alfabeto más limitado de ARN disminuye el contenido de información de cualquier nucleótido dado en cualquier posición dada.

Sin embargo, debido al creciente interés en las estructuras de ARN y debido al crecimiento del número de estructuras de ARN 3D determinadas experimentalmente, recientemente se han desarrollado pocos métodos de similitud de estructuras de ARN. Uno de esos métodos es, por ejemplo, SETTER que descompone cada estructura de ARN en partes más pequeñas llamadas unidades de estructura secundaria general (GSSU). Las GSSU se alinean posteriormente y estas alineaciones parciales se fusionan en la alineación final de la estructura del ARN y se puntúan. El método se ha implementado en el servidor web SETTER .

Se ha publicado e implementado en el programa FOLDALIGN un método reciente para el alineamiento estructural por pares de secuencias de ARN con baja identidad de secuencia . Sin embargo, este método no es realmente análogo a las técnicas de alineación estructural de proteínas porque predice computacionalmente las estructuras de las secuencias de entrada de ARN en lugar de requerir estructuras determinadas experimentalmente como entrada. Aunque la predicción computacional del proceso de plegamiento de proteínas no ha sido particularmente exitosa hasta la fecha, las estructuras de ARN sin pseudonudos a menudo se pueden predecir de manera sensata utilizando métodos de puntuación basados ​​en energía libre que tienen en cuenta el emparejamiento y el apilamiento de bases.

Software

La elección de una herramienta de software para la alineación estructural puede ser un desafío debido a la gran variedad de paquetes disponibles que difieren significativamente en metodología y confiabilidad. Se presentó una solución parcial a este problema y se hizo accesible al público a través del servidor web ProCKSI. Puede encontrar una lista más completa del software de alineación estructural disponible actualmente y distribuido libremente en el software de alineación estructural .

Las propiedades de algunos servidores de alineación estructural y paquetes de software se resumen y prueban con ejemplos en Structural Alignment Tools en Proteopedia.Org .

Ver también

Referencias

Otras lecturas