Observador estatal - State observer

En la teoría de control , un observador de estado o estimador de estado es un sistema que proporciona una estimación del estado interno de un sistema real dado, a partir de mediciones de la entrada y salida del sistema real. Por lo general, se implementa por computadora y proporciona la base de muchas aplicaciones prácticas.

Conocer el estado del sistema es necesario para resolver muchos problemas de teoría de control ; por ejemplo, estabilizar un sistema usando retroalimentación de estado . En la mayoría de los casos prácticos, el estado físico del sistema no se puede determinar mediante observación directa. En cambio, los efectos indirectos del estado interno se observan a través de las salidas del sistema. Un ejemplo simple es el de los vehículos en un túnel: las tasas y velocidades a las que los vehículos entran y salen del túnel se pueden observar directamente, pero el estado exacto dentro del túnel solo se puede estimar. Si un sistema es observable , es posible reconstruir completamente el estado del sistema a partir de sus mediciones de salida utilizando el observador de estado.

Modelo de observador típico

Diagrama de bloques de Luenberger Observer. La entrada de la ganancia del observador L es .

Los observadores lineales, de modo deslizante y cúbicos se encuentran entre varias estructuras de observador utilizadas para la estimación del estado de sistemas lineales. En las siguientes secciones se describe una estructura de observador lineal.

Caso de tiempo discreto

Se supone que el estado de un sistema de tiempo discreto físico invariante en el tiempo lineal satisface

donde, en el momento , es el estado de la planta; son sus entradas; y son sus salidas. Estas ecuaciones simplemente dicen que las salidas actuales de la planta y su estado futuro están determinados únicamente por sus estados actuales y las entradas actuales. (Aunque estas ecuaciones se expresan en términos de pasos de tiempo discretos , ecuaciones muy similares son válidas para sistemas continuos ). Si este sistema es observable, entonces la salida de la planta , puede usarse para dirigir el estado del observador de estado.

El modelo de observador del sistema físico generalmente se deriva de las ecuaciones anteriores. Se pueden incluir términos adicionales para asegurar que, al recibir sucesivos valores medidos de las entradas y salidas de la planta, el estado del modelo converja con el de la planta. En particular, la salida del observador puede restarse de la salida de la planta y luego multiplicarse por una matriz ; esto luego se agrega a las ecuaciones para el estado del observador para producir un llamado observador de Luenberger , definido por las ecuaciones siguientes. Tenga en cuenta que las variables de un observador de estado se denotan comúnmente con un "sombrero": y para distinguirlas de las variables de las ecuaciones satisfechas por el sistema físico.

El observador se llama asintóticamente estable si el error del observador converge a cero cuando . Para un observador de Luenberger, el error del observador satisface . Por tanto, el observador de Luenberger para este sistema de tiempo discreto es asintóticamente estable cuando la matriz tiene todos los valores propios dentro del círculo unitario.

Para fines de control, la salida del sistema del observador se retroalimenta a la entrada tanto del observador como de la planta a través de la matriz de ganancias .

Entonces, las ecuaciones del observador se convierten en:

o, más simplemente,

Debido al principio de separación , sabemos que podemos elegir y de forma independiente sin dañar la estabilidad general de los sistemas. Como regla general, los polos del observador generalmente se eligen para converger 10 veces más rápido que los polos del sistema .

Caso de tiempo continuo

El ejemplo anterior fue para un observador implementado en un sistema LTI de tiempo discreto. Sin embargo, el proceso es similar para el caso de tiempo continuo; las ganancias del observador se eligen para hacer que la dinámica del error de tiempo continuo converja a cero de forma asintótica (es decir, cuando es una matriz de Hurwitz ).

Para un sistema lineal de tiempo continuo

donde , el observador parece similar al caso de tiempo discreto descrito anteriormente:

.

El error del observador satisface la ecuación

.

Los valores propios de la matriz pueden elegirse arbitrariamente mediante la elección apropiada de la ganancia del observador cuando el par es observable, es decir , se cumple la condición de observabilidad . En particular, se puede hacer Hurwitz, por lo que el error del observador cuando .

Picos y otros métodos de observación

Cuando la ganancia del observador es alta, el observador lineal de Luenberger converge a los estados del sistema muy rápidamente. Sin embargo, una alta ganancia del observador conduce a un fenómeno de pico en el que el error inicial del estimador puede ser prohibitivamente grande (es decir, poco práctico o inseguro de usar). Como consecuencia, se encuentran disponibles métodos de observación no lineales de alta ganancia que convergen rápidamente sin el fenómeno de pico. Por ejemplo, el control de modo deslizante se puede utilizar para diseñar un observador que lleve el error de un estado estimado a cero en un tiempo finito incluso en presencia de un error de medición; los otros estados tienen un error que se comporta de manera similar al error en un observador de Luenberger después de que el pico ha disminuido. Los observadores de modo deslizante también tienen atractivas propiedades de resistencia al ruido que son similares a un filtro de Kalman . Otro enfoque consiste en aplicar un observador múltiple, que mejora significativamente los transitorios y reduce el sobreimpulso del observador. El observador múltiple se puede adaptar a todos los sistemas en los que se aplique el observador de alta ganancia.

Observadores estatales de sistemas no lineales

Los observadores de alta ganancia, modo deslizante y extendidos son los observadores más comunes para sistemas no lineales. Para ilustrar la aplicación de observadores de modo deslizante para sistemas no lineales, primero considere el sistema no lineal sin entrada:

donde . Suponga también que hay un resultado medible dado por

Hay varios enfoques no aproximados para diseñar un observador. Los dos observadores que se dan a continuación también se aplican al caso en el que el sistema tiene una entrada. Es decir,

Dinámica de error linealizable

Una sugerencia de Krener e Isidori y Krener y Respondek se puede aplicar en una situación en la que existe una transformación linealizante (es decir, un difeomorfismo , como el que se usa en la linealización por retroalimentación ) tal que en las nuevas variables las ecuaciones del sistema se leen

El observador de Luenberger se diseña entonces como

.

El error del observador para la variable transformada satisface la misma ecuación que en el caso lineal clásico.

.

Como lo muestran Gauthier, Hammouri y Othman y Hammouri y Kinnaert, si existe una transformación tal que el sistema pueda transformarse en la forma

entonces el observador está diseñado como

,

donde es una ganancia de observador variable en el tiempo.

Ciccarella, Dalla Mora y Germani obtuvieron resultados más avanzados y generales, eliminando la necesidad de una transformada no lineal y demostrando la convergencia asintótica global del estado estimado al estado verdadero utilizando solo supuestos simples sobre regularidad.

Observador en modo deslizante

Como se discutió para el caso lineal anterior, el fenómeno de pico presente en los observadores de Luenberger justifica el uso de un observador de modo deslizante . El observador de modo deslizante utiliza retroalimentación no lineal de alta ganancia para impulsar los estados estimados a una hipersuperficie donde no hay diferencia entre la salida estimada y la salida medida. La ganancia no lineal utilizada en el observador se implementa típicamente con una función de conmutación escalada, como el signum (es decir, sgn) del error de salida estimado - medido. Por lo tanto, debido a esta retroalimentación de alta ganancia, el campo vectorial del observador tiene un pliegue de modo que las trayectorias del observador se deslizan a lo largo de una curva donde la salida estimada coincide exactamente con la salida medida. Entonces, si el sistema es observable a partir de su salida, todos los estados del observador serán conducidos a los estados reales del sistema. Además, al utilizar el signo del error para impulsar al observador en modo deslizante, las trayectorias del observador se vuelven insensibles a muchas formas de ruido. Por lo tanto, algunos observadores de modo deslizante tienen propiedades atractivas similares al filtro de Kalman pero con una implementación más simple.

Como sugirió Drakunov, un observador de modo deslizante también puede diseñarse para una clase de sistemas no lineales. Dicho observador se puede escribir en términos de estimación de variable original y tiene la forma

dónde:

  • El vector extiende la función de signo escalar a las dimensiones. Es decir,
    para el vector .
  • El vector tiene componentes que son la función de salida y sus derivadas de Lie repetidas. En particular,
    donde es la i- ésima derivada de Lie de la función de salida a lo largo del campo vectorial (es decir, a lo largo de las trayectorias del sistema no lineal). En el caso especial donde el sistema no tiene entrada o tiene un grado relativo de n , es una colección de la salida y sus derivadas. Debido a que debe existir la inversa de la linealización jacobiana de para que este observador esté bien definido, se garantiza que la transformación será un difeomorfismo local .
  • La matriz diagonal de ganancias es tal que
    donde, para cada elemento, y lo suficientemente grande para garantizar la accesibilidad del modo deslizante.
  • El vector del observador es tal que
    donde aquí es la función de signo normal definida para escalares, y denota un "operador de valor equivalente" de una función discontinua en modo deslizante.

La idea se puede explicar brevemente de la siguiente manera. De acuerdo con la teoría de los modos de deslizamiento, para describir el comportamiento del sistema, una vez que se inicia el modo de deslizamiento, la función debe ser reemplazada por valores equivalentes (ver control equivalente en la teoría de modos de deslizamiento ). En la práctica, cambia (charla) con alta frecuencia con un componente lento igual al valor equivalente. La aplicación de un filtro de paso bajo apropiado para deshacerse del componente de alta frecuencia puede obtener el valor del control equivalente, que contiene más información sobre el estado del sistema estimado. El observador descrito anteriormente usa este método varias veces para obtener el estado del sistema no lineal idealmente en un tiempo finito.

El error de observación modificado se puede escribir en los estados transformados . En particular,

y entonces

Entonces:

  1. Siempre que , la primera fila de la dinámica de error , cumpla con las condiciones suficientes para ingresar al modo deslizante en un tiempo finito.
  2. A lo largo de la superficie, el control equivalente correspondiente será igual a , y así . Por lo tanto, siempre que la segunda fila de la dinámica de error , ingrese al modo deslizante en un tiempo finito.
  3. A lo largo de la superficie, el control equivalente correspondiente será igual a . Por lo tanto, siempre y cuando , el º fila de la dinámica de error, , entrará en el modo de deslizamiento en un tiempo finito.

Entonces, para ganancias suficientemente grandes , todos los estados estimados por el observador alcanzan los estados reales en un tiempo finito. De hecho, aumentar permite la convergencia en cualquier tiempo finito deseado siempre que cada función pueda estar acotada con certeza. Por lo tanto, el requisito de que el mapa sea ​​un difeomorfismo (es decir, que su linealización jacobiana sea ​​invertible) afirma que la convergencia de la salida estimada implica la convergencia del estado estimado. Es decir, el requisito es una condición de observabilidad.

En el caso del observador en modo deslizante para el sistema con la entrada, se necesitan condiciones adicionales para que el error de observación sea independiente de la entrada. Por ejemplo, que

no depende del tiempo. El observador es entonces

Observador múltiple

El observador múltiple extiende la estructura del observador de alta ganancia de un observador único a un observador múltiple, con muchos modelos trabajando simultáneamente. Tiene dos capas: la primera consta de varios observadores de alta ganancia con diferentes estados de estimación, y la segunda determina los pesos de importancia de los observadores de la primera capa. El algoritmo es sencillo de implementar y no contiene operaciones de riesgo como la diferenciación. La idea de múltiples modelos se aplicó previamente para obtener información en control adaptativo.

Suponga que el número de observadores de alta ganancia es igual a n +1

donde está el índice de observador. Los observadores de la primera capa tienen la misma ganancia pero difieren con el estado inicial . En la segunda capa de todo de los observadores se combinan en una para obtener la estimación de vector de estado único

donde están los factores de peso. Estos factores se modifican para proporcionar la estimación en la segunda capa y mejorar el proceso de observación.

Asumamos que

y

donde está algún vector que depende del error del observador .

Alguna transformación da como resultado un problema de regresión lineal

Esta fórmula da la posibilidad de estimar . Para construir colector de mapeo que necesitamos entre y ensurance que es calculable basándose en señales medibles. Lo primero es eliminar el fenómeno de estacionamiento por error del observador

.

Calcule la derivada de los tiempos para encontrar el mapeo m derivado a definido como

donde hay una constante de tiempo. Tenga en cuenta que los relés en ambos y sus integrales, por lo tanto, está fácilmente disponible en el sistema de control. Además, está especificado por la ley de estimación; y así prueba que lo múltiple es mensurable. En la segunda capa para se introduce como estimaciones de coeficientes. El error de mapeo se especifica como

donde . Si los coeficientes son iguales a , entonces el error de mapeo. Ahora es posible calcular a partir de la ecuación anterior y, por lo tanto, el fenómeno de pico se reduce gracias a las propiedades de la variedad. El mapeo creado brinda mucha flexibilidad en el proceso de estimación. Incluso es posible estimar el valor de en la segunda capa y calcular el estado .

Observadores limitantes

Los observadores de límite o intervalo constituyen una clase de observadores que proporcionan dos estimaciones del estado simultáneamente: una de las estimaciones proporciona un límite superior en el valor real del estado, mientras que el segundo proporciona un límite inferior. Entonces se sabe que el valor real del estado está siempre dentro de estas dos estimaciones.

Estos límites son muy importantes en aplicaciones prácticas, ya que permiten conocer en cada momento la precisión de la estimación.

Matemáticamente, se pueden usar dos observadores de Luenberger, si se selecciona correctamente, usando, por ejemplo, propiedades de sistemas positivos : uno para el límite superior (que asegura que converge a cero desde arriba cuando , en ausencia de ruido e incertidumbre ), y un límite inferior (que asegura que converge a cero desde abajo). Es decir, siempre

Ver también

Referencias

Referencias en línea
Referencias generales

enlaces externos