Control de aprendizaje automático - Machine learning control

El control de aprendizaje automático (MLC) es un subcampo del aprendizaje automático , el control inteligente y la teoría del control que resuelve problemas de control óptimo con métodos de aprendizaje automático . Las aplicaciones clave son sistemas no lineales complejos para los que los métodos de la teoría de control lineal no son aplicables.

Tipos de problemas y tareas

Comúnmente se encuentran cuatro tipos de problemas.

  • Identificación de parámetro de control: MLC se traduce en una identificación de parámetro si se da la estructura de la ley de control pero los parámetros son desconocidos. Un ejemplo es el algoritmo genético para optimizar los coeficientes de un controlador PID o el control óptimo en tiempo discreto.
  • Diseño de control como problema de regresión del primer tipo: MLC aproxima un mapeo no lineal general de las señales del sensor a los comandos de actuación, si las señales del sensor y el comando de actuación óptimo se conocen para cada estado. Un ejemplo es el cálculo de la retroalimentación del sensor a partir de una retroalimentación de estado completo conocida . Una red neuronal es una técnica comúnmente utilizada para esta tarea.
  • Diseño de control como problema de regresión del segundo tipo: MLC también puede identificar leyes de control arbitrarias no lineales que minimizan la función de costo de la planta. En este caso, no es necesario conocer ni un modelo, ni la estructura de la ley de control, ni el comando de actuación de optimización. La optimización se basa únicamente en el rendimiento del control (función de coste) medido en la planta. La programación genética es una poderosa técnica de regresión para este propósito.
  • Control del aprendizaje por refuerzo: la ley de control puede actualizarse continuamente sobre los cambios de desempeño medidos (recompensas) utilizando el aprendizaje por refuerzo .

MLC comprende, por ejemplo, control de redes neuronales, control basado en algoritmos genéticos, control de programación genética, control de aprendizaje por refuerzo y tiene superposiciones metodológicas con otros controles basados ​​en datos, como la inteligencia artificial y el control de robots .

Aplicaciones

MLC se ha aplicado con éxito a muchos problemas de control no lineal, explorando mecanismos de actuación desconocidos y a menudo inesperados. Las aplicaciones de ejemplo incluyen

  • Control de altitud de satélites.
  • Control térmico de edificios.
  • Control de turbulencia de retroalimentación.
  • Vehículo submarino operado a distancia.
  • Muchas más aplicaciones de ingeniería MLC se resumen en el artículo de revisión de PJ Fleming & RC Purshouse (2002).

Como para todos los métodos no lineales generales, MLC viene sin convergencia, optimización o robustez garantizadas para una variedad de condiciones de operación.

Referencias

Otras lecturas

  • Dimitris C Dracopoulos (agosto de 1997) "Algoritmos de aprendizaje evolutivo para el control adaptativo neuronal" , Springer. ISBN   978-3-540-76161-7 .
  • Thomas Duriez , Steven L. Brunton y Bernd R. Noack (noviembre de 2016) "Control de aprendizaje automático: domesticación de la dinámica no lineal y la turbulencia" , Springer. ISBN   978-3-319-40624-4 .