Propagación de la incertidumbre - Propagation of uncertainty

En estadística , la propagación de la incertidumbre (o propagación del error ) es el efecto de las incertidumbres de las variables (o errores , más específicamente errores aleatorios ) sobre la incertidumbre de una función basada en ellas. Cuando las variables son los valores de mediciones experimentales, tienen incertidumbres debido a limitaciones de medición (por ejemplo, precisión del instrumento ) que se propagan debido a la combinación de variables en la función.

La incertidumbre u se puede expresar de varias formas. Puede estar definido por el error absoluto Δ x . Las incertidumbres también se pueden definir por el error relativo x ) / x , que generalmente se escribe como un porcentaje. Más comúnmente, la incertidumbre sobre una cantidad se cuantifica en términos de la desviación estándar , σ , que es la raíz cuadrada positiva de la varianza . El valor de una cantidad y su error se expresan luego como un intervalo x ± u . Si se conoce o puede asumirse la distribución de probabilidad estadística de la variable, es posible derivar límites de confianza para describir la región dentro de la cual se puede encontrar el valor real de la variable. Por ejemplo, los límites de confianza del 68% para una variable unidimensional que pertenece a una distribución normal son aproximadamente ± una desviación estándar σ del valor central x , lo que significa que la región x ± σ cubrirá el valor verdadero en aproximadamente el 68% de casos.

Si las incertidumbres están correlacionadas, se debe tener en cuenta la covarianza . La correlación puede surgir de dos fuentes diferentes. Primero, los errores de medición pueden estar correlacionados. En segundo lugar, cuando los valores subyacentes se correlacionan en una población, las incertidumbres en los promedios del grupo estarán correlacionadas.

Combinaciones lineales

Sea un conjunto de m funciones, que son combinaciones lineales de variables con coeficientes de combinación :

o en notación matricial,

Además , denote la matriz de varianza-covarianza de x  = ( x 1 , ...,  x n ) y denote el valor medio por :

es el producto exterior .

Entonces, la matriz de varianza-covarianza de f viene dada por

En notación de componentes, la ecuación

lee

Ésta es la expresión más general para la propagación del error de un conjunto de variables a otro. Cuando los errores en x no están correlacionados, la expresión general se simplifica a

donde es la varianza del k -ésimo elemento del vector x . Tenga en cuenta que aunque los errores en x pueden no estar correlacionados, los errores en f en general están correlacionados; en otras palabras, incluso si es una matriz diagonal, en general es una matriz completa.

Las expresiones generales para una función f con valores escalares son un poco más simples (aquí a es un vector de fila):

Cada término de covarianza se puede expresar en términos del coeficiente de correlación por , de modo que una expresión alternativa para la varianza de f es

En el caso de que las variables en x no estén correlacionadas, esto se simplifica aún más a

En el caso simple de coeficientes y varianzas idénticos, encontramos

Para la media aritmética , el resultado es el error estándar de la media :

Combinaciones no lineales

Cuando f es un conjunto de combinaciones no lineales de las variables x , se podría realizar una propagación de intervalo para calcular los intervalos que contienen todos los valores consistentes para las variables. En un enfoque probabilístico, la función f generalmente debe linealizarse por aproximación a una expansión de la serie de Taylor de primer orden , aunque en algunos casos, se pueden derivar fórmulas exactas que no dependen de la expansión como es el caso de la varianza exacta de los productos. . La expansión de Taylor sería:

donde denota la derivada parcial de f k con respecto a la i -ésima variable, evaluada al valor medio de todos los componentes del vector x . O en notación matricial ,

donde J es la matriz jacobiana . Dado que f 0 es una constante, no contribuye al error en f. Por lo tanto, la propagación del error sigue el caso lineal anterior, pero reemplazando los coeficientes lineales, A ki y A kj por las derivadas parciales, y . En notación matricial,

Es decir, el jacobiano de la función se usa para transformar las filas y columnas de la matriz de varianza-covarianza del argumento. Tenga en cuenta que esto es equivalente a la expresión matricial para el caso lineal con .

Simplificación

Descuidar las correlaciones o asumir variables independientes produce una fórmula común entre ingenieros y científicos experimentales para calcular la propagación del error, la fórmula de la varianza:

donde representa la desviación estándar de la función , representa la desviación estándar de , representa la desviación estándar de , etc.

Es importante señalar que esta fórmula se basa en las características lineales del gradiente de y, por lo tanto, es una buena estimación para la desviación estándar de siempre que sean lo suficientemente pequeñas. Específicamente, la aproximación lineal de tiene que estar cerca del interior de una vecindad de radio .

Ejemplo

Cualquier función diferenciable no lineal`` de dos variables, y , se puede expandir como

por eso:

donde es la desviación estándar de la función , es la desviación estándar de , es la desviación estándar de y es la covarianza entre y .

En el caso particular de que , . Luego

o

donde es la correlación entre y .

Cuando las variables y no están correlacionadas, . Luego

Advertencias y advertencias

Las estimaciones de error para funciones no lineales están sesgadas debido al uso de una expansión en serie truncada. El alcance de este sesgo depende de la naturaleza de la función. Por ejemplo, el sesgo en el error calculado para log (1+ x ) aumenta a medida que aumenta x , ya que la expansión ax es una buena aproximación solo cuando x está cerca de cero.

Para funciones altamente no lineales, existen cinco categorías de enfoques probabilísticos para la propagación de la incertidumbre; consulte Cuantificación de la incertidumbre § Metodologías para la propagación de la incertidumbre hacia adelante para obtener más detalles.

Recíproco y recíproco desplazado

En el caso especial de la inversa o recíproca , donde sigue una distribución normal estándar , la distribución resultante es una distribución normal estándar recíproca y no hay varianza definible.

Sin embargo, en el caso un poco más general de una función recíproca desplazada para seguir una distribución normal general, entonces las estadísticas de media y varianza existen en un sentido de valor principal , si la diferencia entre el polo y la media tiene un valor real.

Ratios

Las proporciones también son problemáticas; existen aproximaciones normales bajo ciertas condiciones.

Fórmulas de ejemplo

Esta tabla muestra las varianzas y desviaciones estándar de funciones simples de las variables reales , con desviaciones estándar , covarianza y correlación . Los coeficientes de valores reales- a y b se supone exactamente conocida (determinista), es decir, .

En las columnas "Varianza" y "Desviación estándar", A y B deben entenderse como valores esperados (es decir, valores alrededor de los cuales estamos estimando la incertidumbre), y deben entenderse como el valor de la función calculada al valor esperado de .

Función Diferencia Desviación Estándar

Para variables no correlacionadas ( , ) se pueden derivar expresiones para funciones más complicadas combinando funciones más simples. Por ejemplo, la multiplicación repetida, asumiendo que no hay correlación, da

Para el caso también tenemos la expresión de Goodman para la varianza exacta: para el caso no correlacionado es

y por tanto tenemos:

Efecto de la correlación sobre las diferencias

Si A y B no están correlacionados, su diferencia AB tendrá más varianza que cualquiera de ellos. Una correlación positiva creciente ( ) disminuirá la varianza de la diferencia, convergiendo a varianza cero para variables perfectamente correlacionadas con la misma varianza . Por otro lado, una correlación negativa ( ) aumentará aún más la varianza de la diferencia, en comparación con el caso no correlacionado.

Por ejemplo, la autostracción f = AA tiene varianza cero solo si la variable está perfectamente autocorrelacionada ( ). Si A no está correlacionado, , entonces la varianza de salida es el doble de la varianza de entrada, . Y si A está perfectamente anticorrelacionado, entonces la varianza de entrada se cuadriplica en la salida (observe para f = aA - aA en la tabla anterior).

Cálculos de ejemplo

Función de tangente inversa

Podemos calcular la propagación de la incertidumbre para la función de tangente inversa como un ejemplo del uso de derivadas parciales para propagar el error.

Definir

donde es la incertidumbre absoluta en nuestra medida de x . La derivada de f ( x ) con respecto ax es

Por lo tanto, nuestra incertidumbre propagada es

donde es la incertidumbre propagada absoluta.

Medida de resistencia

Una aplicación práctica es un experimento en el que se mide la corriente , I , y de voltaje , V , en un resistor con el fin de determinar la resistencia , R , utilizando la ley de Ohm , R = V / I .

Dadas las variables medidas con incertidumbres, I ± σ I y V ± σ V , y descuidando su posible correlación, la incertidumbre en la cantidad calculada, σ R , es:

Ver también

Referencias

Otras lecturas

enlaces externos