Causalidad de Granger - Granger causality

Cuando la serie de tiempo X Granger causa la serie de tiempo Y , los patrones en X se repiten aproximadamente en Y después de un lapso de tiempo (dos ejemplos se indican con flechas). Por lo tanto, los valores anteriores de X pueden ser utilizados para la predicción de valores futuros de Y .

La prueba de causalidad de Granger es una prueba de hipótesis estadística para determinar si una serie de tiempo es útil para pronosticar otra, propuesta por primera vez en 1969. Por lo general, las regresiones reflejan "meras" correlaciones , pero Clive Granger argumentó que la causalidad en economía podría probarse midiendo la capacidad para predecir los valores futuros de una serie de tiempo utilizando valores anteriores de otra serie de tiempo. Dado que la cuestión de la "causalidad verdadera" es profundamente filosófica, y debido a la falacia post hoc ergo propter hoc de suponer que una cosa que precede a otra puede usarse como prueba de causalidad, los econometristas afirman que la prueba de Granger solo encuentra "causalidad predictiva" . Usar el término "causalidad" solo es un nombre inapropiado, ya que la causalidad de Granger se describe mejor como "precedencia" o, como el propio Granger afirmó más tarde en 1977, "temporalmente relacionada". En lugar de probar si X causa Y, la causalidad de Granger prueba si X pronostica Y.

Una serie de tiempo X se dice que Granger-causa Y si se puede demostrar, por lo general a través de una serie de pruebas t y pruebas F en valores retardados de X (y con valores retardados de Y también incluido), que esos X valores proporcionan estadísticamente significativa información sobre los valores futuros de  Y .

Granger también enfatizó que algunos estudios que utilizan pruebas de "causalidad de Granger" en áreas fuera de la economía llegaron a conclusiones "ridículas". "Por supuesto, aparecieron muchos artículos ridículos", dijo en su conferencia del Nobel. Sin embargo, sigue siendo un método popular para el análisis de causalidad en series de tiempo debido a su simplicidad computacional. La definición original de causalidad de Granger no tiene en cuenta los efectos de confusión latentes y no captura las relaciones causales instantáneas y no lineales, aunque se han propuesto varias extensiones para abordar estos problemas.

Intuición

Decimos que una variable X que evoluciona con el tiempo de Granger-causa otra variable evolutiva Y si las predicciones del valor de Y basadas en sus propios valores pasados y en los valores pasados ​​de X son mejores que las predicciones de Y basadas sólo en los propios de Y valores pasados.

Principios subyacentes

Granger definió la relación de causalidad basándose en dos principios:

  1. La causa ocurre antes de su efecto.
  2. La causa tiene información única sobre los valores futuros de su efecto.

Dadas estas dos suposiciones acerca de la causalidad, Granger propuso para probar la siguiente hipótesis para la identificación de un efecto causal de en :

donde se refiere a la probabilidad, es un conjunto arbitrario no vacío, y y respectivamente denotan la información disponible a partir del tiempo en todo el universo, y la del universo modificado en el que se excluye. Si se acepta la hipótesis anterior, decimos que las causas de Granger .

Método

Si una serie de tiempo es un proceso estacionario , la prueba se realiza utilizando los valores de nivel de dos (o más) variables. Si las variables no son estacionarias, la prueba se realiza utilizando las primeras diferencias (o mayores). El número de rezagos que se incluirán generalmente se elige utilizando un criterio de información, como el criterio de información de Akaike o el criterio de información de Schwarz . Cualquier valor rezagado particular de una de las variables se retiene en la regresión si (1) es significativo según una prueba t, y (2) este y los otros valores rezagados de la variable agregan conjuntamente poder explicativo al modelo de acuerdo con una prueba F. Entonces, la hipótesis nula de que no hay causalidad de Granger no se rechaza si y solo si no se han retenido valores rezagados de una variable explicativa en la regresión.

En la práctica, se puede encontrar que ninguna variable de Granger causa la otra, o que cada una de las dos variables de Granger causa la otra.

Declaración matemática

Sean y y x series de tiempo estacionarias. Para probar la hipótesis nula de que x no causa Granger y , primero se encuentran los valores rezagados adecuados de y para incluir en una autorregresión univariante de y :

A continuación, se aumenta la autorregresión al incluir valores rezagados de x :

Uno retiene en esta regresión todos los valores rezagados de x que son individualmente significativos de acuerdo con sus estadísticos t, siempre que colectivamente agreguen poder explicativo a la regresión de acuerdo con una prueba F (cuya hipótesis nula no es el poder explicativo agregado conjuntamente por el x ' s). En la notación de la regresión aumentada anterior, p es la longitud de retraso más corta y q es la longitud de retraso más larga para la que el valor retrasado de x es significativo.

La hipótesis nula de que x no causa Granger y se acepta si y solo si no se retienen valores rezagados de x en la regresión.

Analisis multivariable

El análisis de causalidad multivariante de Granger generalmente se realiza ajustando un modelo vector autorregresivo (VAR) a la serie de tiempo. En particular, vamos a ser una serie temporal multivariante dimensional. La causalidad de Granger se realiza ajustando un modelo VAR con desfases de tiempo de la siguiente manera:

donde es un vector aleatorio gaussiano blanco y es una matriz para cada . Una serie de tiempo se denomina causa de Granger de otra serie de tiempo , si al menos uno de los elementos de es significativamente mayor que cero (en valor absoluto).

Prueba no paramétrica

Los métodos lineales anteriores son apropiados para probar la causalidad de Granger en la media. Sin embargo, no pueden detectar la causalidad de Granger en momentos superiores, por ejemplo, en la varianza. Las pruebas no paramétricas de causalidad de Granger están diseñadas para abordar este problema. La definición de causalidad de Granger en estas pruebas es general y no implica ningún supuesto de modelado, como un modelo lineal autorregresivo. Las pruebas no paramétricas de causalidad de Granger se pueden utilizar como herramientas de diagnóstico para construir mejores modelos paramétricos, incluidos momentos de orden superior y / o no linealidad.

Limitaciones

Como su nombre lo indica, la causalidad de Granger no es necesariamente una causalidad verdadera. De hecho, las pruebas de causalidad de Granger solo cumplen con la definición humeana de causalidad que identifica las relaciones causa-efecto con conjunciones constantes. Si tanto X como Y son impulsados ​​por un tercer proceso común con diferentes retrasos, es posible que aún no se rechace la hipótesis alternativa de la causalidad de Granger. Sin embargo, la manipulación de una de las variables no cambiaría la otra. De hecho, las pruebas de causalidad de Granger están diseñadas para manejar pares de variables y pueden producir resultados engañosos cuando la verdadera relación involucra tres o más variables. Habiendo dicho esto, se ha argumentado que dada una visión probabilística de la causalidad, la causalidad de Granger puede considerarse causalidad verdadera en ese sentido, especialmente cuando se toma en cuenta la noción de causalidad probabilística de Reichenbach de "filtración". Otras posibles fuentes de resultados de prueba erróneos son: (1) muestreo no suficientemente frecuente o demasiado frecuente, (2) relación causal no lineal, (3) no estacionariedad y no linealidad de series de tiempo y (4) existencia de expectativas racionales. Se puede aplicar una prueba similar que involucre más variables con la autorregresión vectorial . Recientemente se ha proporcionado un estudio matemático fundamental del mecanismo subyacente al método de Granger. Haciendo uso exclusivo de herramientas matemáticas (transformación de Fourier y cálculo diferencial), se ha encontrado que ni siquiera el requisito más básico subyacente a cualquier posible definición de causalidad se cumple con la prueba de causalidad de Granger: cualquier definición de causalidad debe referirse a la predicción de el futuro del pasado; en cambio, al invertir la serie de tiempo, se puede demostrar que Granger también permite "predecir" el pasado desde el futuro.

Extensiones

Se ha desarrollado un método para la causalidad de Granger que no es sensible a las desviaciones del supuesto de que el término de error se distribuye normalmente. Este método es especialmente útil en economía financiera, ya que muchas variables financieras no se distribuyen normalmente. Recientemente, se ha sugerido en la literatura la prueba de causalidad asimétrica para separar el impacto causal de los cambios positivos de los negativos. También está disponible una extensión de las pruebas de Granger (sin) causalidad a datos de panel. Una prueba de causalidad de Granger modificada basada en el tipo GARCH (heterocedasticidad condicional auto-regresiva generalizada) de modelos de series de tiempo con valores enteros está disponible en muchas áreas.

En neurociencia

Una creencia arraigada sobre la función neuronal sostenía que las diferentes áreas del cerebro eran específicas de la tarea; que la conectividad estructural local a un área determinada de alguna manera dictaba la función de esa pieza. Al recopilar el trabajo que se ha realizado durante muchos años, ha habido un cambio hacia un enfoque diferente, centrado en la red, para describir el flujo de información en el cerebro. La explicación de la función está comenzando a incluir el concepto de redes que existen en diferentes niveles y en diferentes lugares del cerebro. El comportamiento de estas redes puede describirse mediante procesos no deterministas que evolucionan a lo largo del tiempo. Es decir, dado el mismo estímulo de entrada, no obtendrá la misma salida de la red. La dinámica de estas redes se rige por probabilidades, por lo que las tratamos como procesos estocásticos (aleatorios) para poder capturar este tipo de dinámicas entre diferentes áreas del cerebro.

En el pasado se han explorado diferentes métodos para obtener alguna medida del flujo de información a partir de las actividades de activación de una neurona y su conjunto circundante, pero están limitados en el tipo de conclusiones que se pueden extraer y proporcionan poca información sobre el flujo direccional de información. , su tamaño de efecto y cómo puede cambiar con el tiempo. Recientemente, se ha aplicado la causalidad de Granger para abordar algunos de estos problemas con gran éxito. En pocas palabras, se examina cómo predecir mejor el futuro de una neurona: utilizando el conjunto completo o el conjunto completo, excepto una determinada neurona objetivo. Si la predicción empeora al excluir la neurona objetivo, entonces decimos que tiene una relación "g-causal" con la neurona actual.

Extensiones a modelos de procesos puntuales

Los métodos de causalidad de Granger anteriores solo podían operar con datos de valor continuo, por lo que el análisis de las grabaciones de trenes de picos neuronales implicaba transformaciones que, en última instancia, alteraron las propiedades estocásticas de los datos, alterando indirectamente la validez de las conclusiones que podrían extraerse de ellos. En 2011, sin embargo, se propuso un nuevo marco de causalidad de Granger de propósito general que podría operar directamente en cualquier modalidad, incluidos los trenes de picos neurales.

Los datos del tren de picos neuronales se pueden modelar como un proceso puntual . Un proceso puntual temporal es una serie temporal estocástica de eventos binarios que ocurre en tiempo continuo. Solo puede tomar dos valores en cada momento, indicando si un evento ha ocurrido realmente o no. Este tipo de representación de información con valores binarios se adapta a la actividad de las poblaciones neuronales porque el potencial de acción de una sola neurona tiene una forma de onda típica. De esta manera, lo que lleva la información real que sale de una neurona es la ocurrencia de un “pico”, así como el tiempo entre picos sucesivos. Usando este enfoque, uno podría abstraer el flujo de información en una red neuronal para que sean simplemente los tiempos de aumento para cada neurona a través de un período de observación. Un proceso puntual puede ser representado por el tiempo de los picos en sí, los tiempos de espera entre picos, usando un proceso de conteo o, si el tiempo está lo suficientemente discretizado para asegurar que en cada ventana solo un evento tiene la posibilidad de ocurrir, que es decir, un contenedor de tiempo solo puede contener un evento, como un conjunto de unos y ceros, muy similar al binario.

Uno de los tipos más simples de modelos de picos neurales es el proceso de Poisson . Sin embargo, esto está limitado porque no tiene memoria. No tiene en cuenta ningún historial de picos al calcular la probabilidad actual de disparo. Las neuronas, sin embargo, exhiben una dependencia histórica fundamental (biofísica) a través de sus períodos refractarios relativos y absolutos . Para abordar esto, se utiliza una función de intensidad condicional para representar la probabilidad de que una neurona se dispare, condicionada por su propia historia. La función de intensidad condicional expresa la probabilidad de disparo instantáneo y define implícitamente un modelo de probabilidad completo para el proceso puntual. Define una probabilidad por unidad de tiempo. Entonces, si esta unidad de tiempo se toma lo suficientemente pequeña como para garantizar que solo pueda ocurrir un pico en esa ventana de tiempo, entonces nuestra función de intensidad condicional especifica completamente la probabilidad de que una neurona dada se dispare en un tiempo determinado.

Ver también

Referencias

Otras lecturas