Variable aleatoria - Random variable

En probabilidad y estadística , una variable aleatoria , una cantidad aleatoria , una variable aleatoria o una variable estocástica se describe informalmente como una variable cuyos valores dependen de los resultados de un fenómeno aleatorio . El tratamiento matemático formal de las variables aleatorias es un tema de la teoría de la probabilidad . En ese contexto, una variable aleatoria se entiende como una función medible definida en un espacio de probabilidad que mapea desde el espacio muestral a los números reales .

Este gráfico muestra cómo la variable aleatoria es una función de todos los resultados posibles a valores reales. También muestra cómo se usa la variable aleatoria para definir funciones de masa de probabilidad.

Los posibles valores de una variable aleatoria pueden representar los posibles resultados de un experimento aún por realizar, o los posibles resultados de un experimento pasado cuyo valor ya existente es incierto (por ejemplo, debido a mediciones imprecisas o incertidumbre cuántica ). También pueden representar conceptualmente los resultados de un proceso aleatorio "objetivamente" (como lanzar un dado) o la aleatoriedad "subjetiva" que resulta del conocimiento incompleto de una cantidad. El significado de las probabilidades asignadas a los valores potenciales de una variable aleatoria no es parte de la teoría de la probabilidad en sí, sino que está relacionado con argumentos filosóficos sobre la interpretación de la probabilidad . Las matemáticas funcionan igual independientemente de la interpretación particular que se utilice.

Como función, se requiere que una variable aleatoria sea medible , lo que permite asignar probabilidades a conjuntos de sus valores potenciales. Es común que los resultados dependan de algunas variables físicas que no son predecibles. Por ejemplo, al lanzar una moneda justa, el resultado final de cara o cruz depende de las condiciones físicas inciertas, por lo que el resultado observado es incierto. La moneda podría quedar atrapada en una grieta en el piso, pero tal posibilidad no se considera.

El dominio de una variable aleatoria se denomina espacio muestral, definido como el conjunto de posibles resultados de un evento no determinista. Por ejemplo, en el caso de un lanzamiento de moneda, solo son posibles dos resultados posibles: cara o cruz.

Una variable aleatoria tiene una distribución de probabilidad , que especifica la probabilidad de subconjuntos de Borel de su rango. Las variables aleatorias pueden ser discretas , es decir, tomar cualquiera de una lista de valores finita o contable especificada (que tiene un rango contable), dotada de una función de masa de probabilidad que es característica de la distribución de probabilidad de la variable aleatoria; o continuo , tomando cualquier valor numérico en un intervalo o colección de intervalos (que tienen un rango incontable ), a través de una función de densidad de probabilidad que es característica de la distribución de probabilidad de la variable aleatoria; o una mezcla de ambos.

Dos variables aleatorias con la misma distribución de probabilidad aún pueden diferir en términos de sus asociaciones o independencia de otras variables aleatorias. Las realizaciones de una variable aleatoria, es decir, los resultados de la elección aleatoria de valores de acuerdo con la función de distribución de probabilidad de la variable, se denominan variables aleatorias .

Aunque la idea fue originalmente presentada por Christiaan Huygens , la primera persona en pensar sistemáticamente en términos de variables aleatorias fue Pafnuty Chebyshev .

Definición

Una variable aleatoria es una función medible de un conjunto de posibles resultados a un espacio medible . La definición axiomática técnica requiere ser un espacio muestral de un triple de probabilidad (ver la definición de la teoría de la medida ). Una variable aleatoria es a menudo denotado por el capital letras romanas tales como , , , .

La probabilidad que adquiere un valor en un conjunto medible se escribe como

Caso estándar

En muchos casos, tiene un valor real , es decir . En algunos contextos, el término elemento aleatorio (ver extensiones ) se usa para denotar una variable aleatoria que no tiene esta forma.

Cuando la imagen (o rango) de es contable , la variable aleatoria se llama variable aleatoria discreta y su distribución es una distribución de probabilidad discreta , es decir, puede describirse mediante una función de masa de probabilidad que asigna una probabilidad a cada valor en la imagen de . Si la imagen es incontablemente infinita (generalmente un intervalo ), entonces se llama variable aleatoria continua . En el caso especial de que sea absolutamente continuo , su distribución puede describirse mediante una función de densidad de probabilidad , que asigna probabilidades a los intervalos; en particular, cada punto individual debe tener necesariamente una probabilidad cero para una variable aleatoria absolutamente continua. No todas las variables aleatorias continuas son absolutamente continuas, una distribución de mezcla es uno de esos contraejemplos; tales variables aleatorias no pueden describirse mediante una densidad de probabilidad o una función de masa de probabilidad.

Cualquier variable aleatoria puede describirse por su función de distribución acumulativa , que describe la probabilidad de que la variable aleatoria sea menor o igual a un cierto valor.

Extensiones

El término "variable aleatoria" en estadística se limita tradicionalmente al caso de valor real ( ). En este caso, la estructura de los números reales permite definir cantidades como el valor esperado y la varianza de una variable aleatoria, su función de distribución acumulativa y los momentos de su distribución.

Sin embargo, la definición anterior es válida para cualquier espacio de valores medible . Por tanto, se pueden considerar elementos aleatorios de otros conjuntos , como valores booleanos aleatorios , valores categóricos , números complejos , vectores , matrices , secuencias , árboles , conjuntos , formas , variedades y funciones . Entonces, uno puede referirse específicamente a una variable aleatoria de tipo , o una variable aleatoria valorada .

Este concepto más general de un elemento aleatorio es particularmente útil en disciplinas como la teoría de grafos , el aprendizaje automático , el procesamiento del lenguaje natural y otros campos de las matemáticas discretas y la informática , donde a menudo uno está interesado en modelar la variación aleatoria de datos no numéricos . estructuras . En algunos casos, no obstante, es conveniente representar cada elemento de , utilizando uno o más números reales. En este caso, un elemento aleatorio puede representarse opcionalmente como un vector de variables aleatorias de valor real (todas definidas en el mismo espacio de probabilidad subyacente , lo que permite que las diferentes variables aleatorias covarien ). Por ejemplo:

  • Una palabra aleatoria se puede representar como un número entero aleatorio que sirve como índice del vocabulario de palabras posibles. Alternativamente, se puede representar como un vector indicador aleatorio, cuya longitud es igual al tamaño del vocabulario, donde los únicos valores de probabilidad positiva son , , y la posición de la 1 indica la palabra.
  • Una oración aleatoria de longitud determinada puede representarse como un vector de palabras aleatorias.
  • Un gráfico aleatorio en vértices dados puede representarse como una matriz de variables aleatorias, cuyos valores especifican la matriz de adyacencia del gráfico aleatorio.
  • Una función aleatoria se puede representar como una colección de variables aleatorias , dando los valores de la función en los diversos puntos del dominio de la función. El son variables aleatorias con valores reales ordinarios, siempre que la función es de valor real. Por ejemplo, un proceso estocástico es una función aleatoria del tiempo, un vector aleatorio es una función aleatoria de algún conjunto de índices como , y un campo aleatorio es una función aleatoria en cualquier conjunto (típicamente tiempo, espacio o un conjunto discreto).

Funciones de distribución

Si se da una variable aleatoria definida en el espacio de probabilidad , podemos hacer preguntas como "¿Qué tan probable es que el valor de sea ​​igual a 2?". Esta es la misma que la probabilidad del evento que a menudo se escribe como o para abreviar.

Al registrar todas estas probabilidades de rangos de salida de una variable aleatoria de valor real se obtiene la distribución de probabilidad de . La distribución de probabilidad "olvida" el espacio de probabilidad particular utilizado para definir y solo registra las probabilidades de varios valores de . Esta distribución de probabilidad siempre puede ser capturada por su función de distribución acumulativa.

y algunas veces también el uso de una función de densidad de probabilidad , . En compases teórico términos, utilizamos la variable aleatoria de "empujar hacia adelante" la medida en que una medida de . El espacio de probabilidad subyacente es un dispositivo técnico que se utiliza para garantizar la existencia de variables aleatorias, a veces para construirlas, y para definir nociones como correlación y dependencia o independencia a partir de una distribución conjunta de dos o más variables aleatorias en un mismo espacio de probabilidad. En la práctica, a menudo se elimina el espacio por completo y simplemente se coloca una medida que asigna la medida 1 a toda la línea real, es decir, se trabaja con distribuciones de probabilidad en lugar de variables aleatorias. Consulte el artículo sobre funciones cuantílicas para un desarrollo más completo.

Ejemplos de

Variable aleatoria discreta

En un experimento, se puede elegir una persona al azar y una variable aleatoria puede ser la altura de la persona. Matemáticamente, la variable aleatoria se interpreta como una función que asigna a la persona a su altura. Asociada con la variable aleatoria hay una distribución de probabilidad que permite calcular la probabilidad de que la altura esté en cualquier subconjunto de valores posibles, como la probabilidad de que la altura esté entre 180 y 190 cm, o la probabilidad de que la altura sea menor. de 150 o más de 200 cm.

Otra variable aleatoria puede ser el número de hijos de la persona; esta es una variable aleatoria discreta con valores enteros no negativos. Permite el cálculo de probabilidades para valores enteros individuales, la función de masa de probabilidad (PMF), o para conjuntos de valores, incluidos conjuntos infinitos. Por ejemplo, el evento de interés puede ser "un número par de niños". Tanto para conjuntos de eventos finitos como infinitos, sus probabilidades se pueden encontrar sumando los PMF de los elementos; es decir, la probabilidad de que haya un número par de hijos es la suma infinita .

En ejemplos como estos, el espacio muestral a menudo se suprime, ya que es matemáticamente difícil de describir, y los posibles valores de las variables aleatorias se tratan como un espacio muestral. Pero cuando se miden dos variables aleatorias en el mismo espacio muestral de resultados, como la altura y el número de niños que se calculan en las mismas personas aleatorias, es más fácil rastrear su relación si se reconoce que tanto la altura como el número de niños vienen de la misma persona aleatoria, por ejemplo, para que se puedan plantear preguntas sobre si tales variables aleatorias están correlacionadas o no.

Si son conjuntos contables de números reales y , entonces es una función de distribución discreta. Aquí para , para . Tomando, por ejemplo, una enumeración de todos los números racionales como , se obtiene una función de distribución discreta que no es una función escalonada o constante por partes.

Lanzamiento de la moneda

Los posibles resultados de un lanzamiento de moneda se pueden describir mediante el espacio muestral . Podemos introducir una variable aleatoria de valor real que modele un pago de $ 1 por una apuesta exitosa en cara de la siguiente manera:

Si la moneda es una moneda justa , Y tiene una función de masa de probabilidad dada por:

Tirada de dados

Si el espacio muestral es el conjunto de números posibles lanzados en dos dados, y la variable aleatoria de interés es la suma S de los números en los dos dados, entonces S es una variable aleatoria discreta cuya distribución se describe mediante la función de masa de probabilidad graficada como la altura de las columnas de la imagen aquí.

También se puede utilizar una variable aleatoria para describir el proceso de tirar los dados y los posibles resultados. La representación más obvia para el caso de dos dados es tomar el conjunto de pares de números n 1 y n 2 de {1, 2, 3, 4, 5, 6} (que representan los números en los dos dados) como muestra. espacio. El número total obtenido (la suma de los números en cada par) es entonces una variable aleatoria X dada por la función que asigna el par a la suma:

y (si los dados son justos ) tiene una función de masa de probabilidad ƒ X dada por:

Variable aleatoria continua

Formalmente, una variable aleatoria continua es una variable aleatoria cuya función de distribución acumulativa es continua en todas partes. No hay " huecos ", que corresponderían a números que tienen una probabilidad finita de ocurrir . En cambio, las variables aleatorias continuas casi nunca toman un valor prescrito exacto c (formalmente ) , pero existe una probabilidad positiva de que su valor se encuentre en intervalos particulares que pueden ser arbitrariamente pequeños . Las variables aleatorias continuas suelen admitir funciones de densidad de probabilidad (PDF), que caracterizan su CDF y medidas de probabilidad ; tales distribuciones también se denominan absolutamente continuas ; pero algunas distribuciones continuas son singulares o mezclas de una parte absolutamente continua y una parte singular.

Un ejemplo de una variable aleatoria continua sería una basada en una ruleta que puede elegir una dirección horizontal. Entonces los valores tomados por la variable aleatoria son direcciones. Podríamos representar estas direcciones por Norte, Oeste, Este, Sur, Sureste, etc. Sin embargo, comúnmente es más conveniente mapear el espacio muestral a una variable aleatoria que toma valores que son números reales. Esto se puede hacer, por ejemplo, asignando una dirección a un rumbo en grados en el sentido de las agujas del reloj desde el norte. La variable aleatoria toma valores que son números reales del intervalo [0, 360), siendo todas las partes del rango "igualmente probables". En este caso, X = el ángulo girado. Cualquier número real tiene probabilidad cero de ser seleccionado, pero se puede asignar una probabilidad positiva a cualquier rango de valores. Por ejemplo, la probabilidad de elegir un número en [0, 180] es 12 . En lugar de hablar de una función de masa de probabilidad, decimos que la densidad de probabilidad de X es 1/360. La probabilidad de un subconjunto de [0, 360) se puede calcular multiplicando la medida del conjunto por 1/360. En general, la probabilidad de un conjunto para una variable aleatoria continua dada se puede calcular integrando la densidad sobre el conjunto dado.

Más formalmente, dado cualquier intervalo , una variable aleatoria se denomina " variable aleatoria uniforme continua " (CURV) si la probabilidad de que tome un valor en un subintervalo depende sólo de la longitud del subintervalo. Esto implica que la probabilidad de caer en cualquier subintervalo es proporcional a la longitud del subintervalo, es decir, si acdb , se tiene

donde la última igualdad resulta del axioma de probabilidad unitario . La función de densidad de probabilidad de una CURV viene dada por la función indicadora de su intervalo de soporte normalizado por la longitud del intervalo:

De particular interés es la distribución uniforme en el intervalo unitario . Se pueden generar muestras de cualquier distribución de probabilidad deseada calculando la función de cuantiles de un número generado aleatoriamente distribuido uniformemente en el intervalo unitario. Esto explota las propiedades de las funciones de distribución acumulativa , que son un marco unificador para todas las variables aleatorias.

Tipo mixto

Una variable aleatoria mixta es una variable aleatoria cuya función de distribución acumulativa no es constante por partes (una variable aleatoria discreta) ni continua en todas partes . Puede realizarse como la suma de una variable aleatoria discreta y una variable aleatoria continua; en cuyo caso la CDF será el promedio ponderado de las CDF de las variables componentes.

Un ejemplo de una variable aleatoria de tipo mixto se basaría en un experimento en el que se lanza una moneda y se hace girar la ruleta solo si el resultado del lanzamiento de la moneda es cara. Si el resultado es cruz, X = −1; de lo contrario, X = el valor de la ruleta como en el ejemplo anterior. Existe una probabilidad de 12 de que esta variable aleatoria tenga el valor -1. Otros rangos de valores tendrían la mitad de las probabilidades del último ejemplo.

De manera más general, cada distribución de probabilidad en la línea real es una mezcla de parte discreta, parte singular y parte absolutamente continua; véase el teorema de descomposición de Lebesgue § Refinamiento . La parte discreta se concentra en un conjunto contable, pero este conjunto puede ser denso (como el conjunto de todos los números racionales).

Definición de la teoría de la medida

La definición axiomática más formal de una variable aleatoria involucra la teoría de la medida . Las variables aleatorias continuas se definen en términos de conjuntos de números, junto con funciones que asignan dichos conjuntos a probabilidades. Debido a varias dificultades (por ejemplo, la paradoja de Banach-Tarski ) que surgen si tales conjuntos no están suficientemente restringidos, es necesario introducir lo que se denomina un álgebra sigma para restringir los conjuntos posibles sobre los cuales se pueden definir probabilidades. Normalmente, se utiliza una sigma-álgebra en particular, la σ-álgebra de Borel , que permite definir probabilidades sobre cualquier conjunto que pueda derivarse directamente de intervalos continuos de números o mediante un número finito o numerablemente infinito de uniones y / o intersecciones de tales intervalos.

La definición de la teoría de medidas es la siguiente.

Sea un

espacio de probabilidad y un espacio medible . Entonces, una variable aleatoria valorada es una función medible , lo que significa que, para cada subconjunto , su preimagen es medible; , donde . Esta definición nos permite medir cualquier subconjunto en el espacio objetivo al observar su preimagen, que por supuesto es medible.

En términos más intuitivos, un miembro de es un resultado posible, un miembro de es un subconjunto medible de resultados posibles, la función da la probabilidad de cada subconjunto medible, representa el conjunto de valores que la variable aleatoria puede tomar (como el conjunto de números reales), y un miembro de es un subconjunto de "buen comportamiento" (medible) de (aquellos para los que se puede determinar la probabilidad). La variable aleatoria es entonces una función de cualquier resultado a una cantidad, de modo que los resultados que conducen a cualquier subconjunto útil de cantidades para la variable aleatoria tienen una probabilidad bien definida.

Cuando es un

espacio topológico , entonces la opción más común para el σ-álgebra es el σ-álgebra de Borel , que es el σ-álgebra generada por la colección de todos los conjuntos abiertos en . En tal caso, la variable aleatoria valorada se denomina variable aleatoria valorada . Además, cuando el espacio es la línea real , dicha variable aleatoria de valor real se denomina simplemente variable aleatoria .

Variables aleatorias de valor real

En este caso, el espacio de observación es el conjunto de números reales. Recuerde, es el espacio de probabilidad. Para un espacio de observación real, la función es una variable aleatoria de valor real si

Esta definición es un caso especial de lo anterior porque el conjunto genera el σ-álgebra de Borel sobre el conjunto de números reales, y es suficiente para verificar la mensurabilidad en cualquier conjunto generador. Aquí podemos probar la mensurabilidad en este grupo electrógeno utilizando el hecho de que .

Momentos

La distribución de probabilidad de una variable aleatoria se caracteriza a menudo por un pequeño número de parámetros, que también tienen una interpretación práctica. Por ejemplo, a menudo es suficiente saber cuál es su "valor medio". Esto es capturado por el concepto matemático de valor esperado de una variable aleatoria, denotado y también llamado

primer momento . En general, no es igual a . Una vez que se conoce el "valor promedio", uno podría preguntarse qué tan lejos de este valor promedio están los valores de típicamente, una pregunta que es respondida por la varianza y la desviación estándar de una variable aleatoria. puede verse intuitivamente como un promedio obtenido de una población infinita, cuyos miembros son evaluaciones particulares de .

Matemáticamente, esto se conoce como el problema (generalizado)

de los momentos : para una clase dada de variables aleatorias , encuentre una colección de funciones tal que los valores esperados caractericen completamente la distribución de la variable aleatoria .

Los momentos solo se pueden definir para funciones de valor real de variables aleatorias (o de valor complejo, etc.). Si la variable aleatoria en sí misma tiene un valor real, entonces se pueden tomar momentos de la propia variable, que son equivalentes a los momentos de la función identidad de la variable aleatoria. Sin embargo, incluso para las variables aleatorias de valor no real, se pueden tomar momentos de las funciones de valor real de esas variables. Por ejemplo, para una variable aleatoria

categórica X que puede tomar los valores nominales "rojo", "azul" o "verde", se puede construir la función de valor real ; esto usa el corchete Iverson , y tiene el valor 1 si tiene el valor "verde", 0 en caso contrario. Luego, se puede determinar el valor esperado y otros momentos de esta función.

Funciones de variables aleatorias

Se puede definir una nueva variable aleatoria Y aplicando una función medible de Borel real a los resultados de una variable aleatoria de

valor real . Es decir, . La función de distribución acumulativa de es entonces

Si la función es invertible (es decir, existe, donde es la

función inversa ) y aumenta o disminuye , entonces la relación anterior se puede extender para obtener

Con las mismas hipótesis de invertibilidad de , asumiendo también la

diferenciabilidad , la relación entre las funciones de densidad de probabilidad se puede encontrar diferenciando ambos lados de la expresión anterior con respecto a , para obtener

Si no hay invertibilidad de pero cada una admite como máximo un número contable de raíces (es decir, un número finito, o numerablemente infinito, de tales que ) entonces la relación anterior entre las

funciones de densidad de probabilidad se puede generalizar con

donde , de acuerdo con el

teorema de la función inversa . Las fórmulas para densidades no exigen ser crecientes.

En la medida teórica, enfoque axiomático a la probabilidad, si una variable aleatoria en y una

función medible Borel , a continuación, es también una variable aleatoria en , ya que la composición de funciones medibles también es medible . (Sin embargo, esto no es necesariamente cierto si Lebesgue es medible ). El mismo procedimiento que permitió pasar de un espacio de probabilidad a se puede utilizar para obtener la distribución de .

Ejemplo 1

Sea una

variable aleatoria continua de valor real y sea .

Si , entonces , entonces

Si entonces

asi que

Ejemplo 2

Supongamos que es una variable aleatoria con una distribución acumulativa

donde es un parámetro fijo. Considere la variable aleatoria Entonces,

La última expresión se puede calcular en términos de la distribución acumulada de por lo

que es la función de distribución acumulativa (CDF) de una distribución exponencial .

Ejemplo 3

Supongamos que es una variable aleatoria con una

distribución normal estándar , cuya densidad es

Considere la variable aleatoria Podemos encontrar la densidad usando la fórmula anterior para un cambio de variables:

En este caso, el cambio no es monótono , porque cada valor de tiene dos valores correspondientes de (uno positivo y uno negativo). Sin embargo, debido a la simetría, ambas mitades se transformarán de manera idéntica, es decir,

La transformación inversa es

y su derivada es

Luego,

Esta es una distribución chi-cuadrado con un grado de libertad .

Ejemplo 4

Supongamos que es una variable aleatoria con una

distribución normal , cuya densidad es

Considere la variable aleatoria Podemos encontrar la densidad usando la fórmula anterior para un cambio de variables:

En este caso, el cambio no es monótono , porque cada valor de tiene dos valores correspondientes de (uno positivo y uno negativo). A diferencia del ejemplo anterior, en este caso sin embargo, no hay simetría y tenemos que calcular los dos términos distintos:

La transformación inversa es

y su derivada es

Luego,

Esta es una distribución chi cuadrado no central con un grado de libertad .

Algunas propiedades

Equivalencia de variables aleatorias

Hay varios sentidos diferentes en los que las variables aleatorias pueden considerarse equivalentes. Dos variables aleatorias pueden ser iguales, casi con seguridad iguales o iguales en distribución.

En orden creciente de fuerza, la definición precisa de estas nociones de equivalencia se da a continuación.

Igualdad en la distribución

Si el espacio muestral es un subconjunto de la línea real, las variables aleatorias X e Y son iguales en distribución (denotadas ) si tienen las mismas funciones de distribución:

Para ser igual en la distribución, las variables aleatorias no necesitan definirse en el mismo espacio de probabilidad. Dos variables aleatorias que tienen funciones generadoras de momentos iguales tienen la misma distribución. Esto proporciona, por ejemplo, un método útil para verificar la igualdad de ciertas funciones de variables aleatorias independientes distribuidas de manera idéntica (IID) . Sin embargo, la función generadora de momentos existe solo para distribuciones que tienen una transformada de Laplace definida .

Casi segura igualdad

Dos variables aleatorias X e Y son

casi seguramente iguales (denotadas ) si, y solo si, la probabilidad de que sean diferentes es cero :

Para todos los propósitos prácticos de la teoría de la probabilidad, esta noción de equivalencia es tan fuerte como la igualdad real. Está asociado a la siguiente distancia:

donde "ess sup" representa el supremo esencial en el sentido de la teoría de la

medida .

Igualdad

Finalmente, las dos variables aleatorias X e Y son iguales si son iguales como funciones en su espacio medible:

Esta noción suele ser la menos útil en la teoría de la probabilidad porque, en la práctica y en la teoría, el espacio de

medida subyacente del experimento rara vez se caracteriza explícitamente o incluso se caracteriza.

Convergencia

Un tema significativo en estadística matemática consiste en obtener resultados de convergencia para ciertas secuencias de variables aleatorias; por ejemplo, la ley de los grandes números y el teorema del límite central .

Hay varios sentidos en los que una secuencia de variables aleatorias puede converger en una variable aleatoria . Estos se explican en el artículo sobre

convergencia de variables aleatorias .

Ver también

Referencias

Citas en línea

Literatura

enlaces externos