Logit - Logit

Gráfica de logit ( p ) en el dominio de 0 a 1, donde la base del logaritmo es e .

En estadísticas , el logit ( / l oʊ dʒ ɪ t / LOH -jit ) función es la función cuantil asociado con el estándar de distribución logística . Tiene muchos usos en el análisis de datos y el aprendizaje automático, especialmente en las transformaciones de datos .

Matemáticamente, el logit es el inverso de la función logística estándar , por lo que el logit se define como ${\ Displaystyle \ sigma (x) = 1 / (1 + e ^ {- x})}$

{\ Displaystyle \ operatorname {logit} (p) = \ sigma ^ {- 1} (p) = \ ln \ left ({\ frac {p} {1-p}} \ right) \ quad {\ text {para }} \ quad p \ in (0,1)}

.

Debido a esto, el logit también se denomina logaritmo de probabilidades, ya que es igual al logaritmo de la razón de probabilidades, donde $p$ es una probabilidad. Por lo tanto, el logit es un tipo de función que asigna valores de probabilidad a números reales en , similar a la función probit . ${\ Displaystyle {\ frac {p} {1-p}}}$ ${\ Displaystyle (0,1)}$ ${\ Displaystyle (- \ infty, + \ infty)}$

Definición

Si $p$ es una probabilidad , entonces $p$ $/ (1 -$ $p$ $)$ son las probabilidades correspondientes ; el $logit$ de la probabilidad es el logaritmo de las probabilidades, es decir

{\ Displaystyle \ operatorname {logit} (p) = \ ln \ left ({\ frac {p} {1-p}} \ right) = \ ln (p) - \ ln (1-p) = - \ ln \ left ({\ frac {1} {p}} - 1 \ right) \ ,.}

La base de la función logarítmica utilizada tiene poca importancia en el presente artículo, siempre que sea mayor que 1, pero el logaritmo natural con base $e$ es el más utilizado. La elección de la base corresponde a la elección de la unidad logarítmica para el valor: la base 2 corresponde a un shannon , la base $e$ a un “ nat ” y la base 10 a un hartley ; estas unidades se utilizan particularmente en interpretaciones teóricas de la información. Para cada elección de base, la función logit toma valores entre infinito negativo y positivo.

La función "logística" de cualquier número viene dada por el $logit$ inverso : ${\ Displaystyle \ alpha}$

{\ Displaystyle \ operatorname {logit} ^ {- 1} (\ alpha) = \ operatorname {logistic} (\ alpha) = {\ frac {1} {1+ \ operatorname {exp} (- \ alpha)}} = {\ frac {\ operatorname {exp} (\ alpha)} {\ operatorname {exp} (\ alpha) +1}}}

La diferencia entre los $logit$ s de dos probabilidades es el logaritmo de la razón de probabilidades ( $R$ ), lo que proporciona una forma abreviada para escribir la combinación correcta de razones de probabilidades solo sumando y restando :

{\ Displaystyle \ operatorname {ln} (R) = \ ln \ left ({\ frac {{p_ {1}} / (1-p_ {1})} {{p_ {2}} / (1-p_ { 2})}} \ right) = \ ln \ left ({\ frac {p_ {1}} {1-p_ {1}}} \ right) - \ ln \ left ({\ frac {p_ {2}} {1-p_ {2}}} \ right) = \ operatorname {logit} (p_ {1}) - \ operatorname {logit} (p_ {2}) \ ,.}

Historia

Se han realizado varios esfuerzos para adaptar los métodos de regresión lineal a un dominio donde la salida es un valor de probabilidad , en lugar de cualquier número real . En muchos casos, estos esfuerzos se han centrado en el modelado de este problema mediante la asignación de la gama de y después de ejecutar la regresión lineal de estos valores transformados. En 1934, Chester Ittner Bliss utilizó la función de distribución normal acumulativa para realizar este mapeo y llamó a su modelo probit una abreviatura de " prob capacidad un it ". Sin embargo, esto es computacionalmente más caro. En 1944, Joseph Berkson usó log of odds y llamó a esta función logit, abreviatura de " log istic un it " siguiendo la analogía de probit. Las probabilidades de registro fueron utilizadas ampliamente por Charles Sanders Peirce (finales del siglo XIX). GA Barnard acuñó en 1949 el término de uso común log-odds ; el log-odds de un evento es el logit de la probabilidad del evento. ${\ Displaystyle (0,1)}$ ${\ Displaystyle (- \ infty, + \ infty)}$ ${\ Displaystyle (0,1)}$ ${\ Displaystyle (- \ infty, + \ infty)}$

Usos y propiedades

El logit en la regresión logística es un caso especial de una función de enlace en un modelo lineal generalizado : es la función de enlace canónica para la distribución de Bernoulli .
La función logit es el negativo de la derivada de la función de entropía binaria .
El logit también es fundamental para el modelo probabilístico de medición de Rasch , que tiene aplicaciones en la evaluación psicológica y educativa, entre otras áreas.
La función de logit inverso (es decir, la función logística ) también se conoce como función expit .
En la epidemiología de las enfermedades de las plantas, el logit se utiliza para ajustar los datos a un modelo logístico. Con los modelos Gompertz y Monomolecular, los tres se conocen como modelos de la familia Richards.
La función de probabilidades logarítmicas se utiliza a menudo en algoritmos de estimación de estados debido a sus ventajas numéricas en el caso de probabilidades pequeñas. En lugar de multiplicar números de punto flotante muy pequeños, las probabilidades logarítmicas de probabilidades se pueden sumar para calcular la probabilidad conjunta (logaritmos de probabilidades).

Comparación con probit

Comparación de la función logit con un probit escalado (es decir, la CDF inversa de la distribución normal ), comparando vs. , que hace que las pendientes sean las mismas en el origen

y

.

{\ Displaystyle \ operatorname {logit} (x)}

{\ Displaystyle {\ tfrac {\ Phi ^ {- 1} (x)} {\, {\ sqrt {\ pi / 8 \,}} \,}}}

Estrechamente relacionados con la función $logit$ (y el modelo logit ) están la función probit y el modelo probit . El $logit$ y $probit$ son ambos función sigmoide con un dominio entre 0 y 1, lo que les hace ambas funciones cuantiles - es decir, inversos de la función de distribución acumulativa (CDF) de una distribución de probabilidad . De hecho, el $logit$ es la función cuantil de la distribución logística , mientras que el $probit$ es la función cuantil de la distribución normal . Se denota la función $probit$ , donde es el CDF de la distribución normal, como se acaba de mencionar: ${\ Displaystyle \ Phi ^ {- 1} (x)}$ ${\ Displaystyle \ Phi (x)}$

{\ Displaystyle \ Phi (x) = {\ frac {1} {\ sqrt {2 \ pi}}} \ int _ {- \ infty} ^ {x} e ^ {- {\ frac {y ^ {2} } {2}}} dy.}

Como se muestra en el gráfico de la derecha, las funciones $logit$ y $probit$ son extremadamente similares cuando se escala la función $probit$ , de modo que su pendiente en $y = 0$ coincide con la pendiente del $logit$ . Como resultado, los modelos probit a veces se utilizan en lugar de los modelos logit porque para ciertas aplicaciones (por ejemplo, en estadísticas bayesianas ) la implementación es más fácil.

Ver también

Función sigmoidea , inversa a la función logit
Elección discreta en logit binario, logit multinomial, logit condicional, logit anidado, logit mixto, logit explotado y logit ordenado
Variable dependiente limitada
Daniel McFadden , premio Nobel de Economía por el desarrollo de un modelo logit particular utilizado en economía
Análisis logit en marketing
Logit multinomial
Ogee , curva con forma similar
Perceptrón
Probit , otra función con el mismo dominio y rango que el logit
Puntuación ridit
Transformación de datos (estadísticas)
Arcsin (transformación)
Modelo Rasch

Referencias

Otras lecturas

Ashton, Winifred D. (1972). La Transformación Logit: con especial referencia a sus usos en Bioensayo . Monografías y cursos estadísticos de Griffin. 32 . Charles Griffin. ISBN 978-0-85264-212-2.

Languages

In other projects