Prueba de McNemar - McNemar's test

En estadística , la prueba de McNemar es una prueba estadística que se utiliza en datos nominales emparejados . Se aplica a tablas de contingencia 2 × 2 con un rasgo dicotómico , con pares de sujetos emparejados, para determinar si las frecuencias marginales de fila y columna son iguales (es decir, si existe "homogeneidad marginal"). Lleva el nombre de Quinn McNemar , quien lo introdujo en 1947. Una aplicación de la prueba en genética es la prueba de desequilibrio de transmisión para detectar desequilibrio de ligamiento . Los parámetros comúnmente utilizados para evaluar una prueba de diagnóstico en las ciencias médicas son la sensibilidad y la especificidad. La sensibilidad es la capacidad de una prueba para identificar correctamente a las personas con la enfermedad. La especificidad es la capacidad de la prueba para identificar correctamente a quienes no tienen la enfermedad. Ahora suponga que se realizan dos pruebas en el mismo grupo de pacientes. Y también suponga que estas pruebas tienen idéntica sensibilidad y especificidad. En esta situación uno se deja llevar por estos hallazgos y supone que ambas pruebas son equivalentes. Sin embargo, puede que éste no sea el caso. Para ello tenemos que estudiar a los pacientes con enfermedad y a los pacientes sin enfermedad (mediante una prueba de referencia). También tenemos que averiguar dónde están en desacuerdo estas dos pruebas. Esta es precisamente la base de la prueba de McNemar. Esta prueba compara la sensibilidad y la especificidad de dos pruebas de diagnóstico en el mismo grupo de pacientes.

Definición

La prueba se aplica a una tabla de contingencia de 2 × 2, que tabula los resultados de dos pruebas en una muestra de N sujetos, de la siguiente manera.

Prueba 2 positiva Prueba 2 negativa Total de filas
Prueba 1 positiva a B a + b
Prueba 1 negativa C D c + d
Total de la columna a + c b + d norte

La hipótesis nula de homogeneidad marginal establece que las dos probabilidades marginales para cada resultado son iguales, es decir, p a  +  p b  =  p a  +  p c y p c  +  p d  =  p b  +  p d .

Por tanto, las hipótesis nula y alternativa son

Aquí p a , etc., denotan la probabilidad teórica de ocurrencias en celdas con la etiqueta correspondiente.

La estadística de la prueba de McNemar es:

Bajo la hipótesis nula, con un número suficientemente grande de discordantes (celdas byc), tiene una distribución chi-cuadrado con 1 grado de libertad . Si el resultado es significativo , esto proporciona evidencia suficiente para rechazar la hipótesis nula, a favor de la hipótesis alternativa de que p b  ≠  p c , lo que significaría que las proporciones marginales son significativamente diferentes entre sí.

Variaciones

Si b o c es pequeño ( b  +  c  <25), la distribución chi-cuadrado no se aproxima bien. Una prueba binomial exacto se puede entonces utilizar, donde b es comparada con una distribución binomial con parámetro de tamaño n = b + c y p = 0,5. Efectivamente, la prueba exacta binomial evalúa el desequilibrio en los discordants b y c . Para lograr un valor P de dos caras, el valor P de la cola extrema debe multiplicarse por 2. Para bc :

que es simplemente el doble de la función de distribución acumulada de distribución binomial con p = 0.5 yn = b + c .

Edwards propuso la siguiente versión con corrección de continuidad de la prueba de McNemar para aproximar el binomio valor P exacto:

La prueba mid-P de McNemar (prueba binomial mid-p) se calcula restando la mitad de la probabilidad de la b observada del valor P unilateral exacto, luego duplíquelo para obtener el valor P medio bilateral:

Esto es equivalente a:

donde el segundo término es la función de masa de probabilidad de distribución binomial y n = b + c . Las funciones de distribución binomial están fácilmente disponibles en paquetes de software comunes y la prueba mid-P de McNemar se puede calcular fácilmente.

El consejo tradicional ha sido utilizar la prueba binomial exacta cuando b  +  c  <25. Sin embargo, las simulaciones han demostrado que tanto la prueba binomial exacta como la prueba de McNemar con corrección de continuidad son demasiado conservadoras. Cuando b + c <6, el valor P exacto siempre excede el nivel de significancia común 0.05. La prueba original de McNemar fue la más poderosa, pero a menudo un poco liberal. La versión mid-P fue casi tan poderosa como la prueba asintótica de McNemar y no se encontró que excediera el nivel de significancia nominal.

Ejemplos de

En el primer ejemplo, un investigador intenta determinar si un medicamento tiene un efecto sobre una enfermedad en particular. Los recuentos de individuos se dan en la tabla, con el diagnóstico (enfermedad: presente o ausente ) antes del tratamiento en las filas y el diagnóstico después del tratamiento en las columnas. La prueba requiere que se incluyan los mismos sujetos en las mediciones de antes y después (pares emparejados).

Después: presente Después: ausente Total de filas
Antes: presente 101 121 222
Antes: ausente 59 33 92
Total de la columna 160 154 314

En este ejemplo, la hipótesis nula de "homogeneidad marginal" significaría que no hubo efecto del tratamiento. A partir de los datos anteriores, la estadística de prueba de McNemar:

tiene el valor 21,35, que es muy poco probable que forme la distribución implícita en la hipótesis nula ( P <0,001). Por lo tanto, la prueba proporciona pruebas sólidas para rechazar la hipótesis nula de ningún efecto del tratamiento.

Un segundo ejemplo ilustra las diferencias entre la prueba asintótica de McNemar y las alternativas. La tabla de datos tiene el formato anterior, con diferentes números en las celdas:

Después: presente Después: ausente Total de filas
Antes: presente 59 6 sesenta y cinco
Antes: ausente dieciséis 80 96
Total de la columna 75 86 161

Con estos datos, el tamaño de la muestra (161 pacientes) no es pequeño, sin embargo, los resultados de la prueba de McNemar y otras versiones son diferentes. La prueba binomial exacta da P = 0.053 y la prueba de McNemar con corrección de continuidad da = 3.68 y P = 0.055. La prueba asintótica de McNemar da = 4.55 y P = 0.033 y la prueba de McNemar de P media da P = 0.035. Tanto la prueba de McNemar como la versión mid-P proporcionan evidencia más sólida de un efecto de tratamiento estadísticamente significativo en este segundo ejemplo.

Discusión

Una observación interesante al interpretar la prueba de McNemar es que los elementos de la diagonal principal no contribuyen a la decisión sobre si (en el ejemplo anterior) la condición previa o posterior al tratamiento es más favorable. Por lo tanto, la suma b + c puede ser pequeña y la potencia estadística de las pruebas descritas anteriormente puede ser baja aunque el número de pares a + b + c + d sea ​​grande (ver el segundo ejemplo anterior).

Existe una extensión de la prueba de McNemar en situaciones en las que la independencia no se cumple necesariamente entre las parejas; en cambio, hay grupos de datos emparejados en los que los pares de un grupo pueden no ser independientes, pero la independencia se mantiene entre diferentes grupos. Un ejemplo es analizar la efectividad de un procedimiento dental; en este caso, un par corresponde al tratamiento de un diente individual en pacientes que pueden tener varios dientes tratados; No es probable que la eficacia del tratamiento de dos dientes en el mismo paciente sea independiente, pero es más probable que el tratamiento de dos dientes en pacientes diferentes sea independiente.

Información en los maridajes

En la década de 1970, se conjeturó que retener las amígdalas podría proteger contra el linfoma de Hodgkin . John Rice escribió:

85 Los pacientes de Hodgkin [...] tenían un hermano del mismo sexo que estaba libre de la enfermedad y cuya edad estaba dentro de los 5 años de la del paciente. Estos investigadores presentaron la siguiente tabla:

Ellos calcularon una estadística de chi-cuadrado [...] [ellos] habían cometido un error en su análisis al ignorar los emparejamientos. [...] [sus] muestras no eran independientes, porque los hermanos estaban emparejados [...] configuramos una mesa que exhibe los emparejamientos:

Es en la segunda tabla donde se puede aplicar la prueba de McNemar. Observe que la suma de los números en la segunda tabla es 85 — el número de pares de hermanos — mientras que la suma de los números en la primera tabla es dos veces mayor, 170 — el número de individuos. La segunda tabla proporciona más información que la primera. Los números de la primera tabla se pueden encontrar usando los números de la segunda tabla, pero no al revés. Los números de la primera tabla dan solo los totales marginales de los números de la segunda tabla.

Pruebas relacionadas

  • La prueba del signo binomial proporciona una prueba exacta para la prueba de McNemar.
  • La prueba Q de Cochran es una extensión de la prueba de McNemar para más de dos "tratamientos".
  • La prueba exacta de Liddell es una alternativa exacta a la prueba de McNemar.
  • La prueba de Stuart-Maxwell es una generalización diferente de la prueba de McNemar, utilizada para probar la homogeneidad marginal en una tabla cuadrada con más de dos filas / columnas.
  • La prueba de Bhapkar (1966) es una alternativa más poderosa que la prueba de Stuart-Maxwell, pero tiende a ser liberal. Se encuentran disponibles alternativas competitivas a los métodos existentes.
  • La prueba de McNemar es un caso especial de la prueba de Cochran-Mantel-Haenszel ; es equivalente a una prueba de CMH con un estrato para cada uno de los N pares y, en cada estrato, una tabla de 2x2 que muestra las respuestas binarias pareadas.

Ver también

Referencias

enlaces externos