Margen de error - Margin of error

Densidades de probabilidad de encuestas de diferentes tamaños, cada una codificada por colores según su intervalo de confianza del 95% (abajo), margen de error (izquierda) y tamaño de muestra (derecha). Cada intervalo refleja el rango dentro del cual se puede tener un 95% de confianza en que se puede encontrar el porcentaje real , dado un porcentaje informado del 50%. El margen de error es la mitad del intervalo de confianza (también, el radio del intervalo). Cuanto mayor sea la muestra, menor será el margen de error. Además, cuanto más alejado del 50% sea el porcentaje informado, menor será el margen de error.

El margen de error es una estadística que expresa la cantidad de error de muestreo aleatorio en los resultados de una encuesta . Cuanto mayor sea el margen de error, menos confianza se debe tener en que el resultado de una encuesta reflejaría el resultado de una encuesta de toda la población . El margen de error será positivo siempre que se muestree una población de forma incompleta y la medida de resultado tenga una varianza positiva , es decir, la medida varía .

El término margen de error se usa a menudo en contextos que no son encuestas para indicar un error de observación al informar las cantidades medidas. También se usa en el habla coloquial para referirse a la cantidad de espacio o flexibilidad que uno podría tener para lograr una meta. Por ejemplo, los comentaristas lo usan a menudo en los deportes cuando describen cuánta precisión se requiere para lograr una meta, puntos o resultado. Un boliche que se usa en los Estados Unidos mide 4,75 pulgadas de ancho y la bola mide 8,5 pulgadas de ancho, por lo que se podría decir que un jugador de bolos tiene un margen de error de 21,75 pulgadas al intentar golpear un pin específico para ganar uno de repuesto (por ejemplo, 1 pin permaneciendo en el carril).

Concepto

Considere una simple encuesta de sí / no como una muestra de encuestados extraída de una población que informa el porcentaje de respuestas afirmativas . Nos gustaría saber qué tan cerca está del resultado real de una encuesta a toda la población , sin tener que realizar una. Si, hipotéticamente, realizáramos una encuesta sobre muestras posteriores de encuestados (recién extraídos ), esperaríamos que esos resultados posteriores se distribuyeran normalmente . El margen de error describe la distancia dentro de la cual se espera que varíe un porcentaje específico de estos resultados .

De acuerdo con la regla 68-95-99.7 , esperaríamos que el 95% de los resultados cayeran dentro de aproximadamente dos desviaciones estándar ( ) a cada lado de la media verdadera . Este intervalo se denomina intervalo de confianza y el radio (la mitad del intervalo) se denomina margen de error , que corresponde a un nivel de confianza del 95% .

Generalmente, a un nivel de confianza , una muestra del tamaño de una población que tiene una desviación estándar esperada tiene un margen de error

donde denota el cuantil (también, comúnmente, una puntuación z ) y es el error estándar .

Desviación estándar y error estándar

Esperaríamos que los valores distribuidos normalmente   tuvieran una desviación estándar que de alguna manera varía con . Cuanto más pequeño , más ancho es el margen. A esto se le llama error estándar .

Para el resultado único de nuestra encuesta, asumimos eso , y que todos los resultados posteriores juntos tendrían una varianza .

Tenga en cuenta que corresponde a la varianza de una distribución de Bernoulli .

Margen máximo de error a diferentes niveles de confianza

Regla empírica.PNG

Para un nivel de confianza , existe un intervalo de confianza correspondiente sobre la media , es decir, el intervalo dentro del cual los valores de deben caer con probabilidad . Los valores precisos de vienen dados por la función cuantil de la distribución normal (a la que se aproxima la regla 68-95-99.7).

Tenga en cuenta que no está definido para , es decir, no está definido, tal como está .

 
0,68 0.994 457 883 210 0,999 3.290 526 731 492
0,90 1.644 853 626 951 0,9999 3.890 591 886 413
0,95 1.959963984540 0,99999 4.417 173 413 469
0,98 2.326 347 874 041 0,999999 4.891 638 475 699
0,99 2.575 829 303 549 0,9999999 5.326 723 886 384
0,995 2.807 033 768 344 0,99999999 5.730 728 868 236
0,997 2.967 737 925 342 0,999999999 6.109 410 204 869
Gráficos log-log de vs tamaño de muestra ny nivel de confianza γ . Las flechas muestran que el margen de error máximo para un tamaño de muestra de 1000 es ± 3,1% al 95% de nivel de confianza y ± 4,1% al 99%. La parábola insertada ilustra la relación entre at y at . En el ejemplo, MOE 95 (0,71) ≈ 0,9 × ± 3,1% ≈ ± 2,8%.

Dado que en el , podemos establecer de forma arbitraria , calcular , y para obtener el máximo margen de error para un nivel de confianza dado y tamaño de la muestra , incluso antes de tener los resultados reales. Con

Además, de manera útil, para cualquier

Márgenes de error específicos

Si una encuesta tiene varios resultados porcentuales (por ejemplo, una encuesta que mide una única preferencia de opción múltiple), el resultado más cercano al 50% tendrá el mayor margen de error. Normalmente, es este número el que se informa como el margen de error para toda la encuesta. Imagina informes de encuestas como

(como en la figura de arriba)

A medida que un porcentaje dado se acerca a los extremos de 0% o 100%, su margen de error se acerca a ± 0%.

Comparando porcentajes

Imagínese los informes de encuestas de opción múltiple como . Como se describió anteriormente, el margen de error informó para la encuesta sería típicamente , como es más cercano a 50%. Sin embargo, la noción popular de empate estadístico o empate estadístico no se refiere a la precisión de los resultados individuales, sino a la clasificación de los resultados. ¿Cuál está en primer lugar?

Si, hipotéticamente, tuviéramos que realizar una encuesta sobre muestras posteriores de encuestados (recién extraídos ) e informar el resultado , podríamos usar el error estándar de la diferencia para comprender cómo se espera que caiga . Para esto, necesitamos aplicar la suma de varianzas para obtener una nueva varianza ,

donde es la covarianza de y .

Así (después de simplificar),

Tenga en cuenta que esto supone que está cerca de constante, es decir, los encuestados que eligen A o B casi nunca elegirían C (lo que hace y cerca de una correlación negativa perfecta ). Con tres o más opciones en disputa más cercana, elegir una fórmula correcta para se vuelve más complicado.

Efecto del tamaño de población finito

Las fórmulas anteriores para el margen de error asumen que hay una población infinitamente grande y, por lo tanto, no dependen del tamaño de la población , sino solo del tamaño de la muestra . Según la teoría del muestreo , esta suposición es razonable cuando la fracción de muestreo es pequeña. El margen de error para un método de muestreo en particular es esencialmente el mismo independientemente de si la población de interés es del tamaño de una escuela, ciudad, estado o país, siempre que la fracción de muestreo sea ​​pequeña.

En los casos en que la fracción de muestreo es mayor (en la práctica, más del 5%), los analistas pueden ajustar el margen de error utilizando una corrección de población finita para tener en cuenta la precisión adicional obtenida al muestrear un porcentaje mucho mayor de la población. El FPC se puede calcular usando la fórmula

... y así, si la encuesta se realizara a más del 24% de, digamos, un electorado de 300.000 votantes

Intuitivamente, para apropiadamente grande ,

En el primer caso, es tan pequeño que no requiere corrección. En el último caso, la encuesta se convierte efectivamente en un censo y el error de muestreo se vuelve discutible.

Ver también

Notas

Referencias

  • Sudman, Seymour y Bradburn, Norman (1982). Formulación de preguntas: una guía práctica para el diseño de cuestionarios . San Francisco: Jossey Bass. ISBN  0-87589-546-8
  • Wonnacott, TH y RJ Wonnacott (1990). Estadísticas introductorias (5ª ed.). Wiley. ISBN 0-471-61518-8.

enlaces externos