Validez de contenido - Content validity

En psicometría , la validez de contenido (también conocida como validez lógica ) se refiere a la medida en que una medida representa todas las facetas de un constructo determinado. Por ejemplo, una escala de depresión puede carecer de validez de contenido si solo evalúa la dimensión afectiva de la depresión pero no tiene en cuenta la dimensión conductual . Existe un elemento de subjetividad en relación con la determinación de la validez del contenido, que requiere un grado de acuerdo sobre lo que representa un rasgo particular de la personalidad , como la extraversión . Un desacuerdo sobre un rasgo de personalidad evitará la obtención de una validez de alto contenido.

Sobre la validez del contenido

La validez de contenido es diferente de la validez aparente, que se refiere no a lo que realmente mide la prueba, sino a lo que parece medir superficialmente. La validez aparente evalúa si la prueba "parece válida" para los examinados que la toman, el personal administrativo que decide sobre su uso y otros observadores técnicamente no capacitados. La validez de contenido requiere el uso de expertos reconocidos en la materia para evaluar si los elementos de prueba evalúan el contenido definido y pruebas estadísticas más rigurosas que la evaluación de la validez aparente. La validez de contenido se aborda con mayor frecuencia en las pruebas académicas y vocacionales, donde los elementos de la prueba deben reflejar el conocimiento realmente requerido para un área temática determinada (por ejemplo, historia) o habilidad laboral (por ejemplo, contabilidad). En entornos clínicos, la validez de contenido se refiere a la correspondencia entre los elementos de la prueba y el contenido de los síntomas de un síndrome.

CH Lawshe desarrolló un método ampliamente utilizado para medir la validez del contenido. Es esencialmente un método para medir la concordancia entre los evaluadores o jueces con respecto a la importancia de un elemento en particular. En un artículo sobre las pruebas previas al empleo, Lawshe (1975) propuso que cada uno de los evaluadores expertos en la materia (PYME) del panel de jueces responda a la siguiente pregunta para cada elemento: "¿Es la habilidad o el conocimiento medido por este elemento" esencial , '' útil, pero no esencial 'o' no necesario 'para el desempeño del trabajo? " Según Lawshe, si más de la mitad de los panelistas indican que un elemento es esencial, ese elemento tiene al menos cierta validez de contenido. Existen mayores niveles de validez de contenido ya que un mayor número de panelistas están de acuerdo en que un elemento en particular es esencial. Utilizando estos supuestos, Lawshe desarrolló una fórmula denominada índice de validez de contenido: donde índice de validez de contenido, número de panelistas de PYME que indican "esencial", número total de panelistas de PYME. Esta fórmula arroja valores que van de +1 a -1; los valores positivos indican que al menos la mitad de las pymes calificaron el artículo como esencial. El CVR medio de todos los elementos se puede utilizar como indicador de la validez general del contenido de la prueba.

Lawshe (1975) proporcionó una tabla de valores críticos para el CVR mediante el cual un evaluador de pruebas podría determinar, para un grupo de PYME de un tamaño determinado, el tamaño de un CVR calculado necesario para superar la expectativa de probabilidad. Esta tabla había sido calculada para Lawshe por su amigo, Lowell Schipper. Un examen detallado de esta tabla publicada reveló una anomalía. En la tabla de Schipper, el valor crítico para la CVR aumenta monótonamente desde el caso de 40 PyMEs (valor mínimo = .29) al caso de 9 PyMEs (valor mínimo = .78) solo para caer inesperadamente en el caso de 8 PyMEs (mínimo valor = 0,75) antes de alcanzar su valor máximo en el caso de 7 PYME (valor mínimo = 0,99). Sin embargo, al aplicar la fórmula a 8 evaluadores, el resultado de 7 calificaciones esenciales y 1 otra calificación arroja un CVR de .75. Si 0,75 no fuera el valor crítico, se necesitarían 8 de 8 evaluadores de Essential que producirían un CVR de 1,00. En ese caso, para ser coherente con el orden ascendente de CVR, el valor para 8 evaluadores tendría que ser 1,00. Eso violaría el mismo principio porque tendría el valor "perfecto" requerido para 8 evaluadores, pero no para calificaciones en otros números de evaluadores, ya sea por encima o por debajo de 8 evaluadores. No está claro si esta desviación de la progresión monótona de la tabla se debió a un error de cálculo por parte de Schipper o un error al escribir o escribir. Wilson, Pan y Schumsky (2012), buscando corregir el error, no encontraron explicación en los escritos de Lawshe ni en ninguna publicación de Schipper que describa cómo se calculó la tabla de valores críticos. Wilson y sus colegas determinaron que los valores de Schipper eran aproximaciones cercanas a la aproximación normal a la distribución binomial. Al comparar los valores de Schipper con los valores binomiales recién calculados, también encontraron que Lawshe y Schipper habían etiquetado erróneamente su tabla publicada como una prueba de una cola cuando en realidad los valores reflejaban los valores binomiales de una prueba de dos colas. Wilson y sus colegas publicaron un nuevo cálculo de los valores críticos para el índice de validez de contenido que proporciona valores críticos en pasos unitarios en múltiples niveles alfa.

La tabla de valores es la siguiente:

N ° de panelistas Mín. Valor

      5              .99
      6              .99
      7              .99
      8              .75
      9              .78
     10              .62
     11              .59
     12              .56
     20              .42
     30              .33
     40              .29

  From:http://citeseerx.ist.psu.edu/viewdoc/download?doi=10.1.1.460.9380&rep=rep1&type=pdf

Ver también

Referencias

  • Lawshe, CH (1975). Un enfoque cuantitativo de la validez de contenido. Psicología del personal, 28 , 563–575. doi: 10.1111 / j.1744-6570.1975.tb01393.x
  • Wilson, FR, Pan, W. y Schumsky, DA (2012). Nuevo cálculo de los valores críticos para el índice de validez de contenido de Lawshe. Medición y evaluación en consejería y desarrollo, 45 (3), 197-210. doi: 10.1177 / 0748175612440286

enlaces externos

  • Handbook of Management Scales , un Wikilibro que contiene escalas de varios elementos utilizadas anteriormente para medir constructos en la literatura de investigación empírica sobre gestión. Para muchas escalas, se discute la validez de contenido.