Evaluación Nacional del Progreso Educativo - National Assessment of Educational Progress

Logotipo de NAEP
Logotipo de la boleta de calificaciones de la nación

La Evaluación Nacional del Progreso Educativo ( NAEP ) es la mayor evaluación continua y representativa a nivel nacional de lo que los estudiantes estadounidenses saben y pueden hacer en diversas materias. NAEP es un proyecto ordenado por el Congreso y administrado por el Centro Nacional de Estadísticas de Educación (NCES) , dentro del Instituto de Ciencias de la Educación (IES) del Departamento de Educación de los Estados Unidos . La primera administración nacional de NAEP ocurrió en 1969. La Junta Directiva de Evaluación Nacional (NAGB) es una junta bipartidista independiente que establece la política para NAEP y es responsable de desarrollar el marco y las especificaciones de prueba. La Junta Directiva de Evaluación Nacional, cuyos miembros son nombrados por el Secretario de Educación de los Estados Unidos , incluye gobernadores, legisladores estatales, funcionarios escolares locales y estatales, educadores, representantes comerciales y miembros del público en general. El Congreso creó la Junta de Gobierno de 26 miembros en 1988.

Los resultados de NAEP están diseñados para proporcionar datos a nivel de grupo sobre el rendimiento de los estudiantes en varias materias, y se publican como la libreta de calificaciones de The Nation. No hay resultados para estudiantes, aulas o escuelas individuales. NAEP informa los resultados para diferentes grupos demográficos, incluido el género, el estado socioeconómico y la raza / etnia. Las evaluaciones se dan con mayor frecuencia en matemáticas , lectura , ciencias y escritura . Otras materias como las artes , la educación cívica , la economía , la geografía , la tecnología y la alfabetización en ingeniería (TEL) e historia de los Estados Unidos se evalúan periódicamente.

Además de evaluar el rendimiento de los estudiantes en varias materias, NAEP también encuesta a los estudiantes, maestros y administradores escolares para ayudar a proporcionar información contextual. Las preguntas sobre la raza o el origen étnico de los participantes, la asistencia a la escuela y las expectativas académicas ayudan a los encargados de formular políticas, a los investigadores y al público en general a comprender mejor los resultados de la evaluación.

Los maestros, directores, padres, legisladores e investigadores utilizan los resultados de NAEP para evaluar el progreso de los estudiantes en todo el país y desarrollar formas de mejorar la educación en los Estados Unidos. NAEP ha estado proporcionando datos sobre el desempeño de los estudiantes desde 1969.

NAEP utiliza un procedimiento de muestreo que permite que la evaluación sea representativa de la diversidad geográfica, racial, étnica y socioeconómica de las escuelas y los estudiantes en los Estados Unidos. También se proporcionan datos sobre estudiantes con discapacidades y aprendices del idioma inglés. Las evaluaciones NAEP se administran a los estudiantes participantes utilizando los mismos folletos y procedimientos de prueba, excepto adaptaciones para estudiantes con discapacidades, por lo que los resultados NAEP se utilizan para comparar estados y distritos urbanos que participan en la evaluación.

Hay dos sitios web de NAEP: el sitio web de NCES NAEP y el sitio web de The Nation's Report Card . El primer sitio detalla el programa NAEP de manera integral, mientras que el segundo se enfoca principalmente en las publicaciones individuales de datos.

Historia

NAEP comenzó en 1964, con una subvención de Carnegie Corporation para establecer el Comité Exploratorio para la Evaluación del Progreso en Educación (ESCAPE). Las primeras evaluaciones nacionales se llevaron a cabo en 1969. Las evaluaciones voluntarias para los estados comenzaron en 1990 a modo de prueba y en 1996 se convirtieron en una característica permanente de NAEP para ser administradas cada dos años. En 2002, distritos urbanos seleccionados participaron en las evaluaciones a nivel estatal a modo de prueba y continúan como Evaluación de Distrito Urbano de Prueba (TUDA).

El desarrollo de un programa NAEP exitoso ha involucrado a muchos, incluidos investigadores, funcionarios estatales de educación, contratistas, legisladores, estudiantes y maestros.

Evaluaciones

Hay dos tipos de evaluaciones NAEP, NAEP principal y NAEP de tendencia a largo plazo . Esta separación permite cumplir dos objetivos:

  1. A medida que cambien las prioridades educativas, desarrollar nuevos instrumentos de evaluación que reflejen el contenido educativo y la metodología de evaluación actuales.
  2. Mide el progreso de los estudiantes a lo largo del tiempo.

Principal

Las evaluaciones principales de NAEP se llevan a cabo en una variedad de materias con estudiantes de cuarto, octavo y duodécimo grado en todo el país. Las evaluaciones se dan con mayor frecuencia en matemáticas, lectura, ciencias y escritura. Se evalúan periódicamente otras materias como las artes, la educación cívica, la economía, la geografía, la tecnología y la ingeniería (TEL) e historia de los EE. UU.

Estas evaluaciones siguen los marcos de áreas temáticas que son desarrollados por la NAGB y utilizan los últimos avances en la metodología de evaluación. Según la NAEP principal, los resultados se informan a nivel nacional y, en algunos casos, a nivel estatal y de distrito.

Nacional

La NAEP nacional presenta información estadística sobre el desempeño de los estudiantes y los factores relacionados con el desempeño educativo de la nación y de grupos demográficos específicos de la población (por ejemplo, raza / etnia, género). Incluye a estudiantes de escuelas públicas y no públicas (privadas) y, según la materia, los resultados de los informes para los grados 4, 8 y 12.

Expresar

Los resultados estatales de NAEP están disponibles en algunas materias para los grados 4 y 8. Esto permite a los estados participantes monitorear su propio progreso a lo largo del tiempo en matemáticas, lectura, ciencias y escritura. Luego pueden comparar el conocimiento y las habilidades de sus estudiantes con los estudiantes de otros estados y con la nación.

Las evaluaciones otorgadas en los estados son exactamente las mismas que las otorgadas a nivel nacional. Tradicionalmente, la NAEP estatal se evaluó solo en los grados 4 y 8. Sin embargo, un programa piloto de 2009 permitió 11 estados (Arkansas, Connecticut, Florida, Idaho, Illinois, Iowa, Massachusetts, New Hampshire, Nueva Jersey, Dakota del Sur y Virginia Occidental) para recibir puntajes al nivel de duodécimo grado.

Hasta 1988, NAEP informó solo sobre el rendimiento académico de la nación en su conjunto y de los grupos demográficos dentro de la población. El Congreso aprobó una ley en 1988 que autorizaba una Evaluación del Estado de Prueba voluntaria. Se seleccionaron muestras representativas separadas de estudiantes de cada estado o jurisdicción que accedió a participar en la NAEP estatal. Las evaluaciones estatales de juicio se llevaron a cabo en 1990, 1992 y 1994. A partir de la evaluación de 1996, el estatuto de autorización ya no consideraba el componente estatal como un "juicio".

Un cambio significativo en la NAEP estatal ocurrió en 2001 con la reautorización de la Ley de Educación Primaria y Secundaria , también conocida como legislación "Que Ningún Niño Se Quede Atrás" . Esta legislación requiere que los estados que reciben fondos del Título I deben participar en las evaluaciones estatales NAEP en matemáticas y lectura en los grados 4 y 8 cada dos años. La participación estatal en otras materias evaluadas por la NAEP estatal (ciencia y escritura) sigue siendo voluntaria.

Como todas las evaluaciones NAEP, la NAEP estatal no proporciona puntuaciones individuales para los estudiantes o las escuelas evaluadas.

Evaluación del distrito urbano de prueba

La Evaluación del Distrito Urbano de Prueba ( TUDA ) es un proyecto desarrollado para determinar la viabilidad de usar NAEP para informar sobre el desempeño de los estudiantes de escuelas públicas a nivel de distrito. Según lo autorizado por el congreso, NAEP ha administrado las evaluaciones de matemáticas, lectura, ciencias y escritura a muestras de estudiantes en distritos urbanos seleccionados.

TUDA comenzó con seis distritos urbanos en 2002 y desde entonces se ha expandido a 27 distritos para el ciclo de evaluación de 2017.

Distrito 2002 2003 2005 2007 2009 2011 2013 2015 2017
Escuelas Públicas de Albuquerque X X X X
Escuelas Públicas de Atlanta X X X X X X X X X
Distrito Escolar Independiente de Austin X X X X X X X
Escuelas Públicas de la Ciudad de Baltimore X X X X X
Escuelas Públicas de Boston X X X X X X X X
Escuelas de Charlotte-Mecklenburg X X X X X X X X
Escuelas Públicas de Chicago X X X X X X X X X
Distrito Escolar del Condado de Clark (NV) X
Distrito Escolar Metropolitano de Cleveland X X X X X X X X
Distrito Escolar Independiente de Dallas X X X X
Escuelas Públicas de Denver X
Escuelas Públicas de Detroit X X X X X
Escuelas Públicas del Distrito de Columbia X X X X X X X X X
Escuelas públicas del condado de Duval (FL) X X
Distrito Escolar Independiente de Fort Worth (TX) X
Distrito Escolar Unificado de Fresno X X X X X
Escuelas del condado de Guilford (NC) X
Escuelas públicas del condado de Hillsborough (FL) X X X X
Distrito Escolar Independiente de Houston X X X X X X X X X
Escuelas públicas del condado de Jefferson (KY) X X X X X
Distrito Escolar Unificado de Los Ángeles X X X X X X X X X
Escuelas públicas del condado de Miami-Dade X X X X X
Escuelas Públicas de Milwaukee X X X X
Departamento de Educación de la Ciudad de Nueva York X X X X X X X X X
Distrito escolar de Filadelfia X X X X X
Distrito Escolar Unificado de San Diego X X X X X X X X
Escuelas del condado de Shelby (TN) X

Tendencia a largo plazo

La NAEP de tendencia a largo plazo se administra a jóvenes de 9, 13 y 17 años periódicamente a nivel nacional. Las evaluaciones de tendencias a largo plazo miden el desempeño de los estudiantes en matemáticas y lectura y permiten comparar el desempeño de los estudiantes de hoy con el de los estudiantes desde principios de la década de 1970.

Aunque la tendencia a largo plazo y la NAEP principal evalúan tanto las matemáticas como la lectura, existen varias diferencias entre ellas. En particular, las evaluaciones difieren en el contenido evaluado, con qué frecuencia se administra la evaluación y cómo se informan los resultados. Estas y otras diferencias significan que los resultados de la tendencia a largo plazo y la NAEP principal no pueden compararse directamente.

Aunque NAEP se ha administrado desde la década de 1970, en 2021 los funcionarios del DOE de EE. UU. Decidieron posponer la evaluación en matemáticas y lectura debido a la pandemia de COVID-19. Las razones para posponer incluyen la posibilidad de muestras de estudiantes sesgadas, así como los resultados debido a las diferentes opciones de aprendizaje a distancia y debido a preocupaciones de seguridad para los supervisores y estudiantes.

Programa de evaluación

NAGB establece el calendario para las evaluaciones NAEP. Consulte el programa de evaluación completo para todas las evaluaciones NAEP desde 1968 y las planificadas hasta 2017.

Las evaluaciones principales de NAEP generalmente se administran durante aproximadamente seis semanas entre fines de enero y principios de marzo de cada año. Las evaluaciones de tendencias a largo plazo generalmente se administran cada cuatro años por grupo de edad entre octubre y mayo. Todas las evaluaciones son administradas por personal de campo contratado por NAEP en todo el país.

Coordinadores estatales de NAEP (NSC)

NAEP se lleva a cabo en asociación con los estados. El programa NAEP proporciona fondos para un NSC de tiempo completo en cada estado. Él o ella sirve como enlace entre NAEP, la agencia de educación del estado y las escuelas seleccionadas para participar.

Los NSC brindan muchos servicios importantes para el programa NAEP y son responsables de:

  • coordinar la administración de NAEP en el estado,
  • ayudar con el análisis y la presentación de informes de datos NAEP, y
  • promover la comprensión pública de NAEP y sus recursos

Nuevas evaluaciones de base digital (DBA)

Si bien la mayoría de las evaluaciones NAEP se administran en formato de papel y lápiz, NAEP está evolucionando para abordar el panorama educativo cambiante a través de su transición a evaluaciones basadas en formato digital. NAEP está utilizando la última tecnología disponible para entregar evaluaciones a los estudiantes y, a medida que la tecnología evoluciona, también lo hará la naturaleza de la entrega de los DBA. El objetivo es que todas las evaluaciones de NAEP estén sin papel para el final de la década. La evaluación de redacción de 2011 fue la primera en realizarse completamente por computadora.

Tareas informáticas interactivas (TIC)

En 2009, las TIC se administraron como parte de la evaluación científica con papel y lápiz. La entrega por computadora permite medir el conocimiento, los procesos y las habilidades científicas que no se pueden evaluar en otros modos. Las tareas incluyeron la realización de investigaciones que incluyen observaciones de fenómenos que de otro modo tomarían mucho tiempo, modelado de fenómenos a gran escala o invisibles a simple vista, e investigación de extensos documentos de recursos.

Estudio de matemáticas basado en computadora

Este estudio especial sobre pruebas de múltiples etapas, implementado en 2011, investigó el uso de los principios de las pruebas adaptativas en el contexto de NAEP. Una muestra de estudiantes recibió una evaluación de matemáticas en línea que se adapta a su nivel de habilidad. Todos los elementos del estudio son elementos NAEP existentes.

Evaluación de conocimientos de tecnología e ingeniería (TEL)

El marco de evaluación TEL describe la alfabetización en tecnología e ingeniería como la capacidad para usar, comprender y evaluar la tecnología, así como para comprender los principios y estrategias tecnológicos necesarios para desarrollar soluciones y lograr metas. Las tres áreas de la evaluación son:

  • Tecnología y sociedad : se ocupa de los efectos que tiene la tecnología en la sociedad y en el mundo natural y con el tipo de cuestiones éticas que surgen de esos efectos.
  • Diseño y sistemas : cubre la naturaleza de la tecnología; el proceso de diseño de ingeniería mediante el cual se desarrollan las tecnologías; y principios básicos para lidiar con las tecnologías cotidianas, incluido el mantenimiento y la resolución de problemas.
  • Tecnología de la información y la comunicación : incluye computadoras y herramientas de aprendizaje de software; sistemas y protocolos de redes; dispositivos digitales portátiles; y otras tecnologías para acceder, crear y comunicar información y para facilitar la expresión creativa.

Los estudiantes de octavo grado de todo el país tomaron la evaluación en el invierno de 2014. Los resultados de esta evaluación se publicaron en mayo de 2016.

Evaluación basada en computadora de redacción

En 2011, NAEP cambió su evaluación de escritura (en los grados 8 y 12) de papel y lápiz a una administración basada en computadora para medir la capacidad de los estudiantes para escribir usando una computadora. La evaluación aprovecha muchas características de la tecnología digital actual y las tareas se entregan en formatos multimedia, como videos cortos y audio. Además, en un esfuerzo por incluir a tantos estudiantes como sea posible, el sistema de evaluación de escritura basado en computadora ha incorporado varias características de diseño universales , como texto a voz, tamaño de fuente ajustable y revisión ortográfica electrónica. En 2012, NAEP puso a prueba la evaluación por computadora para estudiantes de cuarto grado.

Estudios que utilizan datos NAEP

Además de las evaluaciones, NAEP coordina una serie de estudios especiales relacionados que a menudo involucran procesos especiales de recopilación de datos, análisis secundarios de los resultados de NAEP y evaluaciones de procedimientos técnicos.

Brechas de logros

Las brechas de rendimiento ocurren cuando un grupo de estudiantes supera a otro grupo y la diferencia en las calificaciones promedio de los dos grupos es estadísticamente significativa (es decir, mayor que el margen de error). En las publicaciones del informe inicial, NAEP destaca las brechas de rendimiento en los grupos de estudiantes. Sin embargo, NAEP también ha publicado una serie de informes y resúmenes de datos que destacan la brecha en el rendimiento. - Algunos ejemplos incluyen la composición de la escuela y la brecha de logros entre negros y blancos y la brecha de logros entre hispanos y blancos y negros y blancos. Estas publicaciones utilizan las puntuaciones de NAEP en matemáticas y / o lectura para estos grupos, ya sea para proporcionar resúmenes de datos o iluminar patrones y cambios en estas brechas a lo largo del tiempo. Los informes de investigación, como School Composition y Black-White Achievement Gap, también incluyen advertencias y advertencias para interpretar los datos.

Estudio de calificaciones de la escuela secundaria (HSTS)

El HSTS explora la relación entre el rendimiento de NAEP del grado 12 y las carreras académicas de la escuela secundaria al examinar el plan de estudios que se sigue en las escuelas secundarias de nuestra nación y los patrones de toma de cursos de los estudiantes de la escuela secundaria a través de una colección de expedientes académicos. Estudios recientes han puesto énfasis en la educación STEM y cómo se correlaciona con el rendimiento de los estudiantes en las evaluaciones de matemáticas y ciencias de NAEP.

Estudio de vinculación NAEP-TIMSS

El Estudio Internacional de Tendencias en Matemáticas y Ciencias (TIMSS) es una evaluación internacional de la Asociación Internacional para la Evaluación del Rendimiento Educativo (IEA) que mide el aprendizaje de los estudiantes en matemáticas y ciencias. NCES inició el estudio de vinculación NAEP-TIMSS para que los estados y distritos seleccionados puedan comparar el desempeño de sus propios estudiantes con los puntos de referencia internacionales. El estudio de vinculación se realizó en 2011 en el octavo grado en matemáticas y ciencias. NCES "proyectará" los puntajes a nivel estatal y de distrito en TIMSS en ambas materias utilizando datos de NAEP.

Estudio Nacional de Educación Indígena (NIES)

El NIES es un estudio de dos partes diseñado para describir la condición de la educación de los estudiantes indios americanos / nativos de Alaska en los Estados Unidos. La primera parte del estudio consiste en los resultados de las evaluaciones en matemáticas y lectura en los grados 4 y 8. La segunda parte presenta los resultados de una encuesta entregada a los estudiantes indios americanos / nativos de Alaska, sus maestros y administradores escolares. Las encuestas se enfocan en las experiencias culturales de los estudiantes dentro y fuera de la escuela.

Mapeo de los estándares estatales de competencia

Bajo la reautorización de 2001 de la Ley de Educación Primaria y Secundaria (ESEA) de 1965, los estados desarrollan sus propias evaluaciones y establecen sus propios estándares de competencia para medir el rendimiento de los estudiantes. Cada estado controla sus propios programas de evaluación, incluido el desarrollo de sus propios estándares, lo que resulta en una gran variación entre los estados en las prácticas de evaluación de los estudiantes en todo el estado. Esta variación crea un desafío para comprender los niveles de rendimiento de los estudiantes en los Estados Unidos. Desde 2003, NCES ha apoyado investigaciones que comparan los estándares de competencia de NAEP con los de los estados individuales. Las evaluaciones estatales se colocan en una escala común definida por los puntajes de NAEP, que permite comparar los estándares de competencia de los estados no solo con NAEP, sino también entre sí. NCES ha publicado el informe Mapping State Proficiency Standards utilizando datos estatales para matemáticas y lectura en 2003, 2005, 2007, 2009 y, más recientemente, 2013.

Estudios pasados

A lo largo de los años, NCES ha realizado una serie de otros estudios relacionados con diferentes aspectos del programa NAEP. A continuación se enumeran algunos estudios del pasado reciente:

  • El Estudio de lectura oral se llevó a cabo para descubrir qué tan bien los estudiantes de cuarto grado de la nación pueden leer en voz alta una historia típica de cuarto grado. La evaluación proporcionó información sobre la fluidez de los estudiantes en la lectura en voz alta y examinó la relación entre la lectura oral, la precisión, la velocidad, la fluidez y la comprensión lectora.
  • America's Charter Schools fue un estudio piloto realizado como parte de las evaluaciones NAEP de 2003 en matemáticas y lectura a nivel de cuarto grado. Si bien las escuelas autónomas son similares a otras escuelas públicas en muchos aspectos, difieren en varios aspectos importantes, incluida la composición de la población estudiantil y su ubicación.
  • Las escuelas privadas educan alrededor del 10 por ciento de los estudiantes de la nación. En el primer informe, se compararon los resultados de las evaluaciones de todas las escuelas privadas y de las categorías de escuelas privadas más grandes (católicas, luteranas y cristianas conservadoras) con las de las escuelas públicas (cuando corresponda). El segundo informe examinó las diferencias entre las escuelas públicas y privadas en las puntuaciones medias de NAEP en matemáticas y lectura de 2003 cuando se tomaron en cuenta las características seleccionadas de los estudiantes y / o las escuelas.
  • El proyecto de Evaluación basada en tecnología fue diseñado para explorar el uso de la tecnología, especialmente el uso de la computadora como una herramienta para mejorar la calidad y eficiencia de las evaluaciones educativas.

Crítica

El uso intensivo de pruebas de hipótesis estadísticas por parte de NAEP ha generado algunas críticas relacionadas con la interpretación de los resultados. Por ejemplo, el Boletín de calificaciones de la nación informó que "los hombres superaron a las mujeres en los tres grados en 2005" como resultado de los puntajes de las pruebas de ciencias de 100,000 estudiantes en cada grado. Hyde y Linn criticaron esta afirmación, porque la diferencia media era solo 4 de 300 puntos, lo que implica un tamaño de efecto pequeño y distribuciones muy superpuestas. Argumentan que "las pequeñas diferencias en el desempeño en la NAEP y otros estudios reciben una amplia publicidad, lo que refuerza sesgos sutiles y persistentes".

También se ha criticado la elección de NAEP de qué respuestas marcar como correctas o incorrectas. Por ejemplo, una pregunta de historia hizo sobre el fallo de 1954 Brown v. Board of Education , y se refirió explícitamente a la decisión de 1954 que identificó el problema, no a la decisión de 1955 que ordenó la desegregación. NAEP pidió a los estudiantes que "describieran las condiciones para las que se diseñó esta decisión de 1954". Marcaron mal a los estudiantes que mencionaron la segregación sin mencionar la desegregación. De hecho, la pregunta solo se refería a las condiciones existentes, no a los remedios y, en cualquier caso, la decisión de 1954 no ordenó la eliminación de la segregación. El país esperó hasta la decisión de Brown II de 1955 para escuchar sobre "toda velocidad deliberada". Otra pregunta de historia marcó mal a los estudiantes que sabían que Estados Unidos luchó tanto contra rusos como contra chinos y norcoreanos en la Guerra de Corea . Otras preguntas publicadas sobre matemáticas y escritura han recibido críticas similares. Las respuestas matemáticas han penalizado a los estudiantes que entienden las raíces cuadradas negativas , los intereses de los préstamos y los errores al extrapolar un gráfico más allá de los datos.

La afirmación de NAEP de medir el pensamiento crítico también ha sido criticada. Los investigadores de UCLA descubrieron que los estudiantes podían elegir las respuestas correctas sin un pensamiento crítico.

NAEP califica cada prueba mediante un método estadístico, establece límites para los estándares "básicos" y "competentes" y da ejemplos de lo que los estudiantes de cada nivel lograron en la prueba. El proceso para diseñar las pruebas y los estándares ha sido criticado por la Western Michigan University (1991), la National Academy of Education (1993), la Government Accountability Office (1993), la National Academy of Sciences (1999), los American Institutes for Research. y RTI International (2007), Brookings Institution (2007 y 2016), el Buros Center for Testing (2009) y las Academias Nacionales de Ciencias, Ingeniería y Medicina (2016).

La interpretación de los resultados de NAEP ha sido difícil: la categoría de NAEP de "competente" en una prueba de lectura dada a los estudiantes de cuarto grado refleja a los estudiantes que obtienen buenos resultados en la prueba y están en el nivel de séptimo grado. La categoría de NAEP de "competente" en una prueba de matemáticas que se les da a los estudiantes de octavo grado refleja a los estudiantes que obtienen buenos resultados en la prueba y están en el nivel de duodécimo grado. El hecho de que pocos estudiantes de octavo grado sean competentes según este estándar y se desempeñen en el nivel de duodécimo grado se ha malinterpretado para alegar que pocos estudiantes de octavo grado logran incluso en el nivel de octavo grado. NAEP dice: "Los estudiantes que pueden ser competentes en una materia, dado el uso común del término, pueden no cumplir con los requisitos de desempeño en el nivel de logro NAEP" James Harvey, autor principal de A Nation at Risk , dice: "Es difícil para evitar concluir que la palabra se eligió conscientemente para confundir a los responsables políticos y al público ".

Referencias

Otras lecturas

enlaces externos