Reconocimiento óptico de marcas - Optical mark recognition

  (Redirigido desde la hoja de respuestas ópticas )

El reconocimiento óptico de marcas (también llamado lectura óptica de marcas y OMR ) es el proceso de capturar datos marcados por humanos de formularios de documentos como encuestas y pruebas. Se utilizan para leer cuestionarios, exámenes de opción múltiple en forma de líneas o áreas sombreadas.

Fondo OMR

Formulario de prueba OMR, con marcas de registro y colores omitidos, diseñado para ser escaneado por un dispositivo OMR dedicado

Muchos dispositivos OMR tradicionales funcionan con un dispositivo de escáner dedicado que proyecta un haz de luz sobre el papel de formulario. La reflectividad contrastante en posiciones predeterminadas en una página se usa luego para detectar estas áreas marcadas porque reflejan menos luz que las áreas en blanco del papel.

Algunos dispositivos OMR utilizan formularios preimpresos en papel "transóptico" y miden la cantidad de luz que atraviesa el papel; por lo tanto, una marca a cada lado del papel reducirá la cantidad de luz que pasa a través del papel.

A diferencia del dispositivo OMR dedicado, el software OMR de escritorio permite al usuario crear sus propios formularios en un procesador de texto e imprimirlos en una impresora láser. El software OMR luego funciona con un escáner de imágenes de escritorio común con un alimentador de documentos para procesar los formularios una vez completados.

OMR se distingue generalmente del reconocimiento óptico de caracteres (OCR) por el hecho de que no se requiere un motor de reconocimiento de patrones complicado . Es decir, las marcas están construidas de tal manera que hay pocas posibilidades de no leer las marcas correctamente. Esto requiere que la imagen tenga un alto contraste y una forma fácilmente reconocible o irrelevante. Un campo relacionado con OMR y OCR es el reconocimiento de códigos de barras , como el código de barras UPC que se encuentra en el empaque del producto.

Una de las aplicaciones más conocidas del reconocimiento óptico de marcas es el uso de hojas de respuestas ópticas con burbujas de lápiz n. ° 2 (HB en Europa) en exámenes de preguntas de opción múltiple . Los estudiantes marcan sus respuestas u otra información personal oscureciendo los círculos marcados en una hoja preimpresa. Posteriormente, la hoja es clasificada automáticamente por una máquina de escaneo. En los Estados Unidos y la mayoría de los países europeos, una "marca" horizontal o vertical en una "pastilla" rectangular es el tipo de forma OMR más comúnmente utilizado; la aplicación más conocida en el Reino Unido es el formulario de lotería nacional del Reino Unido. Las marcas de pastillas son una tecnología posterior y tienen la ventaja de ser más fáciles de marcar y de borrar. Las grandes marcas de "burbujas" son tecnología heredada de las primeras máquinas OMR que eran tan insensibles que se requería una gran marca para su confiabilidad. En la mayoría de los países asiáticos, se usa un marcador especial para completar una hoja de respuestas ópticas . Los estudiantes, igualmente, marcan las respuestas u otra información oscureciendo los círculos marcados en una hoja preimpresa. Luego, la hoja es clasificada automáticamente por una máquina de escaneo.

Muchas de las aplicaciones actuales de OMR involucran a personas que completan formularios especializados. Estos formularios están optimizados para el escaneo por computadora, con un registro cuidadoso en la impresión y un diseño cuidadoso para que la ambigüedad se reduzca al mínimo posible. Debido a su índice de error extremadamente bajo, bajo costo y facilidad de uso, OMR es un método popular para contar votos.

Las marcas OMR también se agregan a los elementos de correo físico para que se pueda usar el equipo de inserción de carpetas. Las marcas se agregan a cada página (normalmente opuesta / impar) de un documento de correo y consisten en una secuencia de guiones negros que el equipo de inserción de carpetas escanea para determinar cuándo se debe doblar el correo y luego insertarlo en un sobre.

Hoja de respuestas ópticas

Una respuesta a una pregunta de matemáticas del SAT marcada en una hoja de respuestas ópticas

Una hoja de respuesta óptica o de burbujas de hoja es un tipo especial de forma usada en pregunta de opción múltiple exámenes . El reconocimiento óptico de marcas se utiliza para detectar respuestas. La empresa más conocida en los Estados Unidos relacionada con las hojas de respuestas ópticas es Scantron Corporation , aunque ciertos usos requieren su propio sistema personalizado.

Las hojas de respuestas ópticas suelen tener un conjunto de óvalos o recuadros en blanco que corresponden a cada pregunta, a menudo en hojas de papel separadas. Los códigos de barras pueden marcar la hoja para su procesamiento automático, y cada serie de óvalos rellenos devolverá un cierto valor cuando se lea. De esta manera, las respuestas de los estudiantes pueden registrarse digitalmente o identificarse.

Leyendo

Las primeras hojas de respuestas ópticas se leyeron haciendo brillar una luz a través de la hoja y midiendo cuánta luz estaba bloqueada usando fototubos en el lado opuesto. Como algunos fototubos son en su mayoría sensibles al extremo azul del espectro visible , no se pueden usar bolígrafos azules, ya que las tintas azules reflejan y transmiten la luz azul. Debido a esto, hubo que usar lápices del número dos para rellenar las burbujas; el grafito es una sustancia muy opaca que absorbe o refleja la mayor parte de la luz que lo golpea.

Las hojas de respuestas ópticas modernas se leen en función de la luz reflejada, midiendo la claridad y la oscuridad. No es necesario rellenarlos con un lápiz del número dos, aunque se recomiendan sobre otros tipos (esto se debe a las marcas más claras de los lápices de números más altos y las manchas de los lápices del número 1). Se leerá tinta negra, aunque muchos sistemas ignorarán las marcas que son del mismo color en el que se imprime el formulario. Esto también permite que las hojas de respuestas ópticas sean de doble cara porque las marcas hechas en el lado opuesto no interferirán con las lecturas de reflectancia tanto como con lecturas de opacidad.

La mayoría de los sistemas se adaptan al error humano al completar los óvalos de manera imprecisa; siempre que no se desvíen hacia los otros óvalos y el óvalo esté casi lleno, el escáner lo detectará como llenado.

Errores

Es posible que las hojas de respuestas ópticas se impriman incorrectamente, de modo que todos los óvalos se leerán como rellenos. Esto ocurre si el contorno de los óvalos es demasiado grueso o irregular. Durante las elecciones presidenciales de Estados Unidos de 2008 , esto ocurrió con más de 19.000 votos ausentes en el condado de Gwinnett en Georgia , y se descubrió después de que ya se habían devuelto alrededor de 10.000. La ligera diferencia no fue aparente a simple vista y no se detectó hasta que se realizó una prueba a fines de octubre. Esto requería que todas las boletas fueran transferidas a las correctamente impresas, por trabajadores secuestrados de la junta de elecciones , bajo la estrecha observación de miembros de los partidos políticos demócratas y republicanos (pero no de otros ) y diputados del alguacil del condado . La transferencia, por ley, no podría ocurrir hasta el día de las elecciones (4 de noviembre) .g

Software OMR

Formulario de encuesta OMR en papel normal, sin marcas de registro ni colores omitidos, diseñado para ser escaneado por un escáner de imágenes y software OMR

El software OMR es una aplicación de software que hace que OMR sea posible en una computadora de escritorio mediante el uso de un escáner de imágenes para procesar encuestas, exámenes, hojas de asistencia, listas de verificación y otros formularios en papel normal impresos en una impresora láser.

El software OMR se utiliza para capturar datos de hojas OMR. Mientras que los dispositivos de escaneo de captura de datos se enfocan en muchos factores como el grosor del papel, las dimensiones de la hoja OMR y el patrón de diseño.

Software comercial de OMR

Uno de los primeros paquetes de software OMR que utilizó imágenes de escáneres de imágenes comunes fue Remark Office OMR, fabricado por Gravic, Inc. (originalmente llamado Principia Products, Inc.). Observación Office OMR 1.0 se lanzó en 1991.

La necesidad del software OMR se originó porque los primeros sistemas ópticos de reconocimiento de marcas utilizaban escáneres dedicados y formularios especiales preimpresos con marcas de registro y colores omitidos. Estos formularios suelen costar entre 0,10 y 0,19 dólares la página. Por el contrario, los usuarios del software OMR diseñan sus propios formularios con sentido de marca con un procesador de texto o un editor de formularios integrado, los imprimen localmente en una impresora y pueden ahorrar miles de dólares en una gran cantidad de formularios.

Muchas empresas de procesamiento de formularios (captura de transacciones por lotes) han ofrecido la identificación de marcas ópticas dentro de un formulario, como para procesar formularios de censo, desde finales de la década de 1980. En su mayoría, esto se basa en una imagen bitonal y un recuento de píxeles con recuentos mínimos y máximos de píxeles para eliminar las marcas extrañas, como las que se borran con un borrador sucio que, cuando se convierte en una imagen en blanco y negro (bitonal), puede parecer una marca legítima. . Por tanto, este método puede causar problemas cuando un usuario cambia de opinión, por lo que algunos productos empezaron a utilizar la escala de grises para identificar mejor la intención del marcador; internamente, los scantron y los escáneres NCS utilizaban la escala de grises.

El software OMR también se utiliza para agregar marcas OMR a los documentos de correo para que puedan ser escaneados por el equipo de inserción de carpetas. Un ejemplo de software OMR es Mail Markup del desarrollador británico Funasset Limited. Este software permite al usuario configurar y seleccionar una secuencia OMR y luego aplicar las marcas OMR a los documentos por correo antes de imprimirlos.

Bibliotecas de desarrollo OMR

Empresa Producto Año de fundación
ABBYY Motor ABBYY FineReader 1993
Accusoft FormFix 1991
Aspose Lector y analizador de .NET OMR 2001
Imagen del PIB .NET OMR y SDK de reconocimiento de plantillas 2003
Tecnologías LEAD HERRAMIENTAS 1990
VintaSoft Procesamiento de formularios Complemento NET 2001

Software OMR de código abierto

Algún software OMR desarrollado y distribuido bajo licencias de código abierto o gratuitas:

Lista de software OMR
Nombre Creador Notas Última versión estable Costo ( US $ ) Licencia de software Fuente abierta
FormScanner Alberto Borsetta Aplicación Java multiplataforma, admite formularios personalizados. 2017-06-07 Gratis GPLv3 si
queXF Consorcio Australiano para la Investigación Política y Social incorporado se puede utilizar solo o junto con encuestas exportadas desde LimeSurvey 2019-05-13 Gratis GPLv2 si
Udai OMR Aaditeshwar Seth 2007 Gratis GPLv2 si
Sistema de cuestionario compartido (SQS) 2016 Gratis Licencia de Apache v2.0 si
Opción múltiple automática Alexis Bienvenüe para pruebas de clase, con formato LaTeX 2018-12-29 Gratis GPLv2 si
Prueba de Moodle OMR soporte en línea para cuestionarios fuera de línea realizados en hojas OMR Gratis GPLv3 si
SDAPS: Scripts para la adquisición de datos con encuestas en papel Benjamin Berg para encuestas, admite documentos con formato LaTeX y ODT 2019-06-02 Gratis GPLv3 si
Motor de marca OMR La implementación de C # admite el escaneo masivo con formularios personalizados 2015 Gratis Licencia de Apache v2.0 si
G'n'T Eval Stefan Breunig 2013 Gratis Licencia ISC si

Historia

El reconocimiento óptico de marcas (OMR) es el escaneo de papel para detectar la presencia o ausencia de una marca en una posición predeterminada. El reconocimiento óptico de marcas ha evolucionado a partir de varias otras tecnologías. A principios del siglo XIX y el siglo XX se otorgaron patentes para máquinas que ayudarían a los ciegos.

OMR ahora se utiliza como un dispositivo de entrada para la entrada de datos. Las dos primeras formas de OMR son la cinta de papel y las tarjetas perforadas que utilizan agujeros reales perforados en el medio en lugar de círculos llenos de lápiz en el medio. La cinta de papel se utilizó ya en 1857 como un dispositivo de entrada para el telégrafo. Las tarjetas perforadas se crearon en 1890 y se utilizaron como dispositivos de entrada para computadoras. El uso de tarjetas perforadas se redujo considerablemente a principios de la década de 1970 con la introducción de las computadoras personales. Con el OMR moderno, donde se reconoce la presencia de un lápiz lleno de burbujas, el reconocimiento se realiza mediante un escáner óptico.

El primer escáner de detección de marcas fue el IBM 805 Test Scoring Machine ; esto lee las marcas detectando la conductividad eléctrica de la mina de grafito usando pares de cepillos de alambre que escanearon la página. En la década de 1930, Richard Warren en IBM experimentó con sistemas ópticos de detección de marcas para la puntuación de pruebas, como se documenta en las patentes estadounidenses 2.150.256 (presentada en 1932, otorgada en 1939) y 2.010.653 (presentada en 1933, otorgada en 1935). Everett Franklin Lindquist desarrolló el primer escáner óptico de detección de marcas exitoso, como se documenta en la patente estadounidense 3.050.248 (presentada en 1955, concedida en 1962). Lindquist había desarrollado numerosas pruebas educativas estandarizadas y necesitaba una máquina de puntuación de pruebas mejor que la IBM 805 estándar de entonces.Los derechos de las patentes de Lindquist estaban en manos del Centro de Investigación de Mediciones hasta 1968, cuando la Universidad de Iowa vendió la operación a Westinghouse Corporation .

Durante el mismo período, IBM también desarrolló una máquina de puntuación de prueba de sentido de marca óptico exitosa, como se documenta en la patente de EE.UU. 2.944.734 (presentada en 1957, otorgada en 1960). IBM lo comercializó como el lector de puntuación de marcas óptico IBM 1230 en 1962. Esto y una variedad de máquinas relacionadas permitieron a IBM migrar una amplia variedad de aplicaciones desarrolladas para sus máquinas de detección de marcas a la nueva tecnología óptica. Estas aplicaciones incluían una variedad de formularios de informes de problemas y administración de inventario, la mayoría de los cuales tenían las dimensiones de una tarjeta perforada estándar .

Mientras que los otros actores en el campo de las pruebas educativas se centraron en la venta de servicios de escaneo, Scantron Corporation, fundada en 1972, tenía un modelo diferente; distribuiría escáneres económicos a las escuelas y obtendría ganancias vendiendo los formularios de prueba. Como resultado, muchas personas llegaron a pensar en todas las formas de sentido de marca (ya sea ópticamente detectadas o no) como formas de scantron . Scantron opera como una subsidiaria de M&F Worldwide (MFW) y proporciona sistemas y servicios de prueba y evaluación, y servicios de recolección y análisis de datos a instituciones educativas, empresas y gobiernos.

En 1983, Westinghouse Learning Corporation fue adquirida por National Computer Systems (NCS). En 2000, NCS fue adquirida por Pearson Education , donde la tecnología OMR formó el núcleo del grupo de gestión de datos de Pearson. En febrero de 2008, M&F Worldwide compró el grupo de gestión de datos de Pearson; el grupo ahora es parte de la marca Scantron.

OMR se ha utilizado en muchas situaciones, como se menciona a continuación. El uso de OMR en sistemas de inventario fue una transición entre tarjetas perforadas y códigos de barras y no se usa tanto para este propósito. Sin embargo, OMR todavía se usa ampliamente para encuestas y pruebas.

Uso

El uso de OMR no se limita a escuelas o agencias de recolección de datos; muchas empresas y agencias de atención médica utilizan OMR para optimizar sus procesos de entrada de datos y reducir los errores de entrada. Las tecnologías OMR, OCR e ICR proporcionan un medio de recopilación de datos de formularios en papel. La OMR también se puede realizar utilizando un escáner OMR (cabezal de lectura discreto) o un escáner de imágenes.

Aplicaciones

Formulario de apuestas OMR utilizado en el hipódromo de Fukushima de la Japan Racing Association , Japón.
Boleto de apuestas usando este formulario.

Hay muchas otras aplicaciones para OMR, por ejemplo:

Tipos de campo

OMR tiene diferentes campos para proporcionar el formato que desea el interrogador. Estos campos incluyen:

  • Múltiple, donde hay varias opciones pero solo se elige una. Por ejemplo, el formulario puede solicitar una de las opciones ABCDE; 12345; completamente en desacuerdo, en desacuerdo, indiferente, de acuerdo, completamente de acuerdo; o similar.
  • Cuadrícula: las burbujas o líneas se configuran en formato de cuadrícula para que el usuario ingrese un número de teléfono, nombre, número de identificación, etc.
  • Suma, totaliza las respuestas a un solo valor
  • Booleano, respondiendo sí o no a todas las que apliquen
  • Binario, respondiendo sí o no a solo uno
  • Los campos de líneas punteadas, desarrollados por Smartshoot OMR, permiten la caída de bordes como la caída de color tradicional.

Capacidades / requisitos

En el pasado y en la actualidad, algunos sistemas OMR requieren papel especial, tinta especial y un lector de entrada especial (Bergeron, 1998). Esto restringe los tipos de preguntas que se pueden hacer y no permite mucha variabilidad cuando se ingresa el formulario. El progreso en OMR ahora permite a los usuarios crear e imprimir sus propios formularios y usar un escáner (preferiblemente con un alimentador de documentos) para leer la información. El usuario puede organizar las preguntas en un formato que se adapte a sus necesidades y, al mismo tiempo, puede ingresar fácilmente los datos. Los sistemas OMR se acercan al cien por cien de precisión y solo tardan 5 milisegundos en promedio en reconocer las marcas. Los usuarios pueden usar cuadrados, círculos, elipses y hexágonos para la zona de marca. El software se puede configurar para reconocer burbujas llenas, cruces o marcas de verificación.

OMR también se puede utilizar para uso personal. Hay impresoras todo en uno en el mercado que imprimirán las fotos que el usuario seleccione llenando las burbujas de tamaño y selección de papel en una hoja de índice que se ha impreso. Una vez que se ha llenado la hoja, el individuo coloca la hoja en el escáner para ser escaneada y la impresora imprimirá las fotos de acuerdo a las marcas que fueron indicadas.

Desventajas

También hay algunas desventajas y limitaciones de OMR. Si el usuario desea recopilar grandes cantidades de texto, OMR complica la recopilación de datos. También existe la posibilidad de que falten datos en el proceso de escaneo, y las páginas incorrectas o no numeradas pueden hacer que se escaneen en el orden incorrecto. Además, a menos que existan medidas de seguridad, una página podría volver a escanearse, proporcionando datos duplicados y sesgando los datos.

Como resultado de la adopción generalizada y la facilidad de uso de OMR, los exámenes estandarizados pueden consistir principalmente en preguntas de opción múltiple, cambiando la naturaleza de lo que se está probando.

Ver también

Liza

Referencias