Coordenadas paralelas - Parallel coordinates

Coordenadas paralelas
Ggobi-pulga2

Las coordenadas paralelas son una forma común de visualizar y analizar conjuntos de datos de alta dimensión .

Para mostrar un conjunto de puntos en un espacio n -dimensional , se dibuja un telón de fondo que consta de n líneas paralelas , típicamente verticales e igualmente espaciadas. Un punto en el espacio n -dimensional se representa como una polilínea con vértices en los ejes paralelos; la posición del vértice en el i -ésimo eje corresponde a la i -ésima coordenada del punto.

Esta visualización está estrechamente relacionada con la visualización de series de tiempo , excepto que se aplica a datos donde los ejes no corresponden a puntos en el tiempo y, por lo tanto, no tienen un orden natural. Por lo tanto, pueden ser de interés diferentes disposiciones de ejes.

Historia

A menudo se decía que las coordenadas paralelas fueron inventadas por Philbert Maurice d'Ocagne (fr) en 1885, pero aunque las palabras "Coordonnées parallèles" aparecen en el título del libro, esta obra no tiene nada que ver con las técnicas de visualización del mismo nombre; el libro solo describe un método de transformación de coordenadas. Pero incluso antes de 1885, se utilizaron coordenadas paralelas, por ejemplo en Henry Gannetts "Resumen general, mostrando el rango de los estados, por razones, 1880", o posteriormente en Henry Gannetts "Rango de estados y territorios en la población en cada censo, 1790- 1890 "en 1898. Fueron popularizados de nuevo 87 años después por Alfred Inselberg en 1985 y desarrollados sistemáticamente como un sistema de coordenadas a partir de 1977. Algunas aplicaciones importantes son los algoritmos de prevención de colisiones para el control del tráfico aéreo (1987-3 patentes de EE. UU.), Minería de datos (Patente de EE. UU.), Visión por computadora (patente de EE. UU.), Optimización, control de procesos , más recientemente en detección de intrusiones y en otros lugares.

Mayores dimensiones

En el plano con un sistema de coordenadas cartesianas xy, agregar más dimensiones en coordenadas paralelas (a menudo abreviado || -coords o PCP) implica agregar más ejes. El valor de las coordenadas paralelas es que ciertas propiedades geométricas en grandes dimensiones se transforman en patrones 2D fácilmente visibles. Por ejemplo, un conjunto de puntos en una línea en n -espacio se transforma en un conjunto de polilíneas en coordenadas paralelas que se intersecan en n  - 1 puntos. Para n = 2, esto produce una dualidad punto-línea que indica por qué los fundamentos matemáticos de las coordenadas paralelas se desarrollan en el espacio proyectivo en lugar del euclidiano . Un par de líneas se cruza en un punto único que tiene dos coordenadas y, por lo tanto, puede corresponder a una línea única que también está especificada por dos parámetros (o dos puntos). Por el contrario, se requieren más de dos puntos para especificar una curva y también es posible que un par de curvas no tengan una intersección única. Por lo tanto, al usar curvas en coordenadas paralelas en lugar de líneas, la dualidad de la línea de puntos se pierde junto con todas las demás propiedades de la geometría proyectiva, y los patrones de dimensiones superiores agradables conocidos correspondientes a (hiper) planos, curvas, varias superficies suaves (hiper) , proximidades, convexidad y recientemente no orientabilidad. El objetivo es mapear relaciones n-dimensionales en patrones 2D. Por lo tanto, las coordenadas paralelas no son un mapeo punto a punto, sino más bien un mapeo de subconjunto n D a subconjunto 2D, no hay pérdida de información. Nota: incluso un punto en nD no se asigna a un punto en 2D, sino a una línea poligonal, un subconjunto de 2D.

Consideraciones estadísticas

Muestra representativa de coordenadas paralelas.

Cuando se utiliza para la visualización de datos estadísticos, hay tres consideraciones importantes: el orden, la rotación y la escala de los ejes.

El orden de los ejes es fundamental para encontrar características y, en el análisis de datos típico, será necesario probar muchos reordenamientos. Algunos autores han ideado heurísticas de ordenación que pueden crear ordenaciones esclarecedoras.

La rotación de los ejes es una traslación en las coordenadas paralelas y si las líneas se cortan fuera de los ejes paralelos se puede trasladar entre ellas mediante rotaciones. El ejemplo más simple de esto es girar el eje 180 grados.

La escala es necesaria porque la gráfica se basa en la interpolación (combinación lineal) de pares consecutivos de variables. Por lo tanto, las variables deben estar en una escala común, y hay muchos métodos de escala que se deben considerar como parte del proceso de preparación de datos que pueden revelar puntos de vista más informativos.

Se logra una gráfica de coordenadas paralelas suave con splines. En la gráfica suave, cada observación se mapea en una línea (o curva) paramétrica, que es suave, continua en los ejes y ortogonal a cada eje paralelo. Este diseño enfatiza el nivel de cuantificación para cada atributo de datos.

Leer

Inselberg ( Inselberg 1997 ) hizo una revisión completa de cómo leer visualmente los patrones relacionales de las coordenadas paralelas. Cuando la mayoría de las líneas entre dos ejes paralelos son algo paralelas entre sí, sugiere una relación positiva entre estas dos dimensiones. Cuando las líneas se cruzan en una especie de superposición de formas en X, es una relación negativa. Cuando las líneas se cruzan al azar o son paralelas, muestra que no existe una relación particular.

Limitaciones

En coordenadas paralelas, cada eje puede tener como máximo dos ejes vecinos (uno a la izquierda y otro a la derecha). Para un conjunto de datos d-dimensional, como máximo las relaciones d-1 se pueden mostrar a la vez. En la visualización de series de tiempo , existe un predecesor y sucesor natural; por tanto, en este caso especial, existe una disposición preferida. Sin embargo, cuando los ejes no tienen un orden único, encontrar una buena disposición de ejes requiere el uso de heurística y experimentación. Para explorar relaciones más complejas, los ejes deben reordenarse.

Al disponer los ejes en un espacio tridimensional (sin embargo, todavía en paralelo, como clavos en un lecho ungueal), un eje puede tener más de dos vecinos en un círculo alrededor del atributo central, y el problema de la disposición se vuelve más fácil (por ejemplo, al utilizando un árbol de expansión mínimo ). Un prototipo de esta visualización está disponible como extensión del software de minería de datos ELKI . Sin embargo, la visualización es más difícil de interpretar e interactuar que un orden lineal.

Software

Si bien hay una gran cantidad de artículos sobre coordenadas paralelas, solo hay unos pocos programas destacados disponibles públicamente para convertir bases de datos en gráficos de coordenadas paralelas. Los software notables son ELKI , GGobi , Mondrian , Orange y ROOT . Las bibliotecas incluyen Protovis.js , D3.js proporciona ejemplos básicos. También se ha publicado D3.Parcoords.js (una biblioteca basada en D3) específicamente dedicada a la creación de gráficos de coordenadas paralelas. La biblioteca de análisis y estructura de datos de Python, Pandas, implementa el trazado de coordenadas paralelas, utilizando la biblioteca de trazado matplotlib .

Otras visualizaciones para datos multivariados

  • Gráfico de radar : una visualización con ejes de coordenadas dispuestos radialmente
  • Gráfico de Andrews : la transformada de Fourier de un gráfico de coordenadas paralelas

Referencias

  1. d'Ocagne, Maurice (1885). Coordonnées parallèles et axiales: Méthode de transform géométrique et procédé nouveau de calcul graphique déduits de la considération des coordonnées parallèles . París: Gauthier-Villars.
  2. ^ Gannett, Henry. "Resumen general que muestra el rango de Estados por razones 1880" . Cite journal requiere |journal=( ayuda )
  3. ^ Inselberg, Alfred (1985). "El plano con coordenadas paralelas". Computadora visual . 1 (4): 69–91. doi : 10.1007 / BF01898350 .
  4. ^ Inselberg, Alfred (2009). Coordenadas paralelas: Geometría multidimensional VISUAL y sus aplicaciones . Saltador. ISBN 978-0387215075.
  5. ^ Yang, Jing; Peng, Wei; Ward, Matthew O .; Rundensteiner, Elke A. (2003). "Separación y filtrado de ordenamiento de dimensión jerárquica interactiva para la exploración de conjuntos de datos de alta dimensión" (PDF) . Simposio de IEEE sobre visualización de información (INFOVIS 2003) : 3–4.
  6. ^ a b c Moustafa, Rida; Wegman, Edward J. (2006). "Datos continuos multivariados - Coordenadas paralelas". En Unwin, A .; Theus, M .; Hofmann, H. (eds.). Gráficos de grandes conjuntos de datos: visualización de un millón . Saltador. págs. 143-156. ISBN 978-0387329062.
  7. ^ Moustafa, Rida; Wegman, Edward J. (2002). "Sobre algunas generalizaciones de gráficos de coordenadas paralelas" (PDF) . Seeing a Million, un taller de visualización de datos, Rain Am Lech (Nr.), Alemania . Archivado desde el original (PDF) el 24 de diciembre de 2013.
  8. ^ Inselberg, A. (1997), "Detective multidimensional", Visualización de información, 1997. Actas., Simposio IEEE , págs. 100-107, doi : 10.1109 / INFVIS.1997.636793 , ISBN 0-8186-8189-6
  9. ^ Elke Achtert, Hans-Peter Kriegel , Erich Schubert, Arthur Zimek (2013). "Minería de datos interactiva con árboles de coordenadas paralelas 3D". Actas de la Conferencia Internacional ACM sobre Gestión de Datos (SIGMOD) . Ciudad de Nueva York, NY: 1009. doi : 10.1145 / 2463676.2463696 . ISBN 9781450320375.CS1 maint: varios nombres: lista de autores ( enlace )
  10. ^ Kosara, Robert (2010). "Coordenadas paralelas" .
  11. ^ Coordenadas paralelas en Pandas

Otras lecturas

  • Heinrich, Julian y Weiskopf, Daniel (2013) Estado del arte de las coordenadas paralelas , Eurographics 2013 - Informes sobre el estado del arte, págs. 95-116
  • Moustafa, Rida (2011) Gráficos de densidad de coordenadas paralelas y coordenadas paralelas , Wiley Interdiscipline Reviews: Computational Statistics, Vol 3 (2), págs. 134-148.
  • Weidele, Daniel Karl I. (2019) Coordenadas paralelas condicionales , IEEE Visualization Conference (VIS) 2019, págs. 221–225

enlaces externos