Catálogo de visualizaciones
Catálogo de visualizaciones Compilado por la Décima Generación de la línea de investigación de diseño de información Maestría en Diseño, Información y Comunicación
4
Catálogo de visualización
MADIC 10º
Contenido 6
Introducción
7
Diagramas
17
Gráficos
41
Mapas
49
Tablas
55
Varios
60
referencias
5
6
Catálogo de visualización
Introducción
N
uestra vida cotidiana se encuentra regida por un registro incesante de todo tipo de datos e información. Por ello, la visualización se ha consolidado como una herramienta imprescindible para representar de forma clara y concisa grandes conjuntos de datos, la cual nos permite producir conocimiento sobre tendencias y patrones en distintos fenómenos. Aunque cada día surgen novedosas formas de visualizar datos, los diseñadores de información deben tener en cuenta que no todas las representaciones gráficas son pertinentes para todos los tipos de datos. En realidad, siguiendo las ideas desarrolladas por Ben Fry en Computational Information Design, los procesos de visualización deben guiarse por una pregunta fundamental: ¿cuál es la forma más adecuada de presentar un conjunto de datos? Para ayudar a resolver esta cuestión, los alumnos de la décima generación de la Maestría en Diseño, Información y Comunicación de la UAM Cuajimalpa, en el marco del curso Problemas de Diseño de Información Cuantitativa, presentan este catálogo que enlista algunas de las visualizaciones de datos más comunes, el cual ofrece información sobre sus características generales, su historia y sus usos más frecuentes.
Diagramas
8
Catálogo de visualización
Árbol redes Por: Daniel Sánchez
Descripción
El gráfico de árbol redes o diagrama de estructuras jerárquicas recibe su nombre por la simulación de raíces que salen de una fuente inicial o tronco. El gráfico de árbol redes son un conjunto de datos ordenados uno sobre otro, es decir, son sistemas compuestos de subsistemas relacionados con una estructura jerárquica. Los diagramas de árbol redes pueden representarse de diversas formas mientras se conserve su tronco y los siguientes datos se muestren en jerarquías.
Historia
En 1879 el naturalista y filósofo alemán Ernst Haeckel público en la primer edición de Anthropogenie oder Entwickkelungsgeschichte des menschen (La evolución del hombre), planteó el uso del diagrama de árbol redes para mostrar la historia evolutiva de las especies.
Usos
Se suelen usar para representar descendencias, rutas de ubicación, orden de posición o sistemas de redes.
Anatomía
• Base del tronco con la información inicial o principal • Generaciones o subsistemas con los datos jerarquizados • Datos de las siguientes generaciones o subsistemas. • Ramas que sirven de conector entre las diferentes categorías o subsistemas
MADIC 10º
Anatomía de un Árbol de Redes.
Ernst Haeckel, planteó el uso del diagrama de árbol para mostrar la historia evolutiva de las especies .
Árbol genealógico del hombre (1879).
9
10
Catálogo de visualización
Dendrograma Por: Noemí Del Vecchyo
Descripción
Es un diagrama de árbol que se usa frecuentemente para ilustrar la disposición de los grupos producidos por el agrupamiento jerárquico así como sus niveles de similitud, por lo general se generan a través de un proceso matemático. El nivel de similitud se mide en el eje vertical y las observaciones en el eje horizontal. El propósito de un dendrograma es mostrar la relación entre las distintas unidades al agruparlas en grupos más y más pequeños.
Historia
El término viene del griego “dendro”, “árbol” y “gramma”, “dibujo”. Acuñado en 1953 en inglés por Ernst Mayr en su libro “Methods & Princ. Systematic Zool”.
Usos
Los dendrogramas se utilizan a menudo en biología computacional para ilustrar la agrupación de genes o muestras, a veces sobre mapas de calor.
MADIC 10º
Dendrograma estándar con rectángulos rellenos alrededor de grupos.
11
12
Catálogo de visualización
Diagrama de Sankey Por: Juan Carlos Ramírez
Aunque el recurso visual fue utilizado anteriormente por Charles Joseph Minard en su visualización “Marcha de Napoleón a/y desde Rusia 1812 - 1813”
Historia
Se publicó por primera vez en 1898 para representar los flujos y las pérdidas de energía de un motor de vapor y recibió el nombre de su creador, el ingeniero irlandes Matthew H. P. R. Sankey. Son diagramas de flujo en los que el grosor de las bandas se escala según las cantidades de flujo correspondientes. Por lo general, se encuentran ejemplos de diagramas en los sistemas de energía y financieros, porque ayuda a entender la distribución del flujo de los fenómenos visualizados.
Anatomía
Tienen una estructura parecida a las redes, con nodos y enlaces ponderados. Tanto en escalas (pares) como globales (todas las dimensiones). Su uso exploratorio permite representar las relaciones entre datos categóricos y multidimensionales. Es una herramienta muy práctica para representar balances de forma visual, balances que recopila contribuciones e interrelaciones en sus diferentes sectores. Si bien los balances a menudo se presentan en forma de tabla o de hoja de cálculo, un diagrama de Sankey permite al usuario visualizar las interrelaciones de las variables de una manera mucho más ilustrativa e intuitiva.
MADIC 10º
Arriba: La ilustración creada por AXIOS muestra un diagrama de Sankey que representa a todas las personas que POTUS ha atacado en Twitter desde que asumió el cargo. Abajo: Infografía aplicando un digrama de Sankey
13
14
Catálogo de visualización
Grafo Por: Amaury Galván
Descripción
Se trata de una visualización integrada por un conjunto de objetos representados por pares ordenados de nodos o vértices que mantienen relaciones con otros nodos a través de un conjunto de líneas llamadas aristas que, en su conjunto, definen un orden. Puntualmente, son modelos de datos. En términos tradicionales, las aristas de un grafo no tienen más de dos puntos finales, lo cual sugiere que son capaces de conectar a dos nodos a la vez. Los grafos pueden ser direccionados o no direccionados. Los primeros se caracterizan por establecer relaciones orientadas a una dirección específica Los segundos se caracterizan por definir las relaciones entre nodos sin una dirección específica: si A se relaciona con B por haber escrito un libro, da lo mismo decir que el libro fue escrito por A y B que por B y A.
Historia
En 1736, el matemático Leonhard Euler impulsó la teoría de los grafos mediante la resolución del problema de los Puentes de Königsberg, una ciudad dividida en cuatro regiones por el río Pregolya, a las cuales solo era posible acceder a través de siete puentes. Euler se preguntaba si era posible transitar por las cuatro regiones pasando una sola vez por todos los puentes y volviendo al mismo punto de partida. Para resolver este problema, Euler lo representó mediante un grafo y estableció dos cosas: 1) que los puntos intermedios de un recorrido estuvieran forzosamente conectados a un número par de líneas y 2) que los puntos de partida y de llegada estuvieran conectados a un número impar de líneas. Como el problema definía el punto de partida como el punto de llegada, Euler concluyó que era imposible dar un paseo con las características mencionadas porque, en este caso, no hay ningún punto conectado con un número impar de líneas.
MADIC 10º
Usos
Son utilizados para representar y resolver todo tipo de problemas. Son aplicados a la búsqueda de rutas, al diseño de matrices de datos, al análisis de problemas geográficos, cada vez más, a la investigación en ciencias sociales.
Grafo pez.
15
Gráficos
18
Catálogo de visualización
Los gráficos de coordenadas paralelas son ideales para comparar muchas variables.
Coordenadas paralelas
Por: Raziel Oviedo
Historia
Las coordenadas paralelas fueron inventadas por Maurice D’ocagne en 1885 y más tarde redescubiertas y diseminadas por al Inselberg en 1959. Luego se desarrollaron sistemáticamente y se utilizaron como un sistema de coordenadas a partir de 1977. Algunas aplicaciones importantes son, por ejemplo, los Algoritmos de prevención de colisiones para el tráfico aéreo, la extracción de datos y, más recientemente, los sistemas de detección de intrusos. El éxito de estascoordenadas se deben al artículo “Hyperdimensional Data Analysis Using Parallel Coordinates” (Wegman 1990).
Usos
Este tipo de visualización se utiliza para trazar datos numéricos multivariados. Los gráficos de coordenadas paralelas son ideales para comparar muchas variables y ver las relaciones entre ellas.
En un gráfico de coordenadas paralelas, cada variable recibe su propio eje y todos los ejes se colocan en paralelo entre sí. El orden en el que están dispuestos los ejes puede afectar la forma en que el lector entiende los datos. Una razón para esto es que las relaciones entre variables adyacentes son más fáciles de percibir que para las variables no adyacentes. La desventaja de parcelas de coordenadas paralelas, es que pueden acabar demasiado abarrotadas y, por tanto, ilegibles cuando tienen muchos datos. La mejor manera de remediar este problema, es a través de la interactividad y una técnica conocida como «cepillado». El cepillado resalta una línea o colección de líneas seleccionadas, mientras que se desvanecen todos los demás. Esto le permite aislar las secciones de la trama que le interesa, mientras filtra el ruido.
MADIC 10º
Arriba: En un gráfico de coordenadas paralelas, cada variable recibe su propio eje y todos los ejes se colocan en paralelo entre sí. Abajo: Anatomía de Coordenadas Paralelas
19
20
Catálogo de visualización
Gráfico de araña Por: Daniel Sánchez
Descripción
Gráfico de araña o también llamado Diagrama de radar o araña, recibe su nombre por la apariencia que tiene que simula una telaraña.
Historia
En 1877 el economista alemán George Von Mayr planteó el concepto del gráfico o diagrama de radar para comparar y analizar los datos, de este modo tomar una decisión pertinente.
Usos
Este tipo de gráfico se emplea usualmente para representar datos crecientes que pueden variar en algún momento. Para interpretar este tipo de gráfico, se fija un límite, después se analiza qué datos están más cerca y cuáles más alejados del límite. Los gráficos de araña pueden representarse de diversas formas y con diversa cantidad de ejes, lo importante es pensar en las personas en las que tendrán interacción con el diagrama para que los datos sean fáciles de entender. También se usa para mostrar rendimiento, analizar competencias, cifras de ventas, mostrar puntajes o calificación.
En 1877 el economista alemán George Von Mayr planteó el concepto del gráfico o diagrama de radar
Anatomía
Punto central está ubicado en el centro a partir del cual se trazan los ejes. Ejes son las variables a representar, a estos se les asignan nombres según lo que se va a comparar. Las cuadrículas son los enlaces en que se dividen los gráficos, después del punto central las cuadrículas tienen diferentes valores que van en aumento. Valores son los trazos que se unen en los valores de cada eje para mostrar y comparar los datos.
MADIC 10º
Anatomía y estructura de un gráfico de araña
21
22
Catálogo de visualización
Gráficos de barras Por: Daniel Sánchez
Descripción
El gráfico de barras, también llamado diagrama de barras y/o columnas. Son útiles para comparar un valor con otro. Además, sirven para resumir un conjunto de datos por categorías de variable cualitativa y su frecuencia de aparición en una muestra. Es el gráfico más común y conocido.
Historia
El economista William Playfair en 1781 introdujo la invención del diagrama de barras. Playfair elaboró un diagrama de barras horizontal para consignar el comercio exterior de importaciones y exportaciones de Escocia con diversos países. Este es el único diagrama de este tipo que aparece en la obra: Commercial and Political Atlas.
Historia universal del comercio desde 1500 a. C hasta 1805.
Usos
Esta representación tiene la finalidad de ayudar a las personas a que puedan comparar datos por medio de dos ejes y una cantidad de barras para representar los datos. Existen 4 tipos de gráficos de barra: El más conocido y usado es el gráfico de barras sencillo. Representa los datos de una única serie o conjunto de datos.
Se pensó que el gráfico de berras era menos útil que el cronograma.
Los otros tres representan datos de dos o más series o conjuntos de datos. En el gráfico de barras agrupado cada serie se representa en un mismo color. Las barras se colocan una al lado de otra para comparar las series de datos. En el gráfico de barras apilado cada serie se representa en un mismo color. Las barras represen muestra la población por sexo y rangos de edad en un momento determinado.
MADIC 10º
Anatomía de una gráfica de barras.
Anatomía
• Eje Y ubicado en la parte izquierda de forma vertical que son usados para medir la frecuencia de los datos o los número de veces que algo sucede o se realiza durante un período.
• Eje X en la parte inferior de forma horizontal que son para clasificar los datos o la relación ordenada de aquello que se desea mostrar. • Datos se mostrarán en barras. • Líneas de la cuadrícula que permite al usuario comprender los datos.
23
24
Catálogo de visualización
Gráfico de bigotes Por: Mónica González
Descripción
John W. Tukey (1915-2000), de la Universidad de Princeton (EEUU), definió en 1970 el diagrama de caja (‘box-plot’ en inglés). Este gráfico se utiliza cuando deseamos explicar cómo se distribuyen una serie de datos cuantitativos. Otras opciones para reflejar distribuciones son los histogramas y las curvas de distribución. En comparación con estas últimas, el gráfico de caja es más sencillo de entender, más claro y, por tanto, hace más rápida la comprensión visual. Exploratory Data Analysis , 1977
Anatomía
El gráfico de caja representa cinco datos estadísticos en una sola dimensión: el valor mínimo, el cuartil inferior (percentil 25), la mediana, la media, el cuartil superior (percentil 75) y el valor máximo. Los cuartiles son los valores que dividen los datos en cuatro partes iguales. Los percentiles, en cambio, dividen los datos en cien partes iguales. De esta forma, el cuartil inferior (Q1) se corresponde con el percentil 25 y el cuartil superior (Q3) con el percentil 75. Caja: La longitud de la caja representa la distancia entre. Líneas verticales (bigotes):
Representan los valores máximos (corte superior) y mínimos (corte inferior) del conjunto de datos. Sirven de referencia para ubicar las observaciones que están por fuera del 50% central de la distribución. Son muy valiosos para observar los valores atípicos (‘outliers’) y las dispersiones de los puntos con respecto a los percentiles. Los percentiles 25 y 75: la escala que va desde el primer cuartil al tercer cuartil. •Punto interior de la caja: Representa la media. •Línea interior de la caja: Representa la mediana.
MADIC 10º Arriba: El término ‘software’ fue usado por primera vez por John Wilder Tukey en el año 1957, creador del diagrama de caja. Abajo: Evolución de la potencia de salida (Kwatts;). Cada gráfico de caja representa un día en concreto.Morfología del gráfico de caja: el valor mínimo, el valor máximo, la mediana, el primer cuartil y el tercer cuartil de los datos.
25
26
Catálogo de visualización
Gráfico de Líneas Por: Leonardo Bautista
Descripción
Son útiles para la representación de datos en función del tiempo. La mayoría de este tipo de gráfico son muy similares a los creados contemporáneamente, no han sufrido cambios drásticos al paso de tiempo.
Historia
El economista William Playfair (17591823) creó diversos gráficos de líneas Para representar los datos económicos en función del tiempo que se publicaron por primera vez en su Commercial and Politicial Atlas, de 1786. También se le atribuye una gran aportación al Teólogo, científico y filósofo británico Joseph Priestley (1733-1804) presento el tiempo de manera lineal utilizando intervalos regulares a lo largo del gráfico
William Playfair creó “Linear Chronology, Exhibiting the Revenues, Expenditure, Debt, Price of stocks & Bread, from 1770 to 1824” Cada color representa datos categóricos: rojo para ingresos, verde para gastos, amarillo para el pan, etc.
Anatomía
El sistema gráfico lineal comprende de ciertos elementos principales: Escala temporal: es uniforme y se presenta de manera aritmética, según la idea del tiempo absoluto de Newton Indicadores temporales: flechas que se conectan mediante líneas para facilitar la percepción de la divisiones temporales. Secciones temáticas: Las secciones temáticas horizontales son separadas por línea. Indicadores de línea: la longitud de la línea se utiliza para representar duración (líneas vitales) Diferenciador de linea: los niveles de incertidumbre se representan mediante la calidad de línea( continuas o descontinuas) y añadiendo puntos
MADIC 10º
Serie de graficos lineares interctivosde Ben fry para “The Fortune 500” cuenta con 84,000 datos
27
28
Catálogo de visualización
Histograma Por: Noemí Del Vecchyo
Descripción
Es un gráfico que visualiza la distribución de los datos a lo largo de un periodo de tiempo determinado. Cada barra representa la manera en la que se distribuyen los datos en una única categoría, y cada barra representa un rango continuo de datos o la frecuencia en cada intervalo. Los histogramas ayudan a darnos una idea estimada de en dónde se concentran los valores, cuáles son los extremos y si hay vacíos o valores inusuales. También son útiles para dar una visión aproximada de la distribución de probabilidad.
Historia Karl Pearson el 18 de noviembre de 1891, el autor acuñó el término “histograma”
El histograma fue introducido por primera vez por el matemático estadístico inglés Karl Pearson el 18 de noviembre de 1891, el autor acuñó el término “histograma” para designar un “diagrama de tiempo” en su conferencia “Maps and Chartograms” El término es un compuesto de los términos griegos “histós”, “mástil” y “gramma”, “dibujo”.
Usos
Numero de cactáceos adquiridos
Útil cuando se tiene un amplio número de datos que se necesitan organizar para analizarlos detalladamente o tomar decisiones con base en los datos. Medio eficaz para transmitir información sobre un proceso de manera precisa. Permite comparar resultados. Ayuda a mejorar procesos de calidad. Puede ser un punto de partida para generar hipótesis acerca de un funcionamiento insatisfactorio.
MADIC 10º
El precio sangriento de Irak
29
30
Catálogo de visualización
Lente de encuesta Por: Amaury Galván
Descripción
A grandes rasgos, es un modelo de visualización computacional, interactivo y tabular de un conjunto de datos multivariado. La lente de encuesta —también conocida como table lens o survey plot— distribuye tres o más variables numéricas tales como frecuencia, tasa o cantidad, en función de una variable categórica. Es visualización que toma un conjunto complejo de datos y les asigna una codificación visual específica en función de su valor o dimensión. El ejemplo más común de la lente de encuesta es la representación tabular de un valor numérico a través de una barra de color cuya longitud es proporcional a dicho valor. Debido a que trabaja con conjuntos de datos multivariados, esta visualización posee una gran capacidad para enfocar filas específicas mediante su selección y para analizar los datos en su forma textual. Así, lo que en principio es una masa ilegible de datos, la lente de encuesta lo convierte en registros simples y navegables niveles de escalabilidad.
Historia
Este modelo de visualización fue presentado por Ramana Rao y Stuart K. Card en 1994, como una alternativa para manipular grandes cantidades de datos. Su interés era crear una técnica basada en la Interacción Humano-Computadora que permitiera analizar y manipular grandes conjuntos de datos. Por ello, decidieron crear una interfaz que permitiera obtener tanto una mirada global de los registros como una mirada profunda y detallada.
Usos
Esta visualización es una herramienta bastante útil cuando queremos obtener una vista panorámica de las características de un conjunto de datos multivariado, o cuando se busca analizar las dimensiones de cada uno de los registros. Puede ser empleada para analizar hábitos, registros médicos o fenómenos meteorológicos y un sinfín de tipos de datos en busca de patrones.
MADIC 10º
El béisbol Estadísticas mesa contiene 323 filas por 23 columnas por a total de 7429 células.
31
32
Catálogo de visualización
Matriz de permutación Por: Mónica González
Descripción
Una permutación o matriz de permutación es en matemáticas una matriz donde exactamente en cada fila y cada columna una entrada es una, y todas las demás entradas son cero. Cada matriz de permutación corresponde exactamente a un intercambio de posición número o elementos en un espacio muestral de un conjunto finito de números. Si una matriz de permutación se multiplica por un vector, los componentes del vector se intercambian de acuerdo con esta permutación. Las matrices de permutación son ortogonales, doble estocásticas y enteras unimodulares. Las matrices de permutación se utilizan en álgebra lineal, combinatoria y criptografía, entre otras. Casos especiales La matriz de permutación idéntica es la matriz de identidad . Una matriz de permutación es simétrica si y sólo si la permutación subyacente es en sí misma inversa . Si una matriz de permutación tiene una estructura de bloques, la permutación subyacente se puede representar como la suma de permutaciones .
MADIC 10º
33
34
Catálogo de visualización
Tree Maps Por: Noemí Del Vecchyo
Descripción
Es un gráfico para visualizar la estructura jerárquica de un diagrama de árbol mientras muestra las cantidades para cada categoría a través del tamaño del área. A cada categoría se le asigna un rectángulo y dentro de este otros rectángulos correspondientes a las subcategorías. Cuando se les asigna a las categorías una cantidad el tamaño del área es proporcional a esta cantidad. La manera de dividir y ordenar el Tree Map depende del algoritmo de mosaico que se utilice. El “algoritmo de cuadrado” que como su nombre lo dice mantiene el gráfico como un cuadrado, es uno de los más utilizados. El tamaño y color de cada rectángulo se usan para mostrar dimensiones numéricas independientes de los datos.
“Durante 1990, en respuesta al problema común de un disco duro lleno, me obsesioné con la idea de producir una visualización compacta de estructuras de árbol de directorios. Dado que el disco duro de 80 Megabytes en HCIL era compartido por 14 usuarios, era difícil determinar cómo y dónde se usaba el espacio. Encontrar archivos grandes que pudieran eliminarse, o incluso determinar qué usuarios consumían la mayor cantidad de espacio en disco eran tareas difíciles.” (Shneiderman, 1998).
Historia
Los mapas de árbol se desarrollaron en el Laboratorio de interacción humano-computadora de la Universidad de Maryland a partir de 1990, por Ben Shneiderman quien originalmente desarrolló los mapas de árboles como una forma de visualizar un extenso directorio de archivos en un ordenador, sin ocupar demasiado espacio en la pantalla. Proyecto infográfico de la agencia Ferdio, acerca de los colores de las banderas en todo el mundo
MADIC 10º
Lauren Manni, Visualización de datos en treemap
Usos
Al trabajar con grandes cantidades de datos cuando se quiere identificar patrones. Son eficaces para facilitar la lectura porque muestran mucha información en una misma pantalla.
Ejemplo del uso de un treemap en la visualización de información
35
36
Catálogo de visualización
Visual diff Por: Amaury Galván
Aplicación de visual diff en textos.
Descripción
Es una técnica de visualización computarizada, basada en la comparación de entornos, conjuntos u objetos de datos. Tal y como su nombre indica, se trata de una estructura que, por lo general, remarca las diferencias existentes entre dos distintas columnas entrelazadas por curvas, líneas, barras de color o gradientes.
Historia
Visual diff o simplemente diff, es una herramienta desarrollada por Douglas Mcllroy y James W. Hunt para el sistema operativo Unix durante la década de los años setenta. Desde sus inicios, esta técnica fue utilizada para editar y comparar líneas de código, con el fin de depurar aquellos archivos de código para software no actualizados.
Usos
Es una herramienta empleada generalmente por programadores para comparar distintas versiones de sus proyectos. A través de una utilidad de visual diff,
En la imagen se muestra cómo se puede usar Visual Diff en la visión por computadora para señalar la diferencia entre las imágenes.
es posible detectar distintos atributos que se encuentran presentes en un código. También, considerando que en los entornos digitales el flujo de datos es potencial e infinitamente actualizable, es un instrumento que puede ayudar a identificar nuevas adiciones, errores, replicaciones, supresiones o patrones de datos.
MADIC 10º
Ejemplo de un diagrama de dispersión mostrar valores usando coordenadas cartesianas.
Gráfico de dispersión Por: Melina Ávila
Descripción
Colección de puntos desconectados repartidos en un plano para mostrar valores usando coordenadas cartesianas. Generalmente, se considera una representación bidimensional porque cada eje representa una variable o dimensión.
Aplicación
Resulta útil para apreciar tendencias en los datos en conjunto. Ideal cuando se cuenta con datos numéricos emparejados en una tabla y se desea ver si una variable afecta a la otra (correlación), recordando que la correlación no es causal y otra variable inadvertida puede estar influyendo en los resultados.
Historia
Considerada una derivación de la representación cartográfica, la conformación básica se acredita a J. F. W. Herschel en 1833. Se incorporó a la representación estadística a principios del s. XX.
Anatomía • • • •
Eje X, representando una variable A Eje Y, representando una variable B Coordenadas cartesianas Puntos distribuidos en el plano que representan cada valor del conjunto • Línea de mayor ajuste presenta qué tan próximos están los puntos representados a una relación lineal
37
38
Catálogo de visualización
Rubber Sheet Por: Raziel Oviedo
Historia
Los mapas de calor se originaron en visualizaciones 2D de los valores en una matriz de datos. Los valores más grandes estaban representados por pequeños cuadrados grises oscuros o negros (píxeles) y los valores más pequeños por cuadrados más claros. Toussaint Loua [ fr ] (1873) utilizó una matriz de sombreado para visualizar las estadísticas sociales en los distritos de París. Sneath (1957) mostró los resultados de un análisis de conglomerados permutando las filas y las columnas de una matriz para colocar valores similares cerca uno del otro de acuerdo con el agrupamiento. Jacques Bertin usó una representación similar para mostrar datos que se ajustaban a una escala de Guttman. La idea de unir árboles de grupos a las filas y columnas de la matriz de datos se originó con Robert Ling en 1973. Ling usó caracteres de impresora superpuestos para representar diferentes tonos de gris, un ancho de carácter por píxel. Leland Wilkinson desarrolló el primer programa informático en 1994 (SYSTAT) para producir mapas de calor de cúmulos con gráficos en color de alta resolución.
Arriba: Una isosuperficie es una superficie que representa puntos de un valor constante dentro de un volumen de espacio. Abajo: Este ejemplo se puede usar para mapear la intensidad de la señal Wifi en el espacio con múltiples enrutadores.
Usos
Rubber sheet u hoja de goma es un mapa muchas veces llamado mapa de calor en tercera dimensión. Por lo general se utiliza para el diseño de información relacionada con la geografía. A excepción del mapa en dos dimensiones, también puede contener al menos dos tipos de información que se puede representar por alturas y colores. La hoja de goma suele compararse con las isosuperficies, que tienen características similares. Siempre se utilizan para visualizar la temperatura, el clima y la corriente oceánica. Éste método de visualización generalmente se usa para hacer un modelo físico.
MADIC 10º
Se utiliza para el diseño de información relacionada con la ubicación geográfica.
Utlizados como modelos de visualización física.
39
MADIC 10º
Mapas
41
42
Catálogo de visualización
Mapas Cartográficos Por: Leonardo Bautista
Descripción
Podemos encontrar el término mapa en varios campos del conocimiento, y en general se puede definir como: un diagrama o colección de datos que muestra la distribución espacial de algo a las posiciones relativas de sus componentes
Historia
El uso más antiguo (c 1527), y tal vez el más frecuente, del término mapa hace referencia a las representaciones de datos geográficos, que van desde la superficie de la Tierra hasta partes de la misma. Se considera que Bertin fue el pionero en proponer una teoría de la representación gráfica de los datos para uso en mapas.
Aplicación
mapa y la distancia correspondiente sobre la tierra. Siempre se expresa sobre la base de uno, de tal manera que en un mapa a escala 1:10,000, 1 unidad representa 10,000 unidades. La elección de la escala se determina por dos factores: El objetivo del mapa y el resultado que persigue. Existen seis métodos gráficos usados principlamente en los mapas temáticos para representar tipo de datos cualitativos y cuantitativos: 1. Mapas de distribución por puntos 2. Mapas de símbolos graduados 3. Mapas de flujo y red 4. Mapas isometricos e isopléticos 5. Mapas coropléticos 6. Cartogramas de área y distancia
Los mapas suelen usarse en otras disciplinas, como la genética, o bien en representaciones esquemáticas del orden y la distancia de los genes y en matemáticas, como correspondencias entre dos o más conjuntos de elementos. Visualizar datos con mapas implica tres aspectos básico: proyección, escala y simbolización. Proyecciones cartográficas: Son transformaciones matemáticas de la superficie tridimensional del globo terrestre, las superficies desarrollables las encontramos de tres tipos (plano, Pierre Charles Duplin (1826), se le atribuye cilindro y cono) el primer mapa estadístico moderno. La escala del mapa. Es el grado de reducción del mapa. Es la relación entre la distancia sobre el
MADIC 10º
Arriba: Ben Fry (2004) Mapa de los códigos postales de Estados Unidos, por cada código se coloca un punto según las coordenadas de latitud y longitud Centro: Mapa de los principales flujos migratorios Abajo: A diferencia de los demás mapas estos pueden distorsionar la forma de las regiones geográficas
43
44
Catálogo de visualización
Isolíneas Por: Melina Ávila
Descripción
Es una derivación de los mapas topográficos. Se dibujan sobre una representación geográfica conectando puntos del mismo valor. La escala numérica depende de la escala del mapa y de la naturaleza de la información, pero es indispensable mantener intervalos iguales en los valores. Sin embargo, puede resultar difícil de leer si las líneas aparecen muy juntas. Las diferentes clases de isolíneas se nombran con el prefijo iso- seguido de la raíz de la variable representada.
Aplicación
Representar información numérica de cartografía y reconocer patrones de una medición en un área geográfica. Resulta útil para apreciar cambios graduales. Se utiliza para representar mediciones topográficas o meteorológicas (altura, temperatura, presión atmosférica, precipitación), incluso densidad de población y contaminación.
Formas de representación de los Isomapas
Historia
En 1701, Edmond Halley utilizó isolíneas sobre una gráfica de variación magnética. Muchas representaciones similares siguieron a lo largo del s. XVIII. Esta representación fue adoptada por el Servicio de Cartografía Estatal del Reino Unido en 1843.
Anatomía
• Contorno de un área geográfica como base • Siluetas creadas a partir de la conexión de puntos. • Gradiente cromática de relleno • Etiqueta connotando la escala de color correspondiente a los valores numéricos
MADIC 10º
Intensidad de precipitación anual en Corea (1981-2010)
La interpretación de este tipo de diagramas son muy perceptibles al representar variantes de clima
45
46
Catálogo de visualización
Mapa de Calor Por: Raziel Oviedo
Historia
Los mapas de calor se desarrollaron por primera vez en el siglo XIX y se originaron en la visualización 2D de datos en una matriz. El primer uso conocido de mapas de calor se le atribuye a Loua en 1873 por presentar varias estadísticas sociales en París usando colores. El mapa de calor de Loua usaba gris oscuro y negro para denotar métricas de valor más alto y colores claros como blanco y gris claro para denotar métricas de valor más bajo. Los mapas de calor siguieron ganando popularidad como método para presentar datos a lo largo del siglo XX.
Usos
Un mapa de calor es una disposición de rectángulos. Todos los rectángulos son del mismo tamaño, a diferencia de lo que sucede en un mapa de árbol. El eje ‘x’ suele ser alguna medida de tiempo, pero puede ser cualquier variable con agrupaciones. El eje ‘y’ es una variable que define las categorías de los datos. Los rectángulos están coloreados para mostrar la magnitud de una tercera variable. Aunque al principio se usaban para temperaturas, los mapas de calor se utilizan ahora para muchos tipos de datos. Los mapas de calor resultan útiles para grandes conjuntos de datos. Los rectángulos del mapa de calor se pueden etiquetar con valores de la variable de color, lo cual solo es útil en casos en los que haya muy pocas categorías en el eje y.
MADIC 10º El primer uso conocido de mapas de calor se le atribuye a Loua en 1873 representando varias estadísticas sociales en París usando colores
Mapa de calor que muestra los cambios de población por región en función del tiempo.
Mapa de calor de temperaturas máximas en tres aeropuertos de EE.UU. por semana del año.
47
48
Catálogo de visualización
MADIC 10º
Tablas
49
50
Catálogo de visualización
Tabla Por: Melina Ávila
Descripción
Esquema de información cuantitativa relacional repartida en celdas cuadriculadas. Contiene información referente a un solo tema y la descripción de su contenido debe mantenerse entendible sin referencia a un texto. Diferentes tablas pueden ser complementarias y relacionarse mediante una columna en común, denominada clave primaria.
Aplicación
Organizar información demasiado complicada o detallada para describirse adecuadamente en texto lineal. Es una manera de sintetizar resultados y volver un escrito más leíble al remover la información numérica. Permite apreciar y contrastar los resultados rápidamente y resaltar tendencias o patrones en los datos.
Historia
En las oficinas de contabilidad durante la Edad Media, las mesas se cubrían con una tela cuadriculada para contar dinero, convirtiéndose en una visualización de información concreta. En el s. XIX, se estilaba representar las tablas sólo mediante indentación para resaltar las columnas. A partir de los años 30, El New York Times incorporó de forma permanente visualizaciones y tablas en sus publicaciones.
Contiene información referente a un solo tema y la descripción de su contenido debe mantenerse entendible sin referencia a un texto.
MADIC 10º
Anatomía
Título: que describa el contenido. Columnas: También llamadas atributos, son campos que albergan información de un aspecto del tema de la tabla mediante diferentes tipos de datos. Los encabezados deben ser descriptivos del contenido. Filas: Registros (contiene información particular de un elemento de la tabla) Valor de la celda Clave primaria: (en tablas relacionales) Clave que identifica a cada uno de los registros de la tabla. Se puede conocer también como ID, número de serie, código. Clave externa: (en tablas relacionales) Campo en una tabla que corresponde a la clave primaria de otra tabla.
Anatomía de una tabla
51
52
Catálogo de visualización
Media matriz Por: Mónica González
Descripción
Media Matriz o Matriz de correlación Una matriz de correlación es una tabla que muestra los coeficientes de correlación entre variables. Cada celda de la tabla muestra la relación entre dos variables. Se utiliza una matriz de correlación para resumir los datos, como entrada para un análisis más avanzado y como diagnóstico para análisis avanzados. Las decisiones clave que se deben tomar al crear una matriz de correlación incluyen: elección de la estadística de correlación, codificación de las variables, tratamiento de los datos faltantes y presentación. Por lo general, una matriz de correlación es “cuadrada”, con las mismas variables que se muestran en las filas y columnas. He mostrado un ejemplo a continuación. Esto muestra correlaciones entre la importancia declarada de varias cosas para las personas. La línea de 1.00s que va de arriba a la izquierda a abajo a la derecha es la diagonal principal, lo que muestra que cada variable siempre se correlaciona perfectamente consigo misma. Esta matriz es simétrica, con la misma
correlación que se muestra arriba de la diagonal principal siendo una imagen especular de las que están debajo de la diagonal principal. Hay tres razones generales para calcular una matriz de correlación: 1. Para resumir una gran cantidad de datos donde el objetivo es ver patrones. En nuestro ejemplo anterior, el patrón observable es que todas las variables se correlacionan altamente entre sí. 2. Para ingresar en otros análisis. Por ejemplo, las personas suelen utilizar matrices de correlación como entradas para el análisis factorial exploratorio, el análisis factorial confirmatorio, los modelos de ecuaciones estructurales y la regresión lineal cuando se excluyen los valores faltantes por pares. 3. Como diagnóstico a la hora de comprobar otros análisis. Por ejemplo, con la regresión lineal, una gran cantidad de correlaciones sugiere que las estimaciones de la regresión lineal no serán confiables.
MADIC 10º
53
Matriz Por: Mónica González
Descripción
Una matriz es un conjunto de elementos de cualquier naturaleza y que en general, suelen ser números ordenados en filas y columnas. Las matrices se utilizan en el cálculo numérico, en la resolución de sistemas de ecuaciones lineales, de las ecuaciones diferenciales y de las derivadas parciales. Además de su utilidad para el estudio de sistemas de ecuaciones lineales, las matrices aparecen de forma natural en geometría, estadística, economía, informática, física, etc. La utilización de matrices, constituye actualmente una parte esencial de los lenguajes de programación, ya que la mayoría de los datos se introducen en las computadoras como tablas organizadas en filas y columnas: hojas de cálculo y bases de datos entre otras cosas.
Las matrices se nombran de acuerdo al tamaño de filas y columnas
Varios
56
Catálogo de visualización
Chernoff Faces Por: Leonardo Bautista
Historia y Aplicación
La técnica facial fue propuesta originalmente por Chernoff (1973). Es útil para mostrar por medio de rasgos faciales datos. Cada rostro puede ser asociada a una variable. La mayoría de la gente está acostumbrada a distinguir las diferentes características que tiene un rostro. Como Chernoff (1973) dijo: “La gente crece estudiando y reaccionando a las caras todo el tiempo, se detectan fácilmente y provocan reacciones emocionales.” Percibimos el rostro muy rápido para seleccionar la información relevante y filtrarla. El procedimiento es a la vez relativamente lúcido y adaptable y se puede modificar para adaptarse a los requisitos previos de casi cualquier dato a colocar. Chernoff (1973) describe su uso en campos tan diversos como el estudio de fósiles, en geología, y Huff et al. (1981) usan las caras para ilustrar progresiones de fracaso y éxito empresarial. El método de Chernoff (1973) puede manejar 18 variables como máximo. Flury y Riedwyl (1981) han ampliado el procedimiento para manejar hasta 36 variables. Estos cambios se logran modificando las características simétricas (por ejemplo, nariz, boca, cabello) a asimétricas, lo que significa que el lado izquierdo de la boca puede verse diferente al derecho, rara vez es necesario, sin embargo, 36 variables desecharían las ventajas de la técnica original, que dependen principalmente de la simplicidad y la capacidad de presentar los datos pertinentes visualmente. El primer mapa temático usando Chernoff face (1977) “Life in LA,1970”Eugene Turner
Un problema a considerar de esta visualización es, que la asignación subjetiva de características tiene un efecto notable en la forma final del rostro. Chernoff y Rizvi (1975) señalan que si el propósito del análisis de datos es simplemente la clasificación en grupos, las variables más importantes entonces, deben asignarse a las características más destacadas. Por ejemplo el uso de rostros para la representación del desempeño financiero corporativo usaría la curvatura de la boca (sonrisa o ceño fruncido) para describir una variable como el rendimiento de los activos, y la representación de datos de productos estratégicos usaría la boca para representar la participación de los mercado financiero.
MADIC 10º
La distribución de votos, vivienda, empleo y composición industrial en las elecciones generales de 1983, Danny Dorling, 1991
57
58
Catálogo de visualización
Referencias Información Fry. B (2004). Computational Information Design [Tesis doctoral, Instituto Tecnológico de Massachusetts]. https://www.media.mit.edu/publications/computational-information-design/ Tabla de lens, visual diff, lente de encuesta. Corey L. Lanum. (2016). Visualizing Graph Data. Nueva York: Manning. Kawa Nazemi. (2016). Adaptive Semantics Visualization. Suiza: Springer. Luella Qinglu Lu. (2019). Visual Diff. enero 8, 2022, de Parsons Sitio web: https://dvia.samizdat.co/2019/visual-diff/ Ramana Rao & Stuart K Card. (Abril, 1994). The Table Lens: Merging Graphical and Symbolic Representations in an Interactive Focus+Context Visualization for Tabular Information. Proceedings of the ACM SIGCHI Conference on Human Factors in Computing Systems, I, pp. 318-322. Gráfico de dispersión, tabla e isolínea (s.f.). The Data Visualisation Catalogue. Diagrama de Dispersión. Recuperado en enero 15, 2022, de http://datavizcatalogue.com/ES/metodos/diagrama_de_dispersion.htm (s.f.). Corporate Finance Institute. Scatter Plot - Overview, Applications, How To Create. Recuperado en enero 15, 2022, de: http://corporatefinanceinstitute.com/resources/knowledge/other/scatter-plot/ Friendly, M., & Denis, D. (2005). The early origins and development of the scatterplot. Journal of the History of the Behavioral Sciences, 41(2), 28. Recuperado de: https://datavis.ca/papers/friendly-scat.pdf doi:10.1002 /jhbs.20078 Slutsky D. J. (2014). The use of tables. Journal of wrist surgery, 3(4), 219. https://doi.org/10.1055/s-0034-1395165 (2021). Microsoft Support. Introduction to tables. Recuperado en enero 15, 2022, de http://support. microsoft.com/en-us/office/introduction-to-tables-78ff21ea-2f76-4fb0-8af6-c318d1ee0ea7 Kopf, D. (2016, septiembre 14). Priceonomics. When Did Charts Become Popular?. Recuperado en enero 15, 2022, de http://priceonomics.com/when-did-charts-become-popular/ (2018, diciembre 19). The GIS Encyclopedia. Isoline. Recuperado en enero 15, 2022, de: http://wiki.gis.com/wiki/index.php/Isoline (2017, marzo 29). Geographic Information Technology Training Alliance. Isoline maps. Recuperado en enero 15, 2022, de http://www.gitta.info/ThematicCart/en/html/TypogrDesign_learningObject7.html Histograma Scarr, S.. (Diciembre 17, 2011). Iraq’s bloody toll. Enero, 2022, de South China Morning Post Sitio web: https://www.behance.net/gallery/5098739/Infographics-and-data-visualisation/modules/40291219 Thomas, A.. (Julio, 2017). Free Willy and Flipper by the Numbers. Enero, 2022, de The Pudding Sitio web: https://pudding.cool/2017/07/cetaceans/ Easy Guides. (Febrero 7, 2017). Practical Guide to Cluster Analysis in R – Book. Enero 2022, de R bloggers Sitio web: https://www.r-bloggers.com/2017/02/practical-guide-to-cluster-analysis-in-r-book/Díaz, A. (2018). Las 7 Herramientas de Calidad. ( #3 Histograma). 2022, enero, de: Steemit Sitio web: https://steemit.com/spanish/@adiazrojas13/las-7-herramientas-de-calidad-3-
MADIC 10º histograma Riaño, D.. (2017). On the origin of Karl Pearson’s term “histogram” . Estadística Española, 59, 29-35. 2022, enero, De Instituto Nacional de Estadística Base de datos. Anónimo. (-). Histogram. 2022, enero, de Ferdio Sitio web: https://datavizproject.com/data-type/histogram/# Ribecca, S.. (-). Histograma. 2022, enero, de Severino Ribecca Sitio web: https://datavizcatalogue.com/ ES/metodos/histograma.html Anónimo. (-). Gráficos de histograma. 2022, enero, de IBM Corporation Sitio web: https://www.ibm. com/docs/es/spss-statistics/beta?topic=types-histogram-charts
Dendrograma Anónimo. (-). Dendrogram. 2022, enero, de Ferdio Sitio web: https://datavizproject.com/data-type/dendrogram/ Anónimo. (2019). Dendrograma. 2022, enero, de Minitab Sitio web: https://support.minitab.com/esmx/minitab/18/help-and-how-to/modeling-statistics/multivariate/how-to/cluster-observations/interpret-the-results/all-statistics-and-graphs/dendrogram/ Anónimo. (2018). Cómo dibujar un dendrograma. 2022, enero, de Leaf Group Ltd. Sitio web: https:// www.geniolandia.com/13103150/como-dibujar-un-dendrograma Anónimo. (-). Dendrograma. 2022, enero, de Universidad de Salamanca Sitio web: https://dicciomed. usal.es/palabra/dendrograma Anónimo. (-). Ernst Mayr (1904-2005). 2022, enero, de Unversidad de Salamanca Sitio web: https://dicciomed.usal.es/creador/151 Treemap Ribecca, S.. (-). Mapa de Árbol. 2022, enero, de Severino Ribecca Sitio web: https://datavizcatalogue. com/ES/metodos/mapa_de_arbol.html Anónimo. (-). Treemap. 2022, enero, de Ferdio Sitio web: https://datavizproject.com/data-type/treemap/ Anónimo. (2022). Diagrama de árbol (treemap). 2022, enero, de Diligent Corporation Sitio web: https:// help.highbond.com/helpdocs/highbond/es/Content/visualizations/interpretations/charts/treemap_ chart.htm Shneiderman, B. & Plaisant, C.. (2014, Septiembre). Treemaps for space-constrained visualization of hierarchies. Including the History of Treemap Research at the University of Maryland. HICL Archive. 2022, enero, De Human-Computer Interaction Lab Base de datos. Sitio web: http://www.cs.umd.edu/ hcil/treemap-history/index.shtml Rubber Sheet (Hoja de Goma): https://dvia.samizdat.co/2019/rubber-sheet/ Coordenadas Paralelas 3 – Coordenadas Paralelas: https://kripkit.com/coordenadas-paralelas/ 4 - Coordenadas Paralelas: https://datavizcatalogue.com/ES/metodos/grafico_de_coordenadas_paralelas.html 5 – Coordenadas Paralelas: https://docs.tibco.com/pub/spotfire_web_player/6.0.0-november-2013/es-ES/WebHelp/GUID24AF55A4-E1E3-4F08-B62C-842738904252.html 6 – Coordenadas Paralelas: https://eagereyes.org/techniques/parallel-coordinates
59
60
Catálogo de visualización
Mapa de calor 1 – Mapa de calor: https://www.jmp.com/es_es/statistics-knowledge-portal/exploratory-data-analysis/heatmap.html 2 – Mapa de calor: https://www.affde.com/es/heatmap-examples.html Diagrama de Sankey Meirelles, I. & Antolín, M. (2014). La información en el diseño : introducción a las historias, las teorías y las mejores prácticas para la visualización eficaz de información. Badalona, España: Parramón Arts & Design. Chernoff Faces Nel, D., Pitt, L., & Webb, T. (1994). Using Chernoff Faces to Portray Service Quality Data. Journal of Marketing Management, 10(1–3), 247–255. https://doi.org/10.1080/0267257X.1994.9964271 Grafico de líneas y Mapas Cartográficos Meirelles, I. & Antolín, M. (2014). La información en el diseño : introducción a las historias, las teorías y las mejores prácticas para la visualización eficaz de información. Badalona, España: Parramón Arts & Design.
MADIC 10º
61