4 minute read
2.3.2. Técnicas cartográficas de representación de la información
from 105015
simétricas y las asimétricas. No todas las distribuciones tienen formas sencillas, especialmente
cuando hay pocas observaciones. Las observaciones atípicas son observaciones que quedan fuera del aspecto general de una distribución. Busca siempre si hay observaciones atípicas e
Advertisement
intenta explicarlas.
Como lo afirma Moore (2005), al realizar el análisis exploratorio de los datos, es posible entender
la dispersión de los datos, la cual se logra encontrar al obtener cinco (5) números que resumen
un conjunto de datos, los cuales son: la observación mínima, el primer cuartil, la mediana, el
tercer cuartil y la observación máxima; escritos en orden de menor a mayor, estos números claves sirven para construir la desviación típica9 que mide la dispersión de las observaciones respecto a la media. La desviación típica es cero cuando no hay dispersión y crece a medida que
esta aumenta.
Los cinco números resumen son la mejor síntesis de las distribuciones asimétricas. La descripción
de la dispersión se puede analizar por grupos, estos grupos son los cuantiles, que determinan
entre qué valores se encuentra la mitad central de las observaciones. Para realizar la
identificación de los cuantiles, la lógica que emplea el software es: ordenar las observaciones de
menor a mayor y el primer cuartil separa el primer 25% de las observaciones, el segundo cuartil
es la mediana, el tercer cuartil separa el primer 75% de observaciones; esta es la idea de los
cuartiles.
2.3.2. Técnicas cartográficas de representación de la información
Como lo expone García (2003) el geógrafo como profesional del territorio utilizando las
herramientas SIG, ha podido reunir tres procedimientos clásicos de su metodología de trabajo:,
como son en primer lugar, la representación cartográfica, en segundo lugar, la utilización de herramientas estadísticas y de métodos de análisis cuantitativo de diferentes variables
georreferenciadas, y en tercer lugar, el análisis espacial de todos los elementos, naturales y
antrópicos, de la superficie terrestre. Por lo tanto, el software SIG cuenta siempre con un
conjunto básico de herramientas que permiten analizar patrones de distribución espacial desde
técnicas simples, hasta complejos algoritmos que requieren de destreza para su correcta
9 La desviación típica es la raíz cuadrada positiva de la varianza y la varianza (S²) de un conjunto de
observaciones es, la suma de los cuadrados de las desviaciones de las observaciones respecto a su media
dividida por n − 1
interpretación. A continuación, se presentan las técnicas de representación cartográfica
utilizadas, las cuales corresponden a las empleadas frecuentemente en los análisis de la información asociada a salud pública:
• Tasa
La tasa es un indicador, que se puede calcular directamente en la preparación de los datos o se
puede construir directamente con las herramientas SIG. Como indican Fuenzalida y Cobs (2013),
su objetivo es comparar magnitudes de una variable. Están compuestas por el numerador que
expresa la frecuencia con que ocurre un suceso y un denominador, dado por la población
expuesta a un determinado suceso, y por razones prácticas, el cociente obtenido se multiplica
por algún múltiplo de 10 (1.000, 10.000, 100.000). En la figura 4 que se presenta a continuación,
se puede apreciar un ejemplo de tasa para la población menor a 5 años de la mortalidad
ocasionada por la Enfermedad Diarreica Aguda – EDA:
Figura 4
Ejemplo tasa población menor a 5 años de la mortalidad ocasionada por la Enfermedad
Diarreica Aguda – EDA
Nota. Adaptado de Informe por municipios mortalidad por causas evitables Colombia 2002, de
Sistema de Vigilancia en Salud Pública, Boletín Semana Epidemiológica 41 de 2002 (http://www.saludcolombia.com/actual/salud67/informe.htm).
• Representación con el uso de intervalos
Dado que los datos geográficos están compuestos por atributos alfanuméricos, es común en el
software SIG representarlos de acuerdo con la distribución estadística de alguno de sus atributos o campos alfanuméricos por grupos, empleando diferentes métodos según lo menciona Esri
(s. f.) se pueden resumir dichos métodos así: i) Cuantiles; para esta clasificación se generan clases
o puntos de corte de la información, que contiene el mismo número de entidades agrupadas. ii)
Intervalos geométricos; este método permite agrupar los datos en intervalos en los cuales se
minimizan la suma de los cuadrados del número de elementos de cada clase, así cada intervalo
contiene aproximadamente el mismo número de elementos y con cambios en cada intervalo
muy coherente. iii) Desviación estándar, este método de clasificación muestra la diferencia entre
el valor de atributo de una entidad y el valor medio, los cortes de los intervalos de clase se crean
con rangos de valores equivalentes que corresponde a una proporción de la desviación estándar como lo son 1, 1/2, 1/3 o 1/4 de la desviación. iv) Finalmente se pueden hacer grupos en rangos de valor definidos de forma manual y/o por intervalos iguales.
Como lo afirma Espinosa, Monsalve y Gómez (2013), al aplicar cada uno de los métodos de
clasificación mencionados al mismo set de datos, se obtiene una representación diferente que
tiene un impacto notable sobre la especialización de las variables y las decisiones que se tomen en una investigación en torno al tipo de clasificación que se utilizará. En la tabla 3 que se presenta
a continuación se puede apreciar a modo general ejemplos de distribución de datos y cuál es el
método de representación más indicado a aplicar: