i
Master Thesis ǀ Tesis de Maestría submitted within the UNIGIS MSc programme Presentada para el Programa UNIGIS MSc at/en
Interfaculty Department of Geoinformatics- Z_GIS Departamento de Geomática – Z_GIS University of Salzburg ǀ Universidad de Salzburg
Modelación espacial de contaminación atmosférica y su correlación con enfermedades respiratorias en Cali, Colombia Spatial modeling of atmospheric pollution and its correlation with respiratory diseases in Cali, Colombia by/por
Ricardo Rodriguez Otero 01522708 A thesis submitted in partial fulfilment of the requirements of the degree of Master of Science– MSc Advisor ǀ Supervisor: Leonardo Zurita Arthos PhD
Bogotá D.C., 27 de enero de 2020
i
ii
ii
iii
Dedicatoria y Agradecimientos
Dedico esta tesis a Dios, a mi familia por todo su apoyo y ayuda en los momentos difĂciles.
Agradecimientos a: A mis amigos por toda la ayuda prestada en esta investigaciĂłn y por todas las veces que leyeron este documento y su sinceridad para ayudarme a mejorar. A los profesores que me apoyaron en este proceso. Al Departamento Administrativo de GestiĂłn del Medio Ambiente y a la Secretaria de Salud de Santiago de Cali, por facilitarme los insumos para el desarrollo de esta tesis.
iii
iv
RESUMEN
En el presente estudio se investigó la relación que se podría dar entre Infecciones Respiratorias Agudas – IRA y la contaminación atmosférica en la ciudad de Santiago de Cali, Colombia. Con el fin de determinar si existe o no dicha relación, se realizó un análisis de puntos calientes y clústeres utilizando el Índice Global de Moran y los índices LISA o locales de Moran y Getis Ord (gi*) para los casos de IRA de Cali desde 2010 al año 2015. Se analizaron las condiciones asociadas a los casos de IRA, como la edad de las personas afectadas, el género o sexo de las personas afectadas y el año de reporte del caso de IRA, por último, los patrones o clústeres de estos casos, lo anterior usando el software SIG ArcGIS 10.5.1. Para el desarrollo de la presente tesis se emplearon diversas técnicas y herramientas de investigación, como el análisis estadístico de datos de monitoreo ambiental a través de series de tiempo, usando el software estadístico IBM SPSS, la creación de superficies geoestadísticas mediante el método de interpolación Kriging Ordinario para el análisis de la distribución espacial y concentraciones anuales de partículas contaminantes de ozono (O3), dióxido de nitrógeno (NO2), dióxido de azufre (SO2) y material particulado o partículas finas (PM10 y PM2.5) y por último de aplicaron modelos de regresión lineal de Mínimos Cuadrados Ordinarios (OLS) y regresión ponderada geográficamente (GWR) que de forma complementaria indican que tan probable es la relación entre la concentración de partículas contaminantes y los casos de IRA en Cali. De forma complementaria se analizan variables climáticas como la precipitación anual y los días de lluvia anuales en Cali usando de igual manera series de tiempo y superficies geoestadísticas Del mismo modo, al final de estudio se evalúa la necesidad de mejorar la recolección de datos en las estaciones de monitoreo ambiental de Cali y así mismo la densificación de la red de monitoreo con nodos adicionales, que permitan la obtención de información más detallada y precisa de los datos en salud de la ciudad. Palabras Clave: Contaminación Atmosférica, Infecciones Respiratorias Agudas – IRA, Autocorrelación Espacial, Regresión lineal Espacial.
iv
v
ABSTRACT
The aim of this study was to investigate the possible relationship between acute respiratory infections – ARI and air pollution in the city of Santiago de Cali, Colombia. In order to verify whether such a relationship exists, we completed a hot spot and clusters analysis using the Moran Global Index and LISA or Moran local index and Getis Ord (gi*) for ARIs cases from the year 2010 to 2015 in Cali. Furthermore, in this analysis we included information of those conditions associated with ARIs cases such as age, gender, and sex of people affected; the year, in which the cases were filed; and the patterns or clusters of said cases, using the GIS ArcGIS 10.5.1 software. For the development of this thesis we used various research techniques and tools, such as statistical analysis of data from environmental monitoring through series of time using IBM SPSS statistical software, the creation of geostatistical surfaces using the Ordinary Kriging interpolation method for spatial distribution analysis and annual concentrations of ozone pollutants (O3), nitrogen dioxide (NO2), sulphur dioxide (SO2), and particulate material or fine particles (PM10 and PM2.5) and lastly of applied linear regression models of Ordinary Minimum Square (OLS) and Geographically Weighted Regression (GWR) which in addition indicate how likely it is the relationship between the concentration of polluting particles and the acute respiratory infections in Cali. Climatic variables such as annual rainfall in Cali are also analysed, using similar series of time and geostatistical surfaces. In the same way, at the end of the study we evaluate the need to improve data collection in the environmental monitoring stations in Cali and the expansion of the monitoring network with additional nodes to allow the recollection of more detailed data about respiratory health in the city. Keywords: Air pollution, URIs Acute Respiratory Infections, Spatial Autocorrelation, Spatial linear regression.
v
vi
Tabla de Contenido 1.
INTRODUCCIÓN .................................................................................................................................. 1 1.1. ANTECEDENTES ................................................................................................................................ 1 1.2. OBJETIVOS ........................................................................................................................................ 2 1.2.1. Objetivo general ...................................................................................................................... 2 1.2.2. Objetivos específicos ............................................................................................................... 2 1.3. PREGUNTAS DE INVESTIGACIÓN ...................................................................................................... 2 1.4. HIPÓTESIS ......................................................................................................................................... 2 1.5. JUSTIFICACIÓN ................................................................................................................................. 3 1.6. ALCANCE .......................................................................................................................................... 4
2.
MARCO TEÓRICO ................................................................................................................................ 5 2.1. CONTAMINACIÓN ATMOSFÉRICA Y SU RELACIÓN CON ENFERMEDADES RESPIRATORIAS .............. 5 2.2. ESTADÍSTICA ESPACIAL Y MINERÍA DE DATOS. ................................................................................. 6 2.2.1. Análisis exploratorio de datos y autocorrelación espaciales ................................................... 8 2.2.2. Indicadores locales de asociación espacial (LISA).................................................................. 10 2.2.3. Asociación de variables espaciales ........................................................................................ 12 2.3. SERIES DE TIEMPO. ......................................................................................................................... 13 2.4. INTERPOLACIÓN DE DATOS GEOESPACIALES Y MODELOS GEOESTADÍSTICOS ............................... 14
3.
METODOLOGÍA................................................................................................................................. 19 3.1. ÁREA DE ESTUDIO .......................................................................................................................... 20 3.2. METODOLOGÍA APLICADA ............................................................................................................. 22 3.2.1. Selección y preparación de datos .......................................................................................... 23 3.2.1.1. 3.2.1.2. 3.2.1.3. 3.2.1.4.
3.2.2. 3.2.2.1. 3.2.2.2.
3.2.3. 3.2.3.1. 3.2.3.2.
4.
Preparación de datos ....................................................................................................................... 24 Datos ambientales............................................................................................................................ 24 Datos de infecciones respiratorias agudas – ira ............................................................................... 28 Datos climatológicos ........................................................................................................................ 29
Análisis espacial y exploratorio de datos .............................................................................. 32 Análisis de clústeres y puntos calientes ........................................................................................... 32 Análisis de series de tiempo e interpolación de partículas contaminantes ..................................... 32
Análisis de regresión lineal .................................................................................................... 33 Análisis de Mínimos Cuadrados Ordinarios – OLS ............................................................................ 33 Regresión Ponderada Geográficamente (GWR) ............................................................................... 34
RESULTADOS .................................................................................................................................... 35 4.1. ANÁLISIS ESPACIAL DE INFECCIONES RESPIRATORIAS AGUDAS (2010-2016)................................. 35 4.1.1. Análisis de puntos calientes y fríos en infecciones respiratorias agudas (2010-2015), usando el índice local “Getis-Ord Gi*”................................................................................................................. 37 4.1.2. Análisis de clústeres y datos anómalos de infecciones respiratorias agudas (2010-2015), usando el índice “Local Moran’s Anselin”. .............................................................................................. 40 4.1.3. Análisis de clústeres y datos anómalos de infecciones respiratorias agudas (2010-2015) según la edad de los afectados usando el índice “Local Moran’s I Anselin” ........................................... 43 4.1.4. Análisis de clústeres y datos anómalos de infecciones respiratorias agudas (2010-2015) según el género de los afectados, usando el índice “Local Moran’s I Anselin” ....................................... 47 4.1.5. Análisis de clústeres y datos anómalos de infecciones respiratorias agudas (2010-2015), por año, usando el índice “Local Moran’s Anselin” ....................................................................................... 51 4.2. ANÁLISIS DE CONCENTRACIONES DE PARTÍCULAS CONTAMINANTES EN CALI. ............................. 54 4.2.1. Dióxido de Azufre (SO2) ......................................................................................................... 55 4.2.2. Ozono (O3) ............................................................................................................................. 59 4.2.3. Dióxido de Nitrógeno (NO2) ................................................................................................... 64
vi
vii
4.2.4. Material Particulado 10 μm (PM10) ....................................................................................... 69 4.2.5. Material Particulado 2.5 μm (PM2.5) ..................................................................................... 74 4.3. ANÁLISIS DE DATOS CLIMATOLÓGICOS EN CALI. ............................................................................ 79 4.4. REGRESIÓN LINEAL (MÍNIMOS CUADRADOS ORDINARIOS - OLS) EN CALI. .................................... 89 4.4.1. Regresión Lineal (Regresión Ponderada Geográficamente - GWR). ...................................... 98 5.
ANÁLISIS DE RESULTADOS .............................................................................................................. 101 5.1. ANÁLISIS ESPACIAL DE INFECCIONES RESPIRATORIAS AGUDAS (2010-2016)............................... 101 5.1.1. Análisis de puntos calientes y fríos en infecciones respiratorias agudas (2010-2015), usando el índice local “Getis-Ord Gi*”............................................................................................................... 101 5.1.2. Análisis de clústeres y datos anómalos de infecciones respiratorias agudas (2010-2015), usando el índice “Local Moran’s Anselin”. ............................................................................................ 101 5.1.3. Análisis de clústeres y datos anómalos de infecciones respiratorias agudas (2010-2015) según la edad de los afectados usando el índice “Local Moran’s I Anselin” ......................................... 102 5.1.4. Análisis de clústeres y datos anómalos de infecciones respiratorias agudas (2010-2015) según el género de los afectados, usando el índice “Local Moran’s I Anselin” ..................................... 102 5.1.5. Análisis de clústeres y datos anómalos de infecciones respiratorias agudas (2010-2015), por año, usando el índice “Local Moran’s Anselin” ..................................................................................... 103 5.2. ANÁLISIS DE CONCENTRACIONES DE PARTÍCULAS CONTAMINANTES EN CALI. ........................... 104 5.2.1. Dióxido de Azufre (SO2) ....................................................................................................... 104 5.2.2. Ozono (O3) ........................................................................................................................... 104 5.2.3. Dióxido de Nitrógeno (NO2) ................................................................................................. 105 5.2.4. Material Particulado 10 μm (PM10) ..................................................................................... 105 5.2.5. Material Particulado 2.5 μm (PM2.5) ................................................................................... 106 5.3. ANÁLISIS DE DATOS CLIMATOLÓGICOS EN CALI. .......................................................................... 106 5.4. REGRESIÓN LINEAL (MÍNIMOS CUADRADOS ORDINARIOS - OLS) EN CALI. .................................. 107 5.4.1. Regresión Lineal (Regresión Ponderada Geográficamente - GWR). .................................... 108 5.5. RESPUESTAS A PREGUNTAS DE INVESTIGACIÓN. ......................................................................... 108
6.
CONCLUSIONES Y RECOMENDACIONES .......................................................................................... 110 6.1. 6.2.
CONCLUSIONES ............................................................................................................................ 110 RECOMENDACIONES .................................................................................................................... 112
7.
REFERENCIAS BIBLIOGRÁFICAS ....................................................................................................... 114
8.
ANEXOS .......................................................................................................................................... 120
vii
viii
Glosario ACOPI: Urbanización Industrial del municipio de Yumbo, concebida desde 1955. CO: Monóxido de Carbono. COV: Compuestos Orgánicos Volátiles. CVC: Corporación Autónoma Regional del Valle del Cauca. DAGMA: Departamento Administrativo de Gestión del Medio Ambiente. ESI: Enfermedad Similar a la Influenza. gi*: Índice Getis Ord. GWR: Geographically Weighted Regression, en español Regresión ponderada geográficamente. IDW: Inverse Distance Weighting, en español ponderación de la distancia inversa. IRA: Infecciones Respiratorias Agudas. IRAG: Infecciones Respiratorias Agudas Grave. LISA: Local Indicators of Spatial Association, en español Indicadores Locales de Asociación Espacial. MODIS: Moderate Resolution Imaging Spectroradiometer, en español Espectro radiómetro de imágenes de resolución moderada. NO: Monóxido de nitrógeno. NO2: Dióxido de nitrógeno. NOx: Óxidos de nitrógeno. POT: Plan de Ordenamiento Territorial. PM10, PM5 y PM2.5: Material Particulado del tamaño de 10 micras o menor. O3: Ozono. OLS: Ordinary Least Squares, en español Mínimos Cuadrados Regresión Ponderada. OMS: Organización mundial para la Salud. SIG: Sistemas de Información Geográfica SIVIGILA: Sistema Nacional de Vigilancia en Salud Pública. SO2: Dióxido de azufre. SO3: Trióxido de azufre. SVCASC: Sistema de Vigilancia de Calidad del Aire de Santiago de Cali.
Listado de Mapas Mapa 1. Ubicación del Área de estudio ........................................................................................... 21 Mapa 2. Ubicación de estaciones de monitoreo ambiental en Santiago de Cali. ............................. 27 Mapa 3. Ubicación de estaciones de monitoreo climatológico CVC en Santiago de Cali. .............. 31 Mapa 4. Análisis de puntos Calientes y fríos en infecciones Respiratorias Agudas (2010-2015), Usando el índice local “Getis-ord Gi*”............................................................................................ 39 Mapa 5. Análisis de clústeres y datos anómalos de Infecciones Respiratorias Agudas (2010-2015), usando el índice “Local Moran’s Anselin”. ..................................................................................... 42 Mapa 6. Análisis de Clústeres y datos anómalos de Infecciones Respiratorias Agudas (2010-2015) según la edad de los afectados usando el índice “Local Moran’s I Anselin”. .................................. 45 Mapa 7. Análisis de Clústeres y datos anómalos de Infecciones Respiratorias Agudas (2010-2015) según el género de los afectados, usando el índice “Local Moran’s I Anselin”. ............................. 49 Mapa 8. Análisis de Clústeres y datos anómalos de Infecciones Respirarías Agudas (2010-2015), por año, usando el índice “Local Moran’s Anselin”. ....................................................................... 53 Mapa 9. Concentración de dióxido de azufre, SO2. ......................................................................... 58 Mapa 10. Concentración de ozono, O3. ............................................................................................ 63 Mapa 11. Concentración de dióxido de nitrógeno, NO2. ................................................................. 68 Mapa 12. Concentración de material particulado 10 μm, PM10. ...................................................... 73 Mapa 13. Concentración de material particulado 2.5 μm, PM2.5...................................................... 78 Mapa 15. Días de Lluvia en Cali. ..................................................................................................... 81 viii
ix
Mapa 15. Precipitación total en Cali. ............................................................................................... 85 Mapa 16. Regresión Lineal (Mínimos cuadrados ordinarios - OLS). .............................................. 93 Mapa 17. Regresión Lineal (Regresión ponderada geográficamente - GWR). ................................ 99
Listado de Ilustraciones Ilustración 1. Flujograma de metodología aplicada. ........................................................................ 22 Ilustración 2. Ejemplo interpolación IDW ....................................................................................... 26 Ilustración 3. Ejemplo interpolación Kriging Ordinario .................................................................. 26 Ilustración 4. Resultado del análisis del promedio de vecinos más cercanos................................... 35 Ilustración 5. Paramentos del promedio de los vecinos más cercanos. ............................................ 36 Ilustración 6. Resultado índice global de Moran.............................................................................. 36 Ilustración 7. Serie de tiempo de la concentración de SO2 por estaciones. ...................................... 56 Ilustración 8. Semivariograma de interpolación Kriging Ordinario de SO2..................................... 57 Ilustración 9. Predicción del modelo para SO2................................................................................. 57 Ilustración 10. Error general del modelo para SO2........................................................................... 57 Ilustración 11. Error Estandarizado del modelo para SO2. ............................................................... 57 Ilustración 12.QQplot del modelo para SO2. .................................................................................... 57 Ilustración 13. Serie de tiempo de la concentración de O3 por estaciones. ...................................... 60 Ilustración 14. Semivariograma de interpolación Kriging Ordinario de O3. .................................... 61 Ilustración 15. Predicción del modelo para O3 ................................................................................. 62 Ilustración 16. Error general del modelo para O3. ............................................................................ 62 Ilustración 17. Error Estandarizado del modelo para O3. ................................................................. 62 Ilustración 18. QQplot del modelo para O3. ..................................................................................... 62 Ilustración 19. Serie de tiempo de la concentración de NO2 por estaciones. .................................... 65 Ilustración 20. Semivariograma de interpolación Kriging Ordinario de NO2. ................................. 66 Ilustración 21. Predicción del modelo para NO2. ............................................................................. 67 Ilustración 22. Error general del modelo para NO2. ......................................................................... 67 Ilustración 23. Error Estandarizado del modelo para NO2. .............................................................. 67 Ilustración 24. Serie de tiempo de la concentración de PM10 por estaciones. .................................. 70 Ilustración 25. Semivariograma de interpolación Kriging Ordinario de PM10. ................................ 71 Ilustración 26. Predicción del modelo para PM10. ............................................................................ 72 Ilustración 27. Error general del modelo para PM10. ........................................................................ 72 Ilustración 28. Error Estandarizado del modelo para PM10. ............................................................. 72 Ilustración 29. QQplot del modelo para PM10. ................................................................................. 72 Ilustración 30. Serie de tiempo de la concentración de PM2.5 por estaciones ................................... 75 Ilustración 31. Semivariograma de interpolación Kriging Ordinario de PM2.5. ............................... 76 Ilustración 32. Predicción del modelo para PM2.5 ............................................................................ 77 Ilustración 33. Error general del modelo para PM2.5 ........................................................................ 77 Ilustración 34. Error Estandarizado del modelo para PM2.5. ............................................................ 77 Ilustración 35. QQplot del modelo para PM2.5. ................................................................................ 77 Ilustración 36. Series de Tiempo de Días de Lluvia en Cali. ........................................................... 80 Ilustración 37. Semivariograma de interpolación Kriging Ordinario de Días de Lluvia en Cali. .... 82 Ilustración 38. Predicción del modelo para los Días de Lluvia en Cali. .......................................... 83 Ilustración 39. Error general del modelo para los Días de Lluvia en Cali. ...................................... 83 Ilustración 40. Error Estandarizado del modelo para los Días de Lluvia en Cali............................. 83 Ilustración 41. QQplot del modelo para los Días de Lluvia en Cali................................................. 83 ix
x
Ilustración 42. Series de tiempo de la Precipitación Total Anual en Cali. ....................................... 84 Ilustración 43. Semivariograma de interpolación Kriging Ordinario de Precipitación Total. ......... 86 Ilustración 44. Predicción del modelo para Precipitación Total....................................................... 87 Ilustración 45. Error general del modelo para Precipitación Total. ................................................. 87 Ilustración 46. Error Estandarizado del modelo para Precipitación Total........................................ 87 Ilustración 47. QQplot del modelo para Precipitación Total............................................................ 87 Ilustración 48. Histogramas y diagramas de dispersión de variables OLS. ..................................... 90 Ilustración 49. Datos generales OLS. ............................................................................................... 91 Ilustración 50. Histograma y comportamiento global de variables. ................................................. 91 Ilustración 51. Diagrama de dispersión sobre la predicción del modelo OLS ................................. 92
Listado de Tablas Tabla 1. Principales partículas contaminantes Según la OMS (2006). .............................................. 6 Tabla 2. Nombre y coordenadas de estaciones de monitoreo ambiental. ......................................... 28 Tabla 3. Codificación de atributos de IRA. ...................................................................................... 29 Tabla 4. Codificación de género de pacientes con IRA. .................................................................. 29 Tabla 5. Nombre y coordenadas de estaciones de monitoreo climatológico. ................................... 30 Tabla 6. Resultado índice global de Moran...................................................................................... 37 Tabla 7. Puntos Calientes de IRA Índice GETIS ORD GI*............................................................. 38 Tabla 8. Datos anómalos alto-bajo de IRA Índice local Moran. ...................................................... 41 Tabla 9. Barrios con Anomalías “Bajo-Altos” de IRA por las edades de afectados, Índice local Moran. .............................................................................................................................................. 44 Tabla 10. Barrios con Anomalías “Altos-Bajos” de IRA por las edades de afectados, Índice local Moran. .............................................................................................................................................. 44 Tabla 11. Barrios con anomalías “Altos-Bajos” de IRA según el género de afectados, Índice local Moran. .............................................................................................................................................. 47 Tabla 12. Barrios con anomalías “Bajos-Altos” de IRA según el género de afectados, Índice local Moran. .............................................................................................................................................. 48 Tabla 13. Barrios con clústeres “Bajos” de IRA según el año en el que se presentó la infección, Índice local Moran. .......................................................................................................................... 51 Tabla 14. Barrios con anomalías “Bajo-Altos” de IRA según el año en el que se presentó la infección, Índice local Moran........................................................................................................... 52 Tabla 15. Barrios con anomalías “Altos-Bajos” de IRA según el año en el que se presentó la infección, Índice local Moran........................................................................................................... 52 Tabla 16. Resultado preliminar de las variables explicativas según la exploración del modelo de regresión. .......................................................................................................................................... 94 Tabla 17. Significancia de cada variable del modelo OLS. ............................................................. 94 Tabla 18. Variables con tendencia a la coliniaridad múltiple. ......................................................... 95 Tabla 19. Coeficientes resultantes OLS. .......................................................................................... 95 Tabla 20. Diagnóstico de coeficientes OLS. .................................................................................... 96 Tabla 21. Puntos fríos de IRA Índice GETIS ORD GI*. ............................................................... 120 Tabla 22. Barrios con clústeres “bajos” de IRA Índice local Moran. ............................................ 121 Tabla 23. Barrios con clústeres “Altos” de IRA Índice local Moran. ............................................ 122 Tabla 24. Barrios con clústeres “Bajos” de IRA por las edades de afectados, Índice local Moran. ........................................................................................................................................................ 123 Tabla 25. Barrios con clústeres “Altos” de IRA por las edades de afectados. Índice local Moran.125 x
xi
Tabla 26. Barrios con clústeres “Altos” de IRA según el género de afectados, Índice local Moran. ........................................................................................................................................................ 126 Tabla 27. Barrios con clústeres “Bajos” de IRA según el género de afectados, Índice local Moran. ........................................................................................................................................................ 129 Tabla 28. Barrios con clústeres “Altos” de IRA según el año en el que se presentó la infección, Índice local Moran. ........................................................................................................................ 132
xi
1
1. INTRODUCCIÓN 1.1.
ANTECEDENTES
El aire limpio es un requisito para la salud y bienestar de la humanidad (OMS, 2006). A escala global, según la Organización Mundial para la Salud - OMS (Jasarevic, Thomas, y Osseiran, 2014), al año se presentan 7 millones de muertes por enfermedades causadas por la contaminación, donde 1 de cada 8 personas de la población del planeta hacen parte de esta estadística. Las enfermedades respiratorias son las responsables del 20% de esta mortandad, por debajo de las enfermedades cardiovasculares con un 40%. La contaminación atmosférica en grandes ciudades como Cali - Colombia, es un problema ambiental que es difícil de modelar espacialmente, por causa de los diversos focos de contaminación en la ciudad. Por ejemplo, en las comunas 6 y 7 de la ciudad, donde hay presencia de escombreras y cementeras, lugares que en condiciones climáticas favorables generan una contaminación moderada por material particulado (PM10, PM2.5 ) y que dejan como consecuencia un riesgo a la salud en el sector (Botero, Tróchez y Olaya, 2004). Los focos contaminantes cuentan con diversa variedad de ubicaciones, ya sea en una zona o punto fijo. Con relación a las emisiones industriales, en el año 2002, se reportaron 4,234 toneladas de emisiones atmosféricas en Cali (Jaramillo, Núñez y Ocampo, 2004). Por este motivo, una de las zonas más críticas de la ciudad en emisiones atmosféricas por actividades industriales es la Comuna 4: ahí se concentran la mayoría de industrias y principales vías de salida hacia otros municipios (Aponte, Silva y Laín, 2010). Adicionalmente, hay que estimar que otras actividades intermitentes como los incendios, la quema de biomasa y las fuentes móviles (automóviles y transporte público) dentro de la ciudad o en áreas vecinas como el área industrial del municipio de Yumbo generan también emisiones contaminantes (Jaramillo et al., 2004). Al no poseer información espacial de patrones o tendencias de las áreas con mayor contaminación o concentración de partículas nocivas, así como de las personas afectadas por las mismas, no será posible plantear políticas de ordenamiento que faciliten la mitigación o control de los riesgos a la salud asociados por la contaminación atmosférica en Cali.
Ing. Ricardo Rodriguez Otero
2
1.2.
OBJETIVOS
1.2.1. Objetivo general Identificar las áreas con altas concentraciones de partículas contaminantes del aire y su posible relación en las infecciones respiratorias agudas (IRA) en la ciudad de Cali (Colombia).
1.2.2. Objetivos específicos •
Identificar los métodos más eficientes para encontrar la relación espacial entre enfermedades respiratorias y niveles altos de contaminación atmosférica en la ciudad de Cali.
•
Modelar e identificar la tendencia de concentración de las partículas que son las principales causantes de contaminación atmosférica en Cali.
•
Identificar patrones en los datos de contaminación y enfermedades respiratorias.
•
Generar un escenario futuro de las áreas afectadas según los patrones identificados.
1.3.
PREGUNTAS DE INVESTIGACIÓN
•
¿Cuáles son las zonas con mayor contaminación en el aire en Cali?
•
¿En qué épocas del año se presenta mayor concentración de partículas contaminantes y qué factores pueden influir en las altas concentraciones?
•
¿En cuáles barrios de la ciudad de Cali se presenta mayor cantidad de IRA en sus habitantes? ¿Estas áreas coinciden con las de mayor contaminación atmosférica?
•
¿Cómo varían las concentraciones de partículas contaminantes en el tiempo?
1.4.
HIPÓTESIS
Al ser Cali una de las principales ciudades de Colombia, la contaminación atmosférica podría tener relación con la aparición o aumento de enfermedades e infecciones respiratorias en la población de la ciudad.
Ing. Ricardo Rodriguez Otero
3
1.5.
JUSTIFICACIÓN
La contaminación atmosférica de las grandes ciudades, en especial en ciudades en vía de desarrollo como Cali (que es una capital departamental y una de las principales de Colombia), tiene una gran variedad de focos contaminantes, como el transporte público, diversas actividades económicas e industriales y eventos aleatorios como incendios o accidentes industriales, generando o agravando enfermedades de tipo respiratorio. Se ha demostrado en varios estudios epidemiológicos en Cali (Botero et al., 2004), que la contaminación atmosférica y las infecciones respiratorias agudas están relacionadas (Aponte et al., 2010). Es decir, a mayor contaminación atmosférica, mayor número de consultas médicas en relación a las IRA (Romero et al., 2004). Cali es la capital del Valle del Cauca. En este departamento la población más afectada por este tipo de enfermedades son los niños menores de 5 años, en municipios como Palmira con altos niveles de contaminación atmosférica
(Sotelo, Caicedo y Zapata, 2013). En el
perímetro del área urbana de Cali, se presenta quema masiva del cultivo de caña de azúcar, una práctica implementada por los ingenios con el fin de mejorar el rendimiento del cultivo. Las zonas de quema se encuentran ubicadas principalmente en el área que colinda con Palmira, donde se ha demostrado que la quema de estos residuos genera una alta concentración de material particulado menor a 10 micras (PM10) (Dávalos, 2007). Los estudios ya citados en su mayoría usaron estimaciones estadísticas o análisis de series de tiempo sin contar con el componente geográfico, como parte de la metodología principal para determinar la relación entre la contaminación atmosférica y efectos nocivos para la salud humana (Rosales, Torres y Olaiz, 2001). Los Sistemas de Información Geográfica – SIG son una tecnología que ayuda a monitorear, analizar y decidir sobre la contaminación atmosférica en áreas urbanas, usando varias combinaciones de métodos geoestadísticos con sensores remotos, como puede ser el uso de las bandas 1-3 de las imágenes MODIS (Moderate Resolution Imaging Spectroradiometer) para analizar partículas contaminantes en la atmósfera e interpolando datos de estaciones de monitoreo ambiental. El uso de estas herramientas ha arrojado buenos resultados en estudios realizados en Irán, Estados Unidos y algunos países de Europa (Shad, Ashoori y Afshari, 2008). Esto confirma que los SIG, más que ayudar a validar la premisa de que la contaminación influye negativamente sobre la salud humana, permiten localizar de manera más precisa quiénes pueden estar más afectados o qué zonas presentan más contaminación, Ing. Ricardo Rodriguez Otero
4
lo cual hace de éstos una herramienta para acelerar la toma de decisiones y al mismo tiempo brindar a los tomadores de éstas insumos de fácil interpretación, usando su potencial intrínseco para responder preguntas necesarias del ¿Cómo? ¿Qué? ¿Qué tanto o qué tan grande? (Ahmad, Abdulla y Koas, 2010).
1.6.
ALCANCE
El alcance del presente estudio está delimitado geográficamente únicamente al casco urbano de Cali, no se tendrá en cuenta el área rural por falta de datos en la zona. Los datos por modelar y analizar están distribuidos desde el 1 de enero de 2010, hasta el 31 diciembre de 2015. Este estudio busca generar insumos, teniendo como la menor unidad espacial los barrios de Cali, generando una cartografía a una escala de 1:85,000 con la cual la información tendría una resolución para una fácil lectura de los resultados esperados. Esta cartografía contempla varios tipos de mapas y técnicas geoestadísticas que permita identificar la incidencia o relación de las variables ya mencionadas. Lo anterior se espera que facilite la toma de decisiones que permitan la planificación sobre el control y mitigación de los efectos de la contaminación atmosférica en la ciudad y establecer una posible correlación de este tipo de contaminación como una de las principales causantes de IRA en Cali. Esta investigación puede ser de utilidad a entidades del orden municipal al tener una metodología para desarrollar nuevos estudios de correlación de contaminación atmosférica e IRA, así mismo la información de este estudio permitirá identificar falencias en la forma de cuantificar la información para evaluar la correlación mencionada y utilizar tanto la cartografía como los modelos en la priorización para la mitigación y control de efectos de la contaminación atmosférica en Cali. Es importante tener en cuenta que este estudio busca evidenciar la posibilidad de que la contaminación atmosférica tenga relación con IRA en Cali. Tampoco se discriminarán directamente las fuentes de contaminación, ya que las dinámicas de una urbe como Cali confluyen en varios tipos de focos contaminantes desde industrias, transporte público y privado y otros tipos de actividades humanas que por el tipo de tecnologías empleadas pueden ser contaminantes, por lo cual este estudio no pretende acusar o señalar alguna fuente o foco contaminante en particular. Ing. Ricardo Rodriguez Otero
5
2. MARCO TEÓRICO 2.1.
CONTAMINACIÓN ATMOSFÉRICA Y SU RELACIÓN CON ENFERMEDADES RESPIRATORIAS
La contaminación atmosférica se produce principalmente en las áreas urbanas. Aunque el suelo tipificado como urbano corresponde al 3% de la superficie del planeta, en estas áreas se produce el 78% de la contaminación atmosférica (Bereitschaft y Debbage, 2013). Debido a la contaminación atmosférica, la población que habita en áreas urbanas está expuesta diariamente a altas concentraciones de gases y partículas como el monóxido de carbono (CO), ozono (O3), dióxido de nitrógeno (NO2), dióxido de azufre (SO2) y material particulado menor o igual a 10 micras (PM10, PM5 y PM2.5) (Sánchez et al., 2013). Además, la contaminación se presenta de forma combinada o mixta. Es decir, al haber múltiples fuentes o focos contaminantes es difícil determinar la causa de las infecciones respiratorias agudas, dado que, al igual que la contaminación atmosférica, otras causas o factores pueden afectar la salud humana. Por lo anterior, el monitoreo de partículas contaminantes se realiza de forma individual, pues permite identificar con mayor precisión la fuente de la contaminación, puesto que cada partícula o gas contaminante tiene diferentes características. La combinación de éstos genera o afectan diversos tipos de susceptibilidades o vulnerabilidades en la salud humana, ocasionando así enfermedades cardiovasculares, alergias, irritaciones momentáneas o enfermedades respiratorias (Samet, 2014). Los gases y partículas contaminantes se clasifican tanto por el tipo de fuente como por sus composiciones químicas, como los compuestos nitrogenados, más específicamente los óxidos de nitrógeno como el monóxido de nitrógeno - NO y el dióxido de nitrógeno - NO2, o azufrados como el Amoniaco, óxidos de azufre como el dióxido de azufre - SO2 y el trióxido de azufre - SO3, los compuestos orgánicos como el monóxido de carbono o compuestos orgánicos volátiles (COV) y, por último, el material particulado o partículas suspendidas (PM10, PM5 y PM2.5). Estas últimas son clasificadas como las más peligrosas para la salud humana, ya que llegan con facilidad a los bronquios y se quedan en los pulmones (a diferencia de los gases los cuales generan un daño temporal durante la exposición a éstos), los efectos pueden variar según la edad y salud de la población expuesta (OMS, 2006). Esto indica que el daño en la salud humana está dado por la exposición y concentración de las partículas, entre menor sea el tamaño de esta, mayor nivel de penetración en el sistema respiratorio, teniendo una gran variedad de efectos nocivos como Ing. Ricardo Rodriguez Otero
6
irritantes, corrosivos y cancerígenos si logran depositarse en el sistema respiratorio. El principal foco de emisión de estas partículas son los motores de los vehículos diésel y en menor medida los motores de otro tipo de combustible (Alfonso, Saury, y Belisario, 2013). En la Tabla 1 se muestran los límites recomendados de exposición a las partículas contaminantes (OMS, 2006). Tabla 1. Principales partículas contaminantes Según la OMS (2006).
Partícula contaminante
Molécula
Exposición limite recomendada
Material Particulado 10 micras
PM10
10 µg/m3, media anual 25 µg/m3, media de 24 horas 20 µg/m3, media anual 50 µg/m3, media de 24 horas Fundamento
Material Particulado 2.5 micras
PM2.5
10 µg/m3, media anual 25 µg/m3, media de 24 horas
Ozono
O3
100 µg/m3, media de ocho horas Fundamento
Dióxido de Nitrógeno
NO2
40 µg/m3, media anual 200 µg/m3, media de una hora
Dióxido de Azufre
SO2
20 µg/m3, media de 24 horas 500 µg/m3, media de 10 minutos Fundamento
La combinación de otras partículas como el ozono (O3) cuenta con una sintomatología definida sobre el sistema respiratorio como tos y falta de aire, además de agravar los síntomas de otras enfermedades como el asma (Rodríguez, 2009). Las demás partículas (NO, NO2, CO, SO2 y SO3) también presentan síntomas similares y sus efectos son más perjudiciales en niños, por ser las causantes de alergias y otras enfermedades (Rodríguez, 2009).
2.2.
ESTADÍSTICA ESPACIAL Y MINERÍA DE DATOS.
La estadística espacial es una herramienta fundamental para la investigación de fenómenos ambientales y epidemiológicos. Un ejemplo es el uso de métodos estadísticos usados en un estudio de la relación de consultas de urgencias de IRA y otras enfermedades pulmonares en niños menores de 14 años. En los métodos usados está el uso de dos tipos de regresión lineal (Poisson y dicotómica) usando datos de estaciones ambientales de la Habana Cuba (Romero et al., 2004). La estadística espacial se divide en tres fases: el análisis exploratorio de datos, la auto correlación espacial y la asociación espacial (Anselin, 1996). Ing. Ricardo Rodriguez Otero
7
Por definición, la minería de datos es una forma de “descubrir” patrones o tendencias con la finalidad de identificar oportunidades, causas, consecuencias o anomalías en bases de datos muy grandes. A partir de herramientas estadísticas óptimas, se obtienen predicciones o relaciones entre variables (Olson, Moshkovich, y Mechitov, 2008). El análisis de datos geográficos combinando herramientas estadísticas, gráficas y cartográficas, tiene como nombre análisis exploratorio de datos espaciales o “data mining” se emplea para realizar un tratamiento específico en estadística de los datos espaciales en diversas temáticas. Por ejemplo uno de los usos más recurrentes de este tipo de herramientas es el análisis de mercados con datos geográficos o geomarketing, por el volumen de datos que se utilizan en las bases de datos de este tipo de análisis (Chasco, 2009). Un ejemplo del uso de métodos geoestadísticos para el monitoreo de contaminación ambiental es el cálculo de la relación espacial de datos de contaminación de estaciones ambientales en Teherán- Irán. Se compara la precisión de la interpolación de datos de imágenes MODIS, siendo las superficies generadas por el método Kriging (ver capítulo 2.4) más precisas, según los errores de predicción de los mapas (Shad et al., 2008). La minería de datos tiene su aplicación en diversos tipos de industria o actividad científica, incluyendo los Sistemas de Información Geográfica (SIG), el manejo de datos espaciales y su relación con la estadística espacial, el análisis exploratorio de datos y la cartografía analítica, con lo cual se establecen diferentes tipos de metodologías para analizar grandes cantidades de datos, pero se requiere seguir una variedad de procesos para obtener un análisis óptimo de los datos, como por ejemplo la selección y limpieza de datos. Para analizar patrones se debe considerar el uso de algoritmos que son más efectivos que los métodos estadísticos tradicionales (Guo and Mennis, s.f.), así como el análisis de clústeres, regresión logística o lineal, entre otros. Uno de los métodos usado en la minería de datos y en estadística es el análisis clúster, una metodología estadística que permite obtener grupos homogéneos de datos o de unidades espaciales, creando una clasificación entre los datos analizados para identificar los grupos de datos que tienen la máxima similitud o todo lo opuesto, haciendo visible la heterogeneidad o la homogeneidad de los grupos de datos (Buzai, 2014). La agrupación de los datos depende de la distancia y el método bajo el cual se calcula la distancia entre cada dato, realizando las combinaciones más adecuadas como el vecino más Ing. Ricardo Rodriguez Otero
8
cercano o el mĂĄs alejado entre las unidades espaciales o entre los centroides creados entre los grupos o clĂşster (Buzai, 2014). En esta investigaciĂłn el uso de las herramientas de estadĂstica espacial o minerĂa de datos espaciales, determinarĂĄn la relaciĂłn espacial entre diversas variables.
2.2.1. AnĂĄlisis exploratorio de datos y autocorrelaciĂłn espaciales El anĂĄlisis exploratorio de datos espaciales permite identificar el comportamiento de las variables a modelar, puede ser aplicado desde una variable hasta en entorno multivariado, tambiĂŠn funciona como filtro de errores o detecciĂłn de casos irregulares o anĂłmalos en los datos, lo anterior estĂĄ enmarcado en varias tĂŠcnicas de estadĂstica bĂĄsica. La exploraciĂłn de datos espaciales en medicina se aplica en investigaciones epidemiolĂłgicas
como la
dispersiĂłn espacial, diagnĂłstico de enfermedades del entorno y caracterĂsticas poblacionales (Buzai, 2015). La autocorrelaciĂłn espacial mide el comportamiento de una variable en diferentes unidades espaciales contiguas, permitiendo el anĂĄlisis de propagaciĂłn de diversos fenĂłmenos en diferentes unidades espaciales, indicando a su vez si existe o no una tendencia de aglomeraciĂłn de datos (Buzai y Baxendale, 2013). La autocorrelaciĂłn cuenta con tres posibles interpretaciones. Cuando el valor tiende a tener una aproximaciĂłn a los valores vecinos se podrĂa decir que la autocorrelaciĂłn es positiva, lo cual indicarĂa una posible tendencia de agrupamiento. De forma contraria, se puede presentar un evento en el que los valores son muy distantes uno de otro, por lo que la autocorrelaciĂłn serĂa negativa. Por Ăşltimo se puede presentar el caso de que los valores se den de forma aleatoria no existiendo autocorrelaciĂłn (Buzai, 2015). La autocorrelaciĂłn espacial se puede cuantificar por medio del Ă?ndice (I) de Moran, el cual compara un valor con sus valores vecinos. đ??ź=
đ?‘› ∑đ?‘–(đ?‘‹đ?‘– − đ?‘‹Ě…) ∑đ?‘— đ?‘¤đ?‘–đ?‘— (đ?‘‹đ?‘— − đ?‘‹Ě…) (ÎŁđ?‘– ÎŁđ?‘— đ?‘¤đ?‘–đ?‘— )ÎŁđ?‘– (đ?‘‹đ?‘– − đ?‘‹Ě…)2
[1]
En el Ă?ndice de Moran, n representa el nĂşmero de unidades espaciales, Xi representa el valor
Ě… es de una variable en una unidad espacial i, Xj es el valor de la variable en otra posiciĂłn, đ?‘‹ Ing. Ricardo Rodriguez Otero
9
la media de la variable y wij es un peso que indica la relación de contigüidad entre unidades espaciales, cumpliendo la siguiente condición, donde i-j al ser contiguas tendrán un valor de 1, en caso contrario será 0. El índice de Moran tendrá valores entre -1 y 1 como representación de autocorrelación (Buzai, 2015). El Índice de Moran se usa en estudios epidemiológicos para identificar patrones o anomalías en la distribución espacial de enfermedades. Ejemplo de esto es en Taiwán donde, a través del análisis de la correlación espacial de puntos calientes en afectaciones de la salud, se usa este índice para crear mapas de clústeres de diferentes causas de muerte (Tsai, Lin, Chu, y Perng, 2009). Otro ejemplo es el estado de Paraná (Brasil), donde se usó el índice para determinar la distribución y autocorrelación espacial de indicadores de salud entre madres y niños recién nacidos, usando variables sociales de las madres y afectaciones en la salud de los niños, con el objetivo de para mejorar los servicios de salud en la provincia (Melo y de Freitas Mathias, 2010). A diferencia de la autocorrelación univariada, las medidas geoestadísticas de asociación espacial buscan determinar o establecer la correlación o una asociación entre 2 o más variables usando diferentes índices basados en regresión espacial como el “Spatial Lag Index”(Levine, 1996). La asociación espacial es de gran utilidad para estudios urbanos, pues permite un análisis desde la observación de la variabilidad espacial de diversos tipos de variable. En resumen, busca determinar el comportamiento de valores alto o bajos en los datos sin importar el tipo de variable observada (Páez y Scott, 2004). Para un análisis eficaz de datos usando técnicas de estadística espacial se debe considerar la necesidad de escoger la unidad de superficie más pequeña posible, pero evitando que éstas sean excesivamente pequeñas, esto puede generar un análisis erróneo de patrones por falta de contigüidad o por datos muy heterogéneos Adicionalmente, muchas de estas unidades están dadas por divisiones político administrativas que en muchos casos no son homogéneas (Onofrio et al., 2016).
Ing. Ricardo Rodriguez Otero
10
2.2.2. Indicadores locales de asociaciĂłn espacial (LISA) Al contrario de los indicadores globales, los Indicadores Locales de AsociaciĂłn Espacial (o Local Indicators of Spatial Association LISA, por sus siglas en inglĂŠs) estĂĄn orientados hacia un anĂĄlisis mĂĄs ajustado a la realidad, dado que ĂŠstos deben cumplir la condiciĂłn que la sumatoria de sus valores debe equivaler al valor de un indicador global. Adicionalmente indican quĂŠ tan significativo es o no un clĂşster o agrupamiento espacial. Los clĂşsteres locales espaciales se definen como los puntos calientes o frĂos en los datos, teniendo en cuenta la contigĂźidad de los mismos (Anselin, 1995). Los dos Ăndices locales de asociaciĂłn espacial mĂĄs usados son el Ă?ndice Local de Moran y el Ă?ndice Getis Ord (gi*). La diferencia principal entre el Ă?ndice Global de Moran y el Ă?ndice Local de Moran, radica en que el indicador global puede indicar si hay o no correlaciĂłn entre los datos a travĂŠs de quĂŠ tan significativa es la totalidad de ellos, lo cual se simplificarĂa en que si los datos son o no significativos. A menor escala el indicador local identifica “puntos calientesâ€?, “puntos frĂosâ€?, datos anĂłmalos y datos no significativos al computar las diferencias de los datos contra el valor de la media de los mismos y comparĂĄndolos con su respectiva vecindad (Rico et al., 2014). â–Ş
Ă?ndice Local de Moran:
đ??źđ?‘– =
Ě… đ?‘‹đ?‘– − đ?‘‹ 2 ∑ đ?‘†đ?‘–
đ?‘›
Ě…) . ∑ đ?‘Šđ?‘–đ?‘— (đ?‘‹đ?‘— − đ?‘‹
[2]
đ?‘—=1
̅ es la La ecuación [2] del �ndice Local de Moran se calcula de la siguiente manera: � intensidad de la media para todas las observaciones, Xi es la intensidad de la observación i; Xj es la intensidad para todas las demås observaciones, (donde i ≠j). Si 2 es la diferencia al cuadrado de todas las observaciones y Wij es el peso a distancia para la iteración entre las observaciones i y j. El primer tÊrmino Xi se refiere únicamente a la observación i, mientras que el segundo tÊrmino Xj es la suma de los valores ponderados para todas las observaciones (sin incluir i) (Ordóùez, Varela, y Reyes, 2011). Para interpretar los resultados del �ndice Local de Moran, los valores positivos del indicador representan la posibilidad de que el valor analizado pertenezca a un clúster ya sea de valores altos o de valores bajos; si el resultado del indicador es negativo este valor es anómalo. Para Ing. Ricardo Rodriguez Otero
11
que los clĂşsteres o el valor atĂpico sean significativos el valor p debe ser muy pequeĂąo, en caso de que sea alto el valor analizado no es significativo. Los valores atĂpicos se presentan en dos casos: cuando un valor alto estĂĄ rodeado por valores bajos y cuando un valor bajo estĂĄ rodeado de valores altos (Tsai et al., 2009). â–Ş
Ă?ndice Getis Ord (gi*)
đ??şđ?‘–∗
∑đ?‘›đ?‘—=1 đ?‘¤đ?‘–,đ?‘— đ?‘Ľđ?‘— − đ?‘‹Ě… ∑đ?‘›đ?‘—=1 đ?‘¤đ?‘–,đ?‘—
= �
đ?‘› 2 √[đ?‘› ∑đ?‘—=1 đ?‘¤đ?‘–,đ?‘—
[3]
2 (∑đ?‘›đ?‘—=1 đ?‘¤đ?‘–,đ?‘— ) ]
− đ?‘›âˆ’1
đ?‘†=√
∑đ?‘›đ?‘—=1 đ?‘‹đ?‘—2 đ?‘› đ?‘‹Ě… =
− (đ?‘‹Ě…)2
∑đ?‘›đ?‘—=1 đ?‘Ľđ?‘– đ?‘›
[3.1]
[3.2]
Donde xj es el atributo de valor numerado por j y w (i,j) es el peso espacial entre el objeto i y j, dado que n es el nĂşmero total de entidades o unidades espaciales, S es la desviaciĂłn estĂĄndar “globalâ€? o del ĂĄrea completa de estudio de igual forma đ?‘‹Ě… corresponde la media “globalâ€? o de la totalidad del ĂĄrea de estudio. El resultado del Ăndice Getis Ord o gi* se da en la diferencia del promedio de los valores de la unidad espacial con respecto a su vecindad, adicionalmente la agrupaciĂłn se representa en valores z, que es la normalizaciĂłn (mĂŠtodo z-score, por esa razĂłn los valores toman el nombre de valores z) de la diferencia de los promedios y su vecindad (Mas, 2018). siendo z el rango de valores menores o iguales a -1.65 o valores mayores o iguales a 1.65 de cada una de las unidades espaciales los cuales corresponden a quĂŠ tan significativos son los datos, los datos en el rango de -1.65 hasta 1.65 se consideran aleatorios o no significativos. Los valores de z entre mĂĄs altos y a su vez ĂŠstos representan una vecindad de valores altos se considera como un punto caliente. En el caso contrario, cuando los valores z de cada unidad espacial son negativos y se agrupan en una vecindad se considera como un punto frĂo, dado que los valores al estar agrupados se les considera segĂşn su valor; en caso que no estĂŠn agrupados se considera como un dato no significativo o aleatorio (Getis y Ord, 2010).
Ing. Ricardo Rodriguez Otero
12
Los anteriores índices son utilizados en la identificación de patrones, anomalías en los datos y puntos calientes, pero ambos índices se basan en la vecindad o entorno de cada elemento o unidad espacial a analizar que, a diferencia del índice Global, solo indica la presencia o ausencia de clústeres como ya se ha mencionado. Los indicadores locales son usados en diversas temáticas o análisis, por ejemplo, en la ciudad de Vigo – España con el uso de herramientas SIG así como Indicadores Locales de Asociación Espacial se buscó facilitar o priorizar el servicio de los bomberos con el análisis de puntos calientes de incendios ocurridos de 2005 a 2008, encontrando anomalías o áreas donde se presentan más incendios en viviendas (Ordóñez et al., 2011). En otro caso se utilizaron Indicadores Locales de Asociación Espacial y análisis de autocorrelación espacial para analizar la generación y atracción de viajes en zonas de transito de Lima - Perú, las cuales son insumos para modelos de transporte, como método alternativo a técnicas de estadística tradicional o descriptiva (Lavado, 2015).
2.2.3. Asociación de variables espaciales Un ejemplo de asociación de variables son los modelos de regresión lineal, muy usados en modelos de contaminación atmosférica. Usando las partículas contaminantes del aire como variables dependientes permiten estimar las concentraciones de dichas partículas, pero en un entorno urbano se deben incluir como variables independientes de los modelos la forma y extensión de una ciudad (Bereitschaft y Debbage, 2013). Para modelar la calidad del aire en una ciudad mediante el uso de herramientas SIG o de sensores remotos, se debe tener en cuenta que los datos pueden verse afectados por factores climáticos como la estacionalidad del clima, vientos, temporadas de lluvia, entre otros. Dado esto, se debe considerar la comparación y contraste de información, puesto que, al combinar las áreas de cobertura de las estaciones de monitoreo, la ubicación de las fuentes o focos contaminantes y la densidad poblacional en la zona de análisis se puede llegar a entender el porqué de la concentración o dispersión de partículas contaminantes. Así mismo, a través de modelos que permitan identificar la relación entre variables, como por ejemplo los modelos de regresión lineal (ver capítulo 2.4) e incluyendo la variable tiempo, permitiendo la asociación de pesos, se puede lograr la identificación de los sitios que presentan baja calidad del aire en un área de estudio (Superczynski y Christopher, 2011). Ing. Ricardo Rodriguez Otero
13
Los análisis derivados de modelos de regresión logística permiten asociar múltiples variables o capas SIG, en especial las variables sociodemográficas de la población afectada por la contaminación atmosférica, las cuales son variables independientes del modelo, tales como la edad de las personas que reportaron molestias o género. Estas variables complejizan el modelo a analizar, pero permiten determinar con mayor facilidad el tipo de población que es más susceptible o vulnerable para algún tipo de gas o partícula contaminante. Así mismo, los tipos de suelos o de residencia se deberían tener en cuenta como pesos adicionales en los modelos, pero también se deben considerar los tipos de limitaciones como la forma en que se reporta la molestia o enfermedad, si fue o no el diagnóstico correcto, la procedencia de la ciudad o una zona o municipio vecino o si no se suministraron los datos correctamente (Piro, Madsen, Næss, Nafstad, y Claussen, 2008).
2.3.
SERIES DE TIEMPO.
Las series de tiempo se definen como las observaciones o muestreo de datos a lo largo del tiempo en forma sucesiva y ordenada, donde se asume que las observaciones son dependientes y están en intervalos regulares (Arcia, Martínez, y Isaguirre, 2005). Las series de tiempo son una herramienta que permite identificar los efectos de un fenómeno o la evolución de un proceso en el tiempo. Permiten identificar de forma complementaria datos relevantes para un modelo, como puntos de inflexión o facilitar la identificación de áreas afectadas por variables como la erosión del suelo, la cual es posible modelar usando series de tiempo de varias variables o en particular de productos de sensores remotos, lo cual es más económico que otros tipos de observaciones en el tiempo (Kefi, Yoshino, y Setiawan, 2012). En otras palabras, en estadística se considera que las series de tiempo son una secuencia de datos puntuales en el tiempo; su análisis permite identificar el significado estadístico de los datos y sus relaciones entre variables. Sin embargo, las series de tiempo sirven en los modelos geográficos para dar un orden temporal a la información, ya que los modelos geoestadísticos tratan cada variable de forma independiente con la finalidad de facilitar los cálculos del modelo. Las series de tiempo son un complemento a estos modelos (Huang y Huang, 2012).
Ing. Ricardo Rodriguez Otero
14
Estas herramientas son muy usadas en diversos campos, como por ejemplo en los sensores remotos para el análisis de áreas en aspectos como la erosión del suelo, usos del suelo, análisis de crimen, entre otros. El tiempo es una información importante en el análisis epidemiológico pues permite entender el desarrollo o las características de cualquier enfermedad infecciosa, información que, combinada con otras variables, permite entender el comportamiento o los patrones de una enfermedad, como por ejemplo las IRA (Lee y Wong, 2010). Un ejemplo del uso de las series de tiempo en el análisis de la relación de enfermedades respiratorias y partículas contaminantes, como lo es el material particulado PM10, se presentó en la ciudad de Palmira - Colombia, a raíz de la quema contante de residuos del cultivo de caña de azúcar, las series de tiempo se usaron como insumo de 2 modelos estadísticos convencionales de mínimos cuadrados ordinarios y Poisson (Dávalos, 2007). En otro estudio, a diferencia del anterior, se analizaron series de tiempo con varias partículas contaminantes en diferentes rangos de exposición, a partir de la hipótesis de que estas partículas son las causantes de gran parte de las consultas por enfermedades respiratorias como asma, en Ciudad Juárez – México. Estas series de tiempo se usaron como insumo para un modelo convencional de regresión
Poisson, encontrando una asociación positiva
(Hernández Cadena et al., 2000). Para esta investigación se realizó el análisis de series de tiempo de las partículas contaminantes para identificar sus tendencias y ciclos.
2.4.
INTERPOLACIÓN DE DATOS GEOESPACIALES Y MODELOS GEOESTADÍSTICOS
La información geoespacial es cualquier tipo de dato al que se le pueda asignar una localización sobre el terreno y representar en un mapa, ya sea en formato vectorial (punto, línea o polígono) o en formato raster (imágenes con pixeles georreferenciados). Ambos formatos pueden ser una representación del mundo real y pueden ser tan precisos o no, según la escala y otros factores (Pennekamp, 1999). Dado que representan el mundo real con sus características físicas, ambientales o sociales puede ser complejo y costoso intentar una representación totalmente fiel, por lo que es necesario modelar las características o variables más representativas e importantes según el proyecto. La interpolación es una forma de Ing. Ricardo Rodriguez Otero
15
complementar la información geoespacial; a través de diversas técnicas se pueden estimar datos espaciales y ubicaciones no muestreadas (Li, Zhang, y Piltner, 2008). De igual forma que la autocorrelación espacial (ya mencionada en la sección 2.2.1), la interpolación depende de la información del vecindario y la distancia relacionada o la influencia que puede ejercer un dato sobre el vecindario, donde se asume que cada dato es similar a su vecino de forma proporcional a la distancia entre cada dato (Joly, 2010). Existe gran variedad de métodos de interpolación clasificados de entre determinísticos y geoestadísticos, donde las representaciones graficas de los modelos determinísticos son más estéticas que las de los modelos geoestadísticos, pero con una precisión indeterminada (Krivoruchko, 2011), por lo que es necesario escoger el método que permita un resultado óptimo y más ajustado acorde a los datos de entrada. Una de esas técnicas de interpolación más utilizadas es el método geoestadístico Kriging, uno de los primeros métodos de interpolación, ideado por el geólogo sudafricano D. G. Krige. Este método se utilizó inicialmente en la minería de oro; tiene una finalidad predictiva en diversas aplicaciones y a sí mismo tiene varias versiones, las cuales buscan reducir el error medio cuadrático (Giraldo, 2011). En otras palabras, el método Kriging consiste en tres escenarios en los que se revisan la autocorrelación espacial de los datos, se verifican las tendencias resultantes y se determina la superficie de interpolación (Nejadkoorki y Nicholson, 2012). Este método es muy usado por sus estimaciones precisas. Un ejemplo de su uso se da en un estudio de asociación de contaminación atmosférica con ozono (O3) y material particulado (PM2.5) y sus efectos en diferentes grupos poblaciones y su posible relación con la enfermedad respiratoria asma en el estado de Texas - Estados Unidos. En este estudio se interpolaron los datos de las partículas contaminantes con el método de Kriging ordinario, con la finalidad de entender la distribución espacial y concentración de las partículas (Gorai, Tchounwou, y Tuluri, 2016). Otro ejemplo de la aplicación de este método en estudios ambientales y epidemiológicos es el estudio que se realizó en la ciudad de Los Ángeles - California en Estados Unidos, donde hubo la necesidad de desarrollar un modelo flexible de contaminación atmosférica y sus covariables espaciotemporales. Lo anterior para investigar la relación entre enfermedades cardiovasculares y la exposición crónica a óxidos de nitrógeno (NOx) en largos periodos de Ing. Ricardo Rodriguez Otero
16
tiempo en un rango de 10 años, validando estadísticamente los datos estimados a través de interpolaciones con el método Kriging universal (Lindström et al., 2014). Al ser datos que deben ser recolectados en diversos periodos de tiempo, las variables ambientales o climatológicas presentan una dificultad para la aplicación de cualquier método de interpolación. Es posible aplicar la interpolación en un momento específico, pero en el caso que se requiera una interpolación de información en periodos de tiempo de días, semanas, meses o años se deben tratar los datos de forma separada o con otros criterios para facilitar o simplificar la interpolación. Dado que en su mayoría los métodos de interpolación obviando la variable tiempo, ésta se debe tratar como una dimensión adicional al espacio “extendiendo” en el algoritmo que realiza el cálculo o “reduciendo” el cálculo a una sola dimensión que sería la dimensión tiempo. Métodos como la interpolación Inverse Distance Weighting - IDW o ponderación de la distancia inversa, por defecto suponen que los objetos que se encuentran cerca unos de otros cuentan con valores más parecidos qué los objetos más alejados, asignando pesos a los objetos: entre más grande sea el peso o influencia, estará más cercano el valor de un objeto con sus vecinos; pero entre más alejado, menor va a ser el peso o influencia de este con respecto del resto del vecindario. El método IDW incluye la opción de agregar una barrera de tiempo, pero no es tan eficiente como otros algoritmos o métodos de interpolación ya que depende de un número x de elementos o de objetos en el área de estudio para tener una mayor precisión en la estimación. El método en función de forma o “Shape Function-Based” es más preciso en el manejo del tiempo, pero no tiene la precisión espacial del método IDW. Por esto es necesario considerar el mejor método según los datos que se posean para la respectiva interpolación (Li et al., 2008). Adicionalmente el método de interpolación IDW es considerado un método determinístico, pero en estudios ambientales es implementado por los usos más eficientes de los datos originales, permitiendo una mejor representación de datos extremos máximos y mínimos. Un ejemplo es el uso de este método de interpolación en un estudio de la relación entre la contaminación de aguas subterráneas con benceno y su relación en el riesgo de contraer algún tipo de cáncer en niños y adultos, utilizando más de 100 muestras de pozos subterráneos en la ciudad de Madurai – India (Senthil, Sivasankar, y Gopalakrishna, 2017)
Ing. Ricardo Rodriguez Otero
17
Con base a lo anterior, antes de definir el tipo de interpolaciĂłn a utilizar es importante evaluar la composiciĂłn de los datos estadĂsticamente para tener una estimaciĂłn mĂĄs ajustada a la realidad. La interpolaciĂłn de datos espaciales es un tipo de modelo que permite realizar predicciones sobre informaciĂłn faltante o que no fue posible recolectar, tambiĂŠn se da la necesidad de entender o explicar quĂŠ relaciĂłn hay entre diversas variables en el espacio con la finalidad de dar respuestas a preguntas como las planteadas en el presente documento. Al ser necesario para comparar y analizar mĂşltiples variables en una misma escala manteniendo la proporciĂłn de los datos se aplicĂł la normalizaciĂłn o estandarizaciĂłn de datos usando el mĂŠtodo de puntuaciĂłn Z (Z-Score). Este mĂŠtodo de normalizaciĂłn permite puntuar en tĂŠrminos o en unidades de la desviaciĂłn estĂĄndar de los datos, en otras palabras, para pasar de un valor đ?‘‰ a un valor nuevo đ?‘‰ ′ se utiliza [5] đ?‘‰â€˛ =
đ?‘‰ − đ?‘‰Ě… đ?‘†đ?‘‰
[4]
Donde đ?‘‰ ′ es el nuevo valor de la variable a normalizar, siendo V el valor original a este se le resta đ?‘‰Ě… y se divide sobre đ?‘†đ?‘‰ que es la desviaciĂłn estĂĄndar de V, teniendo como resultados valores decimales. La normalizaciĂłn se aplica principalmente al realizar modelos de regresiĂłn lineal, con la finalidad de disminuir sesgos en los resultados a pesar de que la regresiĂłn lineal puede admitir diversos tipos de variable en una misma ecuaciĂłn. Un ejemplo del uso de la normalizaciĂłn de datos estĂĄ en la comparaciĂłn de mĂŠtodos de normalizaciĂłn con datos epidemiolĂłgicos de dengue en Malasia, donde al tener los datos de valores mĂnimos y mĂĄximos en los datos se usa el mĂŠtodo de mĂnimos y mĂĄximos para dar un nuevo valor a las variables a analizar. Cuando en los datos no son claros estos lĂmites(mĂĄximos y mĂnimos) es recomendable usar el mĂŠtodo Z - Score que modifica directamente cada valor en tĂŠrminos de las desviaciĂłn estĂĄndar de los datos que se tienen (Mustaffa y Yusof, 2011). Los modelos basados en el anĂĄlisis de regresiĂłn lineal son una forma de crear predicciones como los modelos de interpolaciĂłn, pero a diferencia de ĂŠstos, con la regresiĂłn lineal se busca explicar o analizar las relaciones espaciales entre varias variables (Da Silva y Cardozo, 2016). Por definiciĂłn la ecuaciĂłn de regresiĂłn lineal mĂşltiple es la siguiente:
Ing. Ricardo Rodriguez Otero
18
đ?‘Œ = đ?›˝0 + đ?›˝1 đ?‘‹1 + â‹Ż + đ?›˝đ?‘› đ?‘‹đ?‘› + đ?œ€
[5]
Dada la anterior ecuaciĂłn, Y serĂa la variable dependiente con la que se representa el fenĂłmeno a explicar o predecir, donde Xn serĂan las variables conocidas o a utilizar para explicar la variable dependiente, los coeficientes de regresiĂłn β serĂan la relaciĂłn que existente entre las variables conocidas y la variable a encontrar, los coeficientes pueden tener signo negativo o positivo segĂşn se la relaciĂłn con la variable a encontrar, en otras palabras si un coeficiente o variable tiene signo positivo la relaciĂłn es positiva en el caso contrario la relaciĂłn es negativa. Por Ăşltimo, estĂĄ el error Îľ que representa la parte desconocida de la variable o fenĂłmeno a encontrar. Se puede usar un modelo de regresiĂłn lineal para identificar las interacciones entre las variables independientes del modelo y asĂ ver cual se ajusta mĂĄs a la variable que se desea explicar o predecir, como es el caso del anĂĄlisis de MĂnimos Cuadrados Ordinarios (OLS, por sus siglas en inglĂŠs) (ESRI, s.f.), el cual ofrece informaciĂłn de forma global sobre cada una de las variables. De la misma forma que la autocorrelaciĂłn espacial, los modelos de regresiĂłn lineal se pueden aplicar de forma local con el modelo de RegresiĂłn Ponderada GeogrĂĄficamente (GWR, por sus siglas en inglĂŠs). A diferencia del OLS, este modelo se utiliza para ver las relaciones que varĂan en el espacio. En otras palabras, este modelo aplica mĂşltiples veces la fĂłrmula de regresiĂłn lineal a la unidad mĂĄs pequeĂąa del ĂĄrea de estudio, asĂ se puede predecir o explicar la variable dependiente y sus variaciones en el espacio (Fang, Liu, Li, Sun, y Miao, 2015). Los modelos de regresiĂłn lineal son muy usados en el anĂĄlisis de la correlaciĂłn entre agentes contaminantes y sus efectos en la salud pĂşblica, permitiendo mantener las variables de contaminaciĂłn como independientes, a pesar de que es posible agregar variables socioeconĂłmicas, generando un rango mĂĄs amplio de resultados y patrones para analizar (Baccarelli et al., 2016). El uso de modelos de regresiĂłn como el modelo GWR, permite un anĂĄlisis mĂĄs especĂfico de la informaciĂłn o de la variable a explicar. Una muestra de esto es el uso del modelo para determinar la relaciĂłn entre la urbanizaciĂłn de ciudades y la calidad del aire en las mismas en China, lo cual dio como resultado que la urbanizaciĂłn pesa de forma negativa en la calidad del aire en las ciudades de este paĂs (Fang et al., 2015).
Ing. Ricardo Rodriguez Otero
19
3. METODOLOGÍA La metodología utilizada para esta investigación fue seleccionada según la disponibilidad de los datos y su relación con la mínima unidad espacial analizada en este estudio. Dado lo anterior y como se explica en el capítulo 2.2, la estadística espacial está dividida en el análisis exploratorio de datos, la auto correlación espacial y la asociación espacial, en ese orden se analizaron los casos de IRA según la unidad espacial o barrio en la que se encontraba cada caso. Se selecciona la metodología de índices de análisis y exploración espacial, por ser los más usados en estudios epidemiológicos y sus buenos resultados en el hallazgo de patrones. En adición el índice global de Moran junto a los índices LISA, como se explica en el capítulo 2.2.1 y en el capítulo 2.2.2, se aplican por su utilidad comprobada en estudios epidemiológicos, entregando diferentes tipos de información sobre el comportamiento de una enfermedad en el territorio. Para esta investigación se usan los indicadores ya mencionados porque es necesario determinar dónde se presentan patrones de casos de IRA y las anomalías de estos datos. Entre más altos o bajos sean los valores z, más intenso será el clúster, pero los valores cercanos a cero indican que los datos son aleatorios, los valores p pequeños indican presencia de clústeres y los niveles de importancia se califican en el siguiente rango de valores de -3 a -1 y de 1 a 3, donde -3 o 3 reflejan un nivel de confianza del 99%, los valores -2 o 2 un nivel de confianza de 95%, los valores -1 o 1 representan un nivel de confianza de 90% y el valor 0 representa que no es un datos significativo estadísticamente. En ese orden de ideas para la representación cartográfica de los datos de contaminación y climáticos, se realizó usado el método Kriging para crear superficies de interpolación. El método Kriging ya que es una técnica geoestadística muy usada y con resultados de buena precisión como se explica en el capítulo 2.4, a diferencia del método IDW, el cual solo pondera la distancia entre cada uno de los datos; donde Kriging contempla la distancia y la probabilidad de los datos, teniendo una mayor precisión por lo cual se escogió, aunque el método IDW tiene resultados muy cercanos a los obtenidos con la interpolación Kriging. Por último, se selecciona como modelo de correlación, un modelo de regresión lineal que de igual manera que los métodos ya mencionados son muy usados en el ámbito epidemiológico, dado que permite encontrar la relación de una variable desconocida en razón a valores constantes y variables ya conocidos. Aplicando este modelo de forma global, por lo cual fue necesario utilizar un modelo adicional o complementario, que explora la variable Ing. Ricardo Rodriguez Otero
20
desconocida en cuanto a las unidades espaciales mínimas o en otras palabras aplica el modelo de regresión lineal de forma local, en cada una de las unidades espaciales. A continuación, se explica con más detalle la metodología aplicada y el área de estudio.
3.1.
ÁREA DE ESTUDIO
El área de estudio del presente trabajo es el casco urbano de la ciudad de Santiago de Cali, ubicada en el departamento del Valle del Cauca en Colombia. El municipio tiene un área total de 560.3 Km2, de la cual 120.9 Km2 conforman su área urbana, con una ubicación general que se puede apreciar en el ¡Error! No se encuentra el origen de la referencia.. La ciudad tiene
una altura promedio de 1070 m.s.n.m y está caracterizada con una
temperatura promedio de 24.7°C (Departamento Administrativo de Planeación, 2014). Es importante mencionar que se excluye de la modelación el área rural, ya que no hay datos de contaminación sobre la zona. Es necesario precisar que la mayoría de la población está ubicada en el área urbana, al igual que los sistemas de transporte, industrias y demás focos contaminantes. Administrativamente la ciudad está dividida en unidades geográficas llamadas comunas y estas en unidades más pequeñas llamadas barrios, que serán las unidades mínimas en este documento. Uno de los principales focos de contaminación atmosférica de Cali se encontraba en el relleno sanitario de Navarro, el cual fue clausurado desde el año 2009, con un área de influencia de 24 barrios ubicados en las comunas 15, 16, 17, 21 y 22. Los habitantes de este sector consideran que todavía puede ser un foco de contaminación y se tiene la percepción de riesgo a enfermedades respiratorias generadas por el relleno (Valencia, Espinosa, Parra, y Peña, 2011). Otro de los focos de más impacto en términos de contaminación atmosférica es el transporte y la disposición de escombros de forma ilegal y constante en la ciudad, a causa del desarrollo continuo de la ciudad (Robayo, Mattey, Silva, Burgos, y Delvasto, 2015). Así mismo, se presentan clústeres de diversas actividades industriales y comerciales, concentradas en 3 áreas: centro y parte norte de la ciudad y en el sector de Acopi en el municipio colindante de Yumbo. Estas fueron identificadas tomando puntos GPS y usando la función K de Ripley (Aya Vásquez y Correa Ortega, 2012).
Ing. Ricardo Rodriguez Otero
21
Mapa 1. Ubicaciรณn del ร rea de estudio
Ing. Ricardo Rodriguez Otero
22
3.2.
METODOLOGÍA APLICADA
En la Ilustración 1 se puede apreciar el flujograma de la metodología aplicada en este proyecto de tesis, la cual se divide en tres procesos: la selección y preparación de datos, el análisis espacial y exploratorio de datos y, por último, el análisis de regresión lineal.
Ilustración 1. Flujograma de metodología aplicada.
Ing. Ricardo Rodriguez Otero
23
3.2.1. Selección y preparación de datos En este proceso se usaron datos suministrados por el Departamento Administrativo de Gestión del Medio Ambiente – DAGMA, entidad que administra el Sistema de Vigilancia de Calidad del Aire de Santiago de Cali – SVCASC, sistema que analiza y recolecta información de 9 estaciones de monitoreo, tal como se muestra en la sección 3.2.1.2. Estos datos se organizaron por estación de monitoreo y se asignaron coordenadas a cada registro. Por último, se calcularon los promedios mensuales y anuales de cada partícula contaminante. Las partículas consideradas en la investigación son: Dióxido de Azufre (SO2), Ozono (O3), Dióxido de Nitrógeno (NO2), Material Particulado 2.5 μm (PM2.5) y Material Particulado 10 μm (PM10). Se seleccionaron estas variables al tener la mayor cantidad de datos por año y al ser las que tenían registros de más de 2 años en el sistema de monitoreo, no se utilizó la variable de monóxido de carbono (CO) pues solo se tiene información de un año de estudio y de 2 estaciones. También se organizaron los datos de Infecciones Respiratorias Agudas – IRA suministrados por la Secretaría de Salud Pública de la Alcaldía de Santiago de Cali, a partir del Sistema Nacional de Vigilancia en Salud Pública – SIVIGILA, como se muestra en la sección 3.2.1.3. Los datos están distribuidos por barrios, unidad mínima espacial considerada para este estudio. En un escenario ideal, para obtener resultados más precisos, se hubieran requerido con las coordenadas reales de cada persona afectada, sin embargo, de los 2198 registros solo 2036 tenían la ubicación de la persona afectada. Se procedió asignando una codificación a los datos y verificando los nombres de los barrios, para compararlos con los datos registrados en la cartografía básica del Plan de Ordenamiento Territorial (POT) de Cali del año 2014. Y por último se descargaron los datos climatológicos de la red de monitoreo de la Corporación autónoma regional del Valle del Cauca – CVC en Cali. Esta entidad tiene en la ciudad, una estación climatológica y 4 estaciones pluviográficas de las cuales se tomaron datos de días de lluvia y precipitación total como se muestra en la sección 3.2.1.4. También se organizaron por estación de monitoreo y se asignaron coordenadas a cada registro. Por último, se calcularon los promedios anuales de cada variable a partir de sus valores mensuales.
Ing. Ricardo Rodriguez Otero
24
3.2.1.1. Preparación de datos La información obtenida se encontraba principalmente en formato Excel por lo que fue necesario estandarizar dicha información, para lo cual se realizaron varios procesos en los que se organizaron atributos en nuevas tablas y se asignaron las correspondientes coordenadas. Para esto se usó el software Microsoft Office más específicamente Excel, con el software estadístico IBM SPSS, y se complementó con el software SIG ArcGIS 10.5.1.
3.2.1.2. Datos ambientales Se compararon los datos de las estaciones de monitoreo ambiental con los datos de salud, en un periodo de 6 años entre 2010 a 2015. Aunque los datos sobre IRA están distribuidos en un periodo de desde 2010 a 2016, con una diferencia de un año con respecto a los datos ambientales, esta diferencia se da para tener una tendencia más clara de los datos, ya que en algunas estaciones los datos no fueron continuos por diversas causas. Los datos analizados y procesados corresponden a los valores hora de la concentración de las siguientes partículas contaminantes: Dióxido de Azufre (SO2), Ozono (O3), Dióxido de Nitrógeno (NO2), Material Particulado 2.5 μm (PM2.5) y Material Particulado 10 μm (PM10). Los datos de contaminación o monitoreo de la calidad del aire en Cali fueron suministrados por el DAGMA como entidad administradora de las estaciones de monitoreo ambiental. La ubicación de las estaciones se puede apreciar en el Mapa 2 y en la
Tabla 2 se detallan las coordenadas y nombre de cada estación de monitoreo.
En todas las estaciones se presentan “Datos Perdidos” o vacíos los cuales se completaron gráficamente usando el software IBM SPSS para facilitar la interpretación de cada una de las series de tiempo generadas por estación y partícula contaminante. Las estaciones ambientales no colectan la información de forma homogénea, ni funcionan en los mismos periodos de tiempo, dado que algunas entraron en operación en diferentes años, razón por la cual se analizaron los años más homogéneos y las variables contaminantes con la mayor cantidad de datos por año de cada estación. Con estos datos se calcularon el promedio mensual y anual de cada una de las variables de partículas contaminantes Ing. Ricardo Rodriguez Otero
25
mencionadas. Se debe tener en cuenta que la estación Pance, a pesar de estar ubicada en un área rural al sur de Cali, se usan sus datos para dar mayor precisión a las interpolaciones dentro del área urbana. Para el análisis de partículas contaminantes se evaluaron los límites o niveles óptimos de partículas contaminantes, partir de las directrices incluidas en las “Guías de calidad del aire de la OMS” (OMS, 2006), en donde se señalan los niveles a partir de los cuales ya se presentan efectos adversos en la salud. Este mismo documento señala objetivos intermedios con los que se busca reducir la mortalidad y otros efectos nocivos. Las partículas contaminantes actúan de forma combinada, afectando la salud humana. En otras palabras, estas partículas naturalmente no se encuentran aisladas. Éstas se miden en microgramos por metro cúbico, lo cual se representa de esta manera μg/m3. Para el análisis de comportamiento de cada partícula se realizó una representación gráfica de las series de tiempo disponibles usando el software estadístico IBM SPSS. Para un manejo más simple de los datos se promediaron mensualmente sin importar la temporalidad en la que estos datos se recolectaron (24 horas u 8 horas). Gracias a este procedimiento se obtuvieron series de tiempo con una periodicidad o secuencia mensual para cada partícula. Para el complemento del análisis de las partículas contaminantes se elaboraron mapas a partir de interpolaciones de los datos de los promedios anuales, utilizando el método de interpolación Kriging Ordinario; se utiliza este método por tener una mejor precisión estadística ya que reduce la incertidumbre en la interpolación (Pantaleoni, 2013). Aunque inicialmente se pensó en usar el método IDW ya que gráficamente el resultado es más estético que en la interpolación Kriging y ambos métodos tienen un desempeño similar, el método IDW depende principalmente de la distancia de los elementos a interpolar por lo que la precisión de la predicción del mismo disminuye en términos de distancia, el método Kriging Ordinario tiene un mejor resultado en su predicción ya que no solo depende de la distancia ente los elementos, como se muestra en la Ilustración 2 e Ilustración 3, donde se puede apreciar una diferencia considerable en el resultado de las interpolaciones.
Ing. Ricardo Rodriguez Otero
26
Ilustraci贸n 2. Ejemplo interpolaci贸n IDW
Ilustraci贸n 3. Ejemplo interpolaci贸n Kriging Ordinario
Ing. Ricardo Rodriguez Otero
27
Mapa 2. Ubicaciรณn de estaciones de monitoreo ambiental en Santiago de Cali.
Ing. Ricardo Rodriguez Otero
28
Tabla 2. Nombre y coordenadas de estaciones de monitoreo ambiental.
Sistema de Vigilancia de Calidad del Aire (SVCA) Localización de estaciones Estación
Nombre Completo
Nombre Abreviado
Latitud
Longitud
1 La Flora
La Flora
3° 29' 25.85"
-76° 31' 16.41"
2 ERA - Obrero
Era
3° 27' 1.51"
-76° 31' 20.16"
Navarro
3°25'1.93"
-76°29'41.05"
3
Estación Transitoria – EDB Navarro
4 Parque de la Caña
Base Aérea
3° 27' 25.66"
-76° 30' 8.29"
5 Pance
Pance
3° 18' 19.22"
-76° 31' 57.29"
6 Universidad del Valle
Univalle
3°22'40.48"
-76°32'1.72"
7 Compartir
Compartir
3°25'42.20"
-76°28'0.12"
8 La Ermita
La Ermita
3°27'19.69"
-76°31'51.57"
9 Cañaveralejo
Cañaveralejo
3°24'55.40"
-76°32'57.65"
3.2.1.3. Datos de infecciones respiratorias agudas – ira Los datos de IRA fueron suministrados por la Secretaría de Salud Pública de la Alcaldía de Santiago de Cali, los cuales están categorizados de la siguiente manera o tipos de consecuencia ESI - IRAG (VIGILANCIA CENTINELA), Infección Respiratoria Aguda Grave - IRAG Inusitada, Influenza. (ESI) IRAG, Mortalidad por IRA 0-4 años e IRA no especificada. Estas categorías se dan principalmente por la información recopilada de fuentes locales desde el año 2010 al 2016 por la Secretaría de Salud. Se usaron 2036 de un total de 2198, ya que estos tenían referencia clara de la ubicación del paciente. Estos son casos que han requerido algún tipo de atención médica o consulta por lo que el número de casos puede ser mayor. En los registros está asociado el género o sexo del paciente, edad y año de ocurrencia del caso. La información se encontraba en formato Excel, lo que requirió unificar y estandarizar los datos en un solo archivo, así como eliminar los registros que no fueran útiles para el estudio. Esta información contaba con el campo barrio, por lo cual se renombraron dichos barrios usando como referencia la Geodatabase del año 2014 del Plan de Ordenamiento Territorial (POT) de Cali. A estos registros se les agregaron las coordenadas de los centroides de los barrios y con esta información se creó una capa de polígonos con los barrios al ser la unidad mínima de los datos. Ing. Ricardo Rodriguez Otero
29
Se transfirió la información de los casos a los polígonos de barrios, con el geoproceso de unión espacial (Spatial Join), con lo cual se crearon polígonos al igual que el número de casos lo cual duplico polígonos según el número de casos por barrio. Hay que considerar que hay barrios sin registros, pero, al ser unidades espaciales contiguas, no se eliminaron estos barrios con registro cero o nulo quedando un único polígono por ese barrio sin registro alguno, por lo que se obtuvo una capa con 2,036 polígonos. Al ser casos discretos o puntuales no fue posible promediarlos como las demás variables de contaminación o climatológicas Procediendo a la codificación de los datos de IRA se le asignó un número o código a las 5 categorías de IRA mencionadas, como se muestra en la Tabla 3, adicionalmente en la Tabla 4 se muestra la codificación de datos por género. Tabla 3. Codificación de atributos de IRA.
Codificación de atributos Atributo
Ítem
Código
afección afección
ESI - IRAG (VIGILANCIA CENTINELA) Infección Respiratoria Aguda Grave IRAG Inusitada
1 2
afección afección afección
Influenza. (ESI) IRAG Mortalidad por IRA 0-4 años IRA no especificada
3 4 5
Tabla 4. Codificación de género de pacientes con IRA.
Ítem Genero Genero Genero
Codificación de atributos Atributo Código F 1 M 2 Sin información 0
3.2.1.4. Datos climatológicos Los datos climatológicos fueron obtenidos de las estaciones climatológicas y pluviométricas de la CVC, lo ideal hubiera sido usar los datos de las estaciones de monitoreo ambiental pero solamente 2 de las estaciones registraron esta información en el año 2010, por lo que se descartaron estos datos. Los datos usados de las estaciones CVC corresponden a días de lluvia y precipitación total, los cuales estaba a una escala mensual, estos últimos datos se promediaron anualmente. Para la investigación se incluyeron los días de lluvia, ya que la precipitación muestra la cantidad de agua, pero los días de lluvia muestra la intensidad de esta precipitación ya que en pocos días de lluvia en una zona se puede presentar un valor alto de precipitación y viceversa. Ing. Ricardo Rodriguez Otero
30
En la Tabla 5 se encuentra la ubicación de las estaciones se encuentra en coordenadas planas con el sistema de referencia MAGNA Cali Valle del Cauca año 2009 y el detalle del tipo de estación y nombre de las estaciones.
Tabla 5. Nombre y coordenadas de estaciones de monitoreo climatológico.
Localización de Estaciones CVC Estación 1 2
x 1060105.49 1059076.72
y 874385.88 872749.66
z 1053 1070
3
1060431.64
872417.25
1000
4 5
1059854.91 1064917.86
868389.07 872964.52
985 956
Ing. Ricardo Rodriguez Otero
Nombre Completo COLEGIO SAN LUIS PLANTA RIO CALI COLEGIO SAN JUAN BOSCO CAÑAVERALEJO-EDIFICIO CVC PLANTA RIO CAUCA
Tipo de Estación Pluviométrica Pluviométrica Pluviométrica Climatológica Pluviométrica
31
Mapa 3. Ubicaciรณn de estaciones de monitoreo climatolรณgico CVC en Santiago de Cali.
Ing. Ricardo Rodriguez Otero
32
3.2.2. Análisis espacial y exploratorio de datos Para el análisis espacial y exploratorio de datos se realizaron 4 procesos en paralelo, con la finalidad de analizar el comportamiento o tendencias de los datos ambientales, IRA y climatológicos.
3.2.2.1. Análisis de clústeres y puntos calientes Como se explicó en la sección 2.2.1 el índice global de Moran mide la autocorrelación espacial basándose en la ubicación simultanea del atributo a evaluar, usando una hipótesis nula donde los valores pueden estar distribuidos aleatoriamente, dependiendo que tan significativo sea el valor p obtenido. Utilizando el Índice global de Moran, se verificó si los datos de IRA presentaban agrupamiento o no. De forma complementaria se usó el método del promedio de los vecinos más cercanos, la herramienta del promedio de los vecinos más cercanos calcula la distancia entre cada centroide de los barrios y tiene en cuenta la ubicación del vecino más cercano. Los cuales se aplicaron el software ArcGIS 10.5.1, con el cual se generó un reporte estadístico del Índice global de Moran y del promedio de los vecinos más cercanos. Se evaluaron si en los datos hay presencia de puntos calientes o fríos utilizando el Índice Gi* y con el resultado se creó un mapa de puntos calientes y fríos y anomalías en la vecindad de los puntos calientes usando el software ArcGIS 10.5.1. Por último, se realizó el Análisis de clústeres a nivel local usando el Índice Local de Moran en su variante Anselin usando el software ArcGIS 10.5.1, el análisis se realizó por tipo de IRA, Edad, Género de los afectados, por año en el que se presentó la infección, teniendo como resultado 4 mapas uno por cada una de las variables asociadas directamente a cada uno de los casos de IRA.
3.2.2.2. Análisis de series de tiempo e interpolación de partículas contaminantes Usando el software estadístico IBM SPSS se generaron los gráficos de secuencia o series de tiempo por cada una de las partículas contaminantes en su correspondiente estación de monitoreo, los cuales se analizaron de forma independiente para visualizar el Ing. Ricardo Rodriguez Otero
33
comportamiento de cada partícula en dicha estación de monitoreo. Se continuó con la interpolación de los datos promediados anualmente de cada partícula contaminante y de los datos climáticos usando el método Kriging Ordinario que es un método geoestadístico preciso, se realizó una comparación con el método determinístico IDW que, a pesar de que gráficamente tiene mejores resultados, presenta diferencias importantes en el resultado numérico, lo anterior se realizó utilizando el software ArcGIS 10.5.1. Con base a cada interpolación resultante se realizó un mapa y análisis de cada uno de ellos en donde muestra cuales son las áreas donde se presentan las mayores concentraciones de cada partícula contaminante y se compara estas concentraciones con los valores ya predeterminados por la OMS.
3.2.3. Análisis de regresión lineal Para este proceso se creó una capa insumo de información, con lo cual se estableció el modelo de regresión lineal, compilando los datos por barrio de cada partícula contaminante, obteniendo un valor promedio por cada barrio, siendo cada partícula contaminante una variable independiente. Del mismo modo, se promedian los datos climatológicos y sociales codificados, como edad, género (seleccionando el género mayoritario de casos por barrio) y por último el número de casos de IRA como la variable dependiente a explicar. De manera adicional se normalizaron los datos de cada variable mediante el método Z-Score, para evitar o reducir sesgos en el modelo, asignando nuevos valores a cada variable por barrio.
3.2.3.1. Análisis de Mínimos Cuadrados Ordinarios – OLS Antes de que se aplicara el geoproceso de regresión, se realizó una exploración de regresión usando el software ArcGIS 10.5.1, usando la capa de insumo, con la cual se realizaron varias combinaciones hipotéticas de las variables y su desempeño en el modelo. A partir de este análisis se seleccionaron las variables explicativas definitivas del modelo, se consideró la información de cada variable y se generó un reporte de los modelos que cumplen las condiciones óptimas, así como un diagnóstico de cada variable, su influencia en el modelo y en qué porcentaje puede explicar la cantidad de casos de IRA en Cali. Después de realizar este procedimiento, se seleccionaron en la capa de insumo las variables que realmente tendrán buen rendimiento en el modelo, se aplicó el geoproceso de Análisis Ing. Ricardo Rodriguez Otero
34
de Mínimos Cuadrados Ordinarios – OLS que equivale al análisis de regresión lineal de forma global, permitiendo determinar los valores constantes de la ecuación de la regresión lineal. La regresión lineal global o Mínimos Cuadrados Ordinarios – OLS se generó a partir de 7 variables explicativas; este método permitió identificar la probabilidad de la correlación entre partículas contaminantes y casos de IRA en Cali. Para su aplicación se usó el software ArcGIS 10.5.1. La variable dependiente del modelo se tomó como, la cantidad de casos de IRA en los barrios de Cali. Como variables explicativas se aplicaron los valores de media por barrio de las 5 partículas contaminantes analizadas en este documento (PM10, PM2.5, NO2, SO2 y O3). Adicionalmente se valoraron las variables de la edad promedio de los afectados por barrio y la moda o valor más frecuente en la codificación por género, en cada barrio y los datos climatológicos de Cali, para poder identificar socialmente cuales son los tipos de pacientes más afectados por IRA.
3.2.3.2. Regresión Ponderada Geográficamente (GWR) Después de aplicar el geoproceso OLS se calculó el modelo de Regresión Ponderada Geográficamente (GWR), que indica cuáles son los barrios más propensos a presentar IRA. Al igual que el modelo de regresión lineal global, se usaron únicamente las variables con buen rendimiento y que aportaran la misma información que las demás. Para este modelo complementario también se usó el software ArcGIS 10.5.1. Con los resultados de ambos modelos se generaron 2 mapas. El análisis de cada uno se encuentra, en la sección de resultados de este documento.
Ing. Ricardo Rodriguez Otero
35
4. RESULTADOS En esta sección se presentan los resultados obtenidos para esta tesis, los cuales se presentan por los procesos o análisis principales realizados y mencionados en la metodología. Para obtener estos resultados se crearon superficies de distribuciones espaciales de las partículas contaminantes y datos climáticos con información de las estaciones de monitoreo ambiental y climatológicas de Cali. Por último, se crearon modelos de regresión espacial para determinar la relación de la contaminación atmosférica e IRA, identificando las áreas o barrios más afectados.
4.1.
ANÁLISIS ESPACIAL DE INFECCIONES RESPIRATORIAS AGUDAS (2010-2016)
El análisis de los datos de IRA se realizó de forma separada de los datos ambientales, dado que los datos ambientales presentan varios vacíos en tiempo y en partículas contaminantes. Se usaron el Índice global de Moran y el promedio de los vecinos más cercanos. Como se puede ver en la Ilustración 4, el resultado del promedio de los vecinos más cercanos muestra que los datos presentan baja aleatoriedad y que están agrupados en clústeres.
Ilustración 4. Resultado del análisis del promedio de vecinos más cercanos.
Ing. Ricardo Rodriguez Otero
36
Los parámetros usados para el cálculo se pueden ver la Ilustración 5, el área usada es de 120,850,736.3 m2
Ilustración 5. Paramentos del promedio de los vecinos más cercanos.
En la Ilustración 6 se puede ver el resultado del Índice global de Moran.
Ilustración 6. Resultado índice global de Moran.
Ing. Ricardo Rodriguez Otero
37
Dado el puntaje z de 6.178, hay una probabilidad de menos del 1% de que este patrón agrupado pueda ser el resultado de una probabilidad aleatoria como se muestra en la Tabla 6. Tabla 6. Resultado índice global de Moran.
Global Moran's I Summary Moran's Index: 0.077310 Expected Index: -0.000502 Variance: 0.000159 z-score: 6.177901 p-value: 0.000000 Al tener como unidad mínima a los barrios de Cali como una forma de representación de los datos de IRA, se usaron las herramientas del software ArcGIS, el índice global de Moran y el método “Average Nearest Neighbor” o el promedio de los vecinos más cercanos, con los cuales se buscó identificar si la información de IRA presentaba patrones de agrupamiento o clústeres o si esta información era dispersa o aleatoria. El resultado del promedio de los vecinos más cercanos es igual al obtenido con Índice de Moran Global, ya que al tener un resultado menor a 1 los datos presentan patrones de agrupamiento, como se muestra en la Ilustración 4, en la Ilustración 5, en la Ilustración 6 y en la Tabla 6. En el caso contrario, cuando el resultado es mayor a 1 los datos no son significativos o son dispersos y aleatorios; en otras palabras, en ambos procesos se puede apreciar que los datos de IRA si presentan clústeres.
4.1.1. Análisis de puntos calientes y fríos en infecciones respiratorias agudas (2010-2015), usando el índice local “Getis-Ord Gi*”. Para validar la posibilidad de la conformación de patrones de agrupamiento o clústeres, se realizó un análisis de puntos calientes y fríos aplicando el índice local “Getis Ord Gi*” del software ArcGIS 10.5.1., con el cual se identificaron los barrios que conforman clústeres de valores altos de casos de IRA, los cuales serían los puntos calientes representados de color rojo en el Mapa 4. Los puntos fríos son barrios con un número bajo de casos de personas afectadas por IRA y son representados con color azul. En relación con lo anterior en la Tabla
Ing. Ricardo Rodriguez Otero
38
21, encontrara más información sobre los puntos fríos, pero esta tabla por su tamaño está en
la sección de anexos Todos los datos son representados según el nivel de confianza del cálculo, donde inciden los datos desde el 90% al 99%. Los de color blanco o transparente no son datos significativos para el cálculo del índice, esto no significa que no haya presencia de casos de IRA, son solo clústeres de casos promedio en comparación a los puntos calientes o fríos resaltados por el índice. En otras palabras, los colores claros representan los clústeres con niveles de confianza del 90% al 95% y los colores totalmente sólidos (ya sea en los puntos calientes o en los fríos) representan el nivel de confianza de 99%. La Tabla 7 contiene 6 campos de los cuales 3 campos corresponden al resultado del índice Gi* que son los valores z o Z-score (GiZscore), los valores p (GiPValue) y el nivel de importancia de los puntos calientes y fríos. Tabla 7. Puntos Calientes de IRA Índice GETIS ORD GI*.
Barrio Vista Hermosa Sector Patio Bonito Santa Mónica Versalles El Piloto Urbanización Calimico San Luis Urbanización El Ángel del Hogar Puerto Mallarino Siete de Agosto Puerto Nuevo Alfonso López III Las Orquídeas Puerta del Sol Cañaveral Ciudad Talanga El Remanso Calimico Desepaz Potrero Grande Parcelaciones Pance
Ing. Ricardo Rodriguez Otero
comuna 01 01 02 02 03 06 06 07
Cod_Event 5 5 3 3 5 4 3 5
GiZScore 5.24607782 5.24607782 4.06164272 5.62014042 3.8513095 2.6793844 2.70909663 2.79393525
GiPValue 1.55371E-07 1.55371E-07 4.87286E-05 1.90802E-08 0.000117488 0.007375767 0.006746669 0.00520709
Gi_Bin 3 3 3 3 3 1 1 2
07 07 07 07 14 14 19 21 21 21 21 22
3 3 4 3 3 2 5 3 3 3 3 4
3.10462895 2.96004353 3.9984333 3.69247063 2.67525049 2.54218116 2.84565832 2.69410617 2.8670777 2.80822958 3.73317393 5.88118847
0.001905179 0.003075956 6.37631E-05 0.000222086 0.007467343 0.011016306 0.004431972 0.007057768 0.004142813 0.00498147 0.000189082 4.07331E-09
2 2 3 3 1 1 2 1 2 2 3 3
39
Mapa 4. Análisis de puntos Calientes y fríos en infecciones Respiratorias Agudas (2010-2015), Usando el índice local “Getis-ord Gi*”.
Ing. Ricardo Rodriguez Otero
40
Como se muestra en los resultados obtenidos en el Mapa 4, los clústeres de valores bajos o puntos fríos se concentran en los barrios de las comunas 3, 4, 7, 8, 9, 10, 11, 12 y 19. Se puede encontrar que la comuna 8 es la que más concentración o agrupación de clústeres presenta, corresponde a la zona norte y céntrica de Cali, y que se puede corroborar en la Tabla 21, que por su tamaño está en la sección de anexos. Los clústeres de valores altos o puntos calientes se concentran en los barrios de las comunas 1, 2, 3, 6, 7, 14, 19, 21 y 22. La comuna 21 es la que tiene la mayor cantidad de clústeres o barrios afectados y corresponden a zonas periféricas de la ciudad, como se puede evidenciar en la Tabla 7.
4.1.2. Análisis de clústeres y datos anómalos de infecciones respiratorias agudas (2010-2015), usando el índice “Local Moran’s Anselin”. Al identificar las áreas con puntos calientes y fríos, se analizaron los agrupamientos o clústeres y datos anómalos que se presentan en las tipologías de IRA en Cali. Para esto se aplicó el índice “Local Moran’s Anselin” A través del software ArcGIS 10.5.1., con el cual gráficamente se obtuvieron 4 atributos al analizar únicamente la variable de infecciones y la frecuencia de estas. Los resultados se presentan en el ¡Error! No se encuentra el origen de la referencia.. Los datos no significativos se representan sin color alguno. Los clústeres con valores altos (polígonos color rojo) son los agrupamientos de valores elevados de IRA, los cuales para más detalle se muestran en la Tabla 23, dada su extensión la puede ver en la sección de anexos. Los valores aislados o anómalos Alto-Bajos son los polígonos que al tener valores altos son vecinos de polígonos con valores bajos (polígonos de color amarillo). De forma opuesta están los polígonos de los valores aislados o anómalos Bajos-Altos, que son los polígonos con valores bajos, pero con vecinos con valores elevados (polígonos de color naranja). Por último, están los clústeres de valores bajos (polígonos de color verde), los cuales son los clústeres de valores bajos, como puede pasar con los barrios de valores no significativos y que pueden en algunos casos datos aleatorios o no tener datos. Lo anterior se muestra con más detalle en la Tabla 22, esta tabla por su tamaño está en la sección de anexos.
Ing. Ricardo Rodriguez Otero
41
En la Tabla 8 se presentan los datos anómalos de IRA alto-bajos según el Índice local de Moran. Tabla 8. Datos anómalos alto-bajo de IRA Índice local Moran.
Barrio Porvenir Los Andes B - La Riviera
comuna 04 05
Cod_Event 3 3
LMiIndex -5.2944E-05 -0.00012631
LMiZScore -2.08647569 -0.04559026
LMiPValue 0.03 0.048
COType HL HL
Base Aérea San Marino Parque de la Caña
07 07 07
5 4 5
-0.13655109 -0.03317144 -0.28191003
-4.77455779 -1.80148567 -7.75939923
0.002 0.042 0.002
HL HL HL
Simón Bolívar
08
3
-0.00016538
-4.79615343
0.002
HL
Aranjuez San Cristóbal
09 10
3 5
-0.00017389 -0.1983754
-4.78265192 -4.45359833
0.002 0.002
HL HL
El Prado Alfonso Barberena A.
11 12
5 3
-0.16365892 -0.0001077
-3.32263909 -2.61081842
0.002 0.006
HL HL
El Paraíso Eduardo Santos
12 12
5 3
-0.18356366 -7.7749E-05
-3.01917179 -1.90967019
0.002 0.032
HL HL
El Gran Limonar Cataya
17
4
-0.07797301
-3.54891262
0.002
HL
3 de Julio Urbanización Nueva Granada
19 19
3 3
-0.00011198 -0.00011383
-3.01570532 -0.09208701
0.006 0.05
HL HL
Ing. Ricardo Rodriguez Otero
42
Mapa 5. Análisis de clústeres y datos anómalos de Infecciones Respiratorias Agudas (2010-2015), usando el índice “Local Moran’s Anselin”.
Como se muestra en el ¡Error! No se encuentra el origen de la referencia. los barrios con datos anómalos son únicamente de las anomalías de valores Altos-Bajos (no se presentaron Ing. Ricardo Rodriguez Otero
43
anomalías con valores Bajos-Altos), solo se presentaron 15 barrios con este tipo de anomalía. Estos barrios están ubicados en las comunas 4, 5, 7, 8, 9, 10, 11, 12, 17, y 19. Se destaca la comuna 7 porque agrupa tres barrios con mortandad infantil causada por IRA (código 4) e IRA no especificada (código 5). Así mismo, se destaca por igual cantidad de barrios la comuna 12. En esta última comuna los barrios presentan principalmente IRA por influenza (código 3) e IRA no especificada (código 5). A su vez, ambas comunas son las que mayor número de anomalías presentan, como se puede validar con la Tabla 8. Los clústeres con valores bajos están agrupados en los barrios de las comunas 2, 3, 4, 5, 6, 8, 9, 10, 11, 12, 13, 14, 15, 17, 18 y 19. En 4 barrios de la comuna 8 se diagnosticaron IRA grave (código 1) e IRA inusitada (código 2). De igual manera se diagnosticaron los mismos tipos de infección en las comunas 2, 11 y 18 con 3 barrios cada una. Lo anterior se puede validar en la Tabla 22, que por su tamaño está en la sección de anexos. Los clústeres de valores altos están agrupados en las comunas 1, 2, 3, 4, 5, 6, 7, 11, 13, 14, 17, 18, 19, 21 y 22, donde en la comuna 7 se presentan 6 barrios con IRA por influenza (código 3), mortandad infantil causada por IRA (código 4) e IRA no especificada (código 5). Le siguen las comunas 2, 3 y 6 con 5 barrios cada una. Lo anterior se puede validar en la Tabla 23, que por su tamaño está en la sección de anexos. Al comparar el ¡Error! No se encuentra el origen de la referencia. y el Mapa 4 se encuentra que en la periferia de Cali es donde se presentan la mayor cantidad de casos.
4.1.3. Análisis de clústeres y datos anómalos de infecciones respiratorias agudas (2010-2015) según la edad de los afectados usando el índice “Local Moran’s I Anselin” Para complementar el análisis de IRA de Cali se aplicó el índice “Local Moran’s I Anselin” al atributo de edades registradas de los pacientes atendidos de 2010 a 2015. Al igual que el ¡Error! No se encuentra el origen de la referencia., el Mapa 6 contiene 5 tipos de simbología o de atributos que son la representación de los polígonos no representativos, los clústeres con valores altos y bajos y los polígonos que presentan anomalías con valores AltoBajos y Bajos-Altos. Se mantuvieron, los mismos colores que los descritos para el ¡Error! No se encuentra el origen de la referencia., pero en este caso en el Mapa 6 sí se representan los 5 tipos de polígonos y se tiene una gran diferencia con los mapas anteriores, dado que los clústeres ya no están tan centralizados, sino que están distribuidos en varias áreas de la Ing. Ricardo Rodriguez Otero
44
ciudad. En la Tabla 24 se muestran con más detalle los barrios con clústeres con valores altos y en la Tabla 25 se muestra lo contrario los barrios que son clústeres de valores bajos, ambas tablas por su extensión las encontrara en la sección de anexos. En la Tabla 9 y en la Tabla 10 en la se presentan los barrios con datos anómalos de IRA según la edad de los afectados, según el Índice local de Moran. Tabla 9. Barrios con Anomalías “Bajo-Altos” de IRA por las edades de afectados, Índice local Moran.
Barrio Granada Sector Altos de Normandia - Bataclán Paso del Comercio Urbanización El Angel del Hogar Pasoancho Julio Rincón Lleras Restrepo II Los Robles Ciudad Universitaria Ciudadela Pasoancho La Playa Unicentro Cali Cuarteles de Nápoles Horizontes Sector Meléndez El Mortiñal Sector Bosque Municipal Urbanización Militar Planta de Tratamiento Ciudad Campestre
Comuna 2 2 6 7 10 12 13 13 17 17 17 17 18 18 18 19 19 19 21 22
Edad 0 0 4 0 1 24 0 19 1 20 0 6 0 0 0 0 0 0 0 0
LMiIndex -0.025674957 -0.025674957 -0.053317153 -0.068530508 -0.064007688 -0.003453688 -0.078575754 -0.020311611 -0.116416645 -0.017216292 -0.026681865 -0.035731849 -0.027230965 -0.040088305 -0.02818985 -0.032115738 -0.062620466 -0.038267803 -0.036379293 -0.130602384
LMiZScore LMiPValue COType -2.492661417 0.008 LH -2.492661417 0.008 LH -5.776918751 0.002 LH -5.116758524 0.002 LH -4.670772569 0.002 LH -1.936820531 0.03 LH -3.473552443 0.004 LH -4.322381696 0.002 LH -13.38467351 0.002 LH -5.191585024 0.002 LH -1.999207406 0.028 LH -3.987300619 0.002 LH -2.030405842 0.018 LH -2.524181277 0.008 LH -2.002178956 0.026 LH -2.018865245 0.02 LH -5.13611264 0.002 LH -2.578992752 0.006 LH -3.33927519 0.002 LH -13.10601833 0.002 LH
Tabla 10. Barrios con Anomalías “Altos-Bajos” de IRA por las edades de afectados, Índice local Moran.
Barrio Alfonso Lopez II Aranjuez San Benito Alfonso Barberena A.
Comuna
Ing. Ricardo Rodriguez Otero
7 9 11 12
Edad 35 53 29 36
LMiIndex -0.005126499 -0.05165119 -0.005775963 -0.013380481
LMiZScore LMiPValue COType -1.694083585 0.05 HL -3.255043014 0.002 HL -3.611032224 0.002 HL -2.516934994 0.008 HL
45
Mapa 6. Análisis de Clústeres y datos anómalos de Infecciones Respiratorias Agudas (2010-2015) según la edad de los afectados usando el índice “Local Moran’s I Anselin”.
Ing. Ricardo Rodriguez Otero
46
Como se muestra en el Mapa 6, los clústeres con valores bajos se dispersan por casi toda la ciudad en los barrios de las comunas 1, 2, 3, 4, 5, 6, 7, 9, 10, 11, 12, 13, 14, 15, 17, 18, 19, 20, 21 y 22. Se puede identificar que las comunas con más casos por edad son la 11, 16, 17, 18, 19, 20 y 21. Estos clústeres están determinados desde los 0 hasta los 11 años en su mayoría, aunque hay pocos casos desde los 13 a los 21 años. Lo anterior se puede validar en la Tabla 24, que por su tamaño se encuentra en la sección de anexos. Se debe tener qué en cuenta en las tablas se muestra la información según el tipo de clúster y se mostrará un valor de edad o característica principal que genera el clúster. Al igual que los clústeres de valores bajos, los clústeres de valores altos tampoco tienen una zona muy definida o concentrada en Cali y también están distribuidos de manera dispersa. Los barrios con valores altos de edades están ubicados en las comunas 2, 3, 4, 5, 6, 7, 8, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 21 y 22. Se puede encontrar que la comuna 2 presenta 9 casos, siendo la que presenta mayor número de casos, seguida de las comunas 19, 17 y 13 con 5 casos. Sólo se presentan 3 casos de personas de 27 a 38 años; los demás casos en su mayoría están en el rango de 40 años hasta los 92 años. Lo anterior se puede validar en la Tabla 25, que por su tamaño la puede encontrar en la sección de anexos. Los barrios con valores anómalos o aislados con valores bajos y con vecindad de valores altos están distribuidos en las comunas 2, 6, 7, 10, 12, 13, 17, 18, 19, 21 y 22. La mayor cantidad de casos se presentan en las comunas 17, 18 y 19 con 3 casos anómalos en cada una y la edad más afectada es la de niños de 0 años. Lo anterior se puede evidenciar en la Tabla 9. Por lo cual en la periferia se presentan casos por IRA en niños menos de 4 años, que es una población muy vulnerable ya que esta enfermedad puede ser mortal para esta población. Lo anterior se puede validar en la Tabla 9. Los barrios con valores anómalos o aislados con valores altos y con vecindad de valores bajos son únicamente 4 barrios ubicados en las comunas 7, 9, 11 y 12, un barrio por comuna con un rango de edades de afectados desde los 29 hasta los 53 años. Lo anterior se puede validar en la Tabla 10.
Ing. Ricardo Rodriguez Otero
47
4.1.4. Análisis de clústeres y datos anómalos de infecciones respiratorias agudas (2010-2015) según el género de los afectados, usando el índice “Local Moran’s I Anselin” Tal como se muestra en el ¡Error! No se encuentra el origen de la referencia., la variable de género o sexo de los afectados por IRA se analizó a través de 3 valores: femenino (código 1), masculino (código 2) y sin información (Código 0). Al igual que en los anteriores mapas se aplicó el índice “Local Moran’s I Anselin”, y se trabajó con la misma simbología de 5 tipos de polígonos, sin embargo, se presentan diferencias a los mapas anteriores, ya que son pocos los barrios no significativos, y la mayoría de los clústeres son concentraciones de valores bajos es decir la mayoría de las personas afectadas son mujeres. En la Tabla 26 se muestran con más detalle los barrios con clústeres con valores altos y en la Tabla 27 se muestra lo contrario los barrios que son clústeres de valores bajos, ambas tablas por su extensión las encontrara en la sección de anexos. En la Tabla 11 y en la Tabla 12 se presentan los barrios con datos anómalos de IRA según el género de los afectados, según el Índice local de Moran. Tabla 11. Barrios con anomalías “Altos-Bajos” de IRA según el género de afectados, Índice local Moran.
Barrio Ciudad de Los Alamos Flora Industrial Evaristo Garcia Flora Industrial Sector Asprosocial – Diamante Unicentro Cali Ciudad Universitaria 3 de Julio El Remanso Club Campestre
Ing. Ricardo Rodriguez Otero
Comuna Cod_Sexo 2 2 4 2 4 2 4 2 13 2 17 2 17 2 19 2 21 2 22 2
LMiIndex -0.044781174 -0.044781174 -0.032828558 -0.044781174 -0.059992407 -0.047674062 -0.051045031 -0.056894556 -0.028569101 -0.07854899
LMiZScore LMiPValue COType -3.572314287 0.002 HL -3.572314287 0.002 HL -2.451237022 0.016 HL -3.572314287 0.002 HL -2.9806493 0.004 HL -3.643151825 0.002 HL -5.394096368 0.002 HL -3.530055615 0.004 HL -1.69175574 0.04 HL -8.023714954 0.002 HL
48
Tabla 12. Barrios con anomalías “Bajos-Altos” de IRA según el género de afectados, Índice local Moran.
Barrio Área en Desarrollo - Parque del Amor Urbanización La Flora El Bosque Navarro - La Chanca Ignacio Rengifo Bolivariano Unidad Residencial Bueno Madrid La Rivera I Los Pinos Brisas del Limonar La Alborada Prados del Limonar Sector Bosque Municipal El Mortiñal Unidad Residencial El Coliseo U. D. A. Galindo Plaza de Toros Belisario Caicedo
Ing. Ricardo Rodriguez Otero
Comuna 2 2 2 3 4 4 4 6 7 16 16 17 19 19 19 19 20
Cod_Sexo 1 0 1 0 1 1 1 1 1 1 0 1 0 0 0 0 0
LMiIndex
LMiZScore
-0.034424348 -0.103446456 -0.043957554 -0.107470817 -0.045152615 -0.019140483 -0.014938361 -0.01476677 -0.012900694 -0.07635112 -0.299256628 -0.016475298 -0.190344142 -0.130769325 -0.54467251 -0.454400094 -0.608523938
-6.507841916 -4.818623662 -6.410847216 -1.897145835 -3.461954794 -1.87177307 -1.695206846 -1.806283978 -1.726216964 -6.698813545 -7.750489978 -1.90240724 -6.401240491 -3.619135165 -12.92937676 -11.26803397 -12.42197666
LMiPValue 0.002 0.002 0.002 0.034 0.002 0.026 0.044 0.042 0.04 0.002 0.002 0.022 0.002 0.002 0.002 0.002 0.002
COType LH LH LH LH LH LH LH LH LH LH LH LH LH LH LH LH LH
49
Mapa 7. Análisis de Clústeres y datos anómalos de Infecciones Respiratorias Agudas (2010-2015) según el género de los afectados, usando el índice “Local Moran’s I Anselin”.
Ing. Ricardo Rodriguez Otero
50
Como se muestra en el ¡Error! No se encuentra el origen de la referencia., los clústeres de valores altos se presentan en barrios dispersos y en casi todas las comunas, con excepción de la comuna 22 donde no hay barrios con clústeres con valores altos. Las comunas con mayor cantidad de casos son las comunas 2 con 14 casos, la 11 con 6 casos y la 3 con 5 casos. Es de considerar que estos clústeres únicamente se asociaron al género masculino principalmente por la codificación dada que, al ser de un valor mayor, puede sesgar los resultados del análisis, pero geográficamente la distribución de clústeres no es aleatoria, por lo que el resultado continúa siendo válido. Lo anterior se puede corroborar en la Tabla 26, que por su tamaño está ubicada en la sección de anexos. Los clústeres de valores bajos están distribuidos en la mayoría de las comunas de Cali a excepción de la comuna 20. La mayoría de las comunas presentan un rango de 7 a 15 casos de IRA, pero en el género femenino y unos 19 casos en barrios sin identificación. De igual manera este resultado se considera válido, a pesar de que se presenta un sesgo según el valor del código asignado, la distribución espacial de los clústeres no es aleatoria. Adicionalmente se evidencia que el género femenino es el más afectado por IRA, independiente de la causa de la infección. Esto se puede validar con la Tabla 27, que por su tamaño está en la sección de anexos. Los barrios con valores anómalos Altos-Bajos se presentan en las comunas 2, 4, 13, 17, 19, 21 y 23. La comuna 4 es la que más casos presenta con un total de 3. Estas anomalías solamente aplican al género masculino, al ser valores altos en comparación a los demás clústeres, pero aun así este tipo de anomalías tiene una distribución espacial no aleatoria. Lo anterior se puede validar en la Tabla 11. Los barrios con valores anómalos Bajos-Altos se presentan las comunas 2, 3, 4, 6, 7, 16, 17, 19 y 20. La comuna 19, con un total de 4 casos, es la que presenta más casos. De igual manera de las anteriores anomalías, éstas pueden tener un sesgo por sus valores. En este caso, las anomalías incluyen al género femenino y unos pocos casos sin información. Lo anterior se puede validar con la Tabla 12.
Ing. Ricardo Rodriguez Otero
51
4.1.5. Análisis de clústeres y datos anómalos de infecciones respiratorias agudas (2010-2015), por año, usando el índice “Local Moran’s Anselin” La información empleada para los análisis e identificación de clústeres de IRA en Cali también incluía datos temporales. Para el análisis se usó únicamente el año de cada registro como se muestra en el Mapa 8. A diferencia de los anteriores mapas, este no cuenta con codificación ya que los valores numéricos evaluados son los años en el rango de 2010 al 2015 y el valor 0 en pocos casos donde no se agregó esta información desde la fuente, pero aun así se continúa trabajando con la misma simbología de 5 tipos de polígonos, pero se presentan diferencias con respecto a los mapas anteriores, donde la mayoría de clústeres identificados son de valores altos lo que significaría una alta concentración de casos en los barrios señalados en año 2015 y este mapa en comparación a los anteriores tiene pocos clústeres identificados. La Tabla 13 presenta los barrios con clústeres “Bajos” de IRA según el año en el que se presentó la información. En la Tabla 28 se presentan los barrios con clústeres “Altos” según el año, pero esta tabla por su extensión la encontrara en la sección de anexos. Tabla 13. Barrios con clústeres “Bajos” de IRA según el año en el que se presentó la infección, Índice local Moran.
Barrio Vista Hermosa Sector Patio Bonito El Piloto Industria de Licores Fátima Jorge Isaacs La Playa Sector Meléndez Sector Cañaveralejo Guadalupe Cañaveral Los Lideres Los Lideres Los Lideres Los Lideres Los Lideres
Comuna 1 1 3 4 4 4 17 18 19 19 21 21 21 21 21
Año 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0
LMiIndex LMiZScore LMiPValue COType 0.03070148 8.38358352 0.016 LL 0.03070148 5.88579957 0.03 LL 0.14224082 2.65373391 0.018 LL 0.31095291 5.23529359 0.004 LL 0.26512513 3.23387533 0.008 LL 0.16474996 3.07412144 0.004 LL 0.14774849 1.80242233 0.05 LL 0.18724309 2.39326097 0.024 LL 0.21374403 4.25603326 0.002 LL 0.17127677 3.83822094 0.004 LL 172.920794 16.846262 0.002 LL 172.920794 13.9030112 0.002 LL 172.920794 12.9009534 0.002 LL 172.920794 13.5984135 0.002 LL 172.920794 13.4602082 0.002 LL
En la Tabla 14 y en la Tabla 15 en la se presentan los barrios con datos anómalos de IRA según el año en el que se presentó la información, según el Índice local de Moran.
Ing. Ricardo Rodriguez Otero
52
Tabla 14. Barrios con anomalías “Bajo-Altos” de IRA según el año en el que se presentó la infección, Índice local Moran.
Barrio Urbanización La Flora Sector Altos de Normandia - Bataclán Granada Marco Fidel Suárez Chiminangos II Lleras Restrepo II
Comuna 2 2 2 4 5 13
Año 0 0 0 0 0 0
LMiIndex -0.069416851 -0.06516617 -0.06516617 -0.124578451 -0.130280142 -0.194623498
LMiZScore -1.280469311 -1.141907242 -1.141907242 -1.378697422 -1.34577344 -1.403175835
LMiPValue 0.002 0.002 0.002 0.002 0.002 0.042
COType LH LH LH LH LH LH
Tabla 15. Barrios con anomalías “Altos-Bajos” de IRA según el año en el que se presentó la infección, Índice local Moran.
Barrio Unidad Residencial Bueno Madrid Santander Porvenir El Remanso Unicentro Cali Club Campestre
Ing. Ricardo Rodriguez Otero
Comuna 4 4 4 21 17 22
Año 2010 2011 2010 2010 2015 2015
LMiIndex -0.003712819 -0.006527348 -0.005556609 -0.023590421 -0.005380037 -0.005285649
LMiZScore LMiPValue COType -2.181351293 0.036 HL -3.956573929 0.002 HL -4.098513886 0.004 HL -10.43344905 0.002 HL -3.053895355 0.006 HL -3.579667924 0.004 HL
53
Mapa 8. Análisis de Clústeres y datos anómalos de Infecciones Respirarías Agudas (2010-2015), por año, usando el índice “Local Moran’s Anselin”.
Ing. Ricardo Rodriguez Otero
54
Como se muestra en el Mapa 8 los barrios con clústeres de valores altos están distribuidos en su mayoría en los barrios periféricos de la ciudad de Cali. Éstos se encuentran distribuidos en casi todas las comunas, menos en la 1, 8, 10, 12, 16 y 21. La comuna con mayor cantidad de casos es la 2 con 10 casos, seguida de la comuna 6 con 6 casos. El 2011 es el año con más casos o el que presenta mayor agrupamiento. Lo anterior se puede validar en la Tabla 28, que por su tamaño está en la sección de anexos. Los barrios con clústeres de valores bajos están presentes en las comunas 1, 3, 4, 17, 18, 19 y 21. La comuna 21 es la que presenta más casos con un total de 5, pero todos los casos son de valores 0 o sin el dato de año, por lo cual se consideraron más como una anomalía dado que son un sesgo por su valor y no son datos mayoritarios. Esto se puede validar en la Tabla 13. Los barrios con datos anómalos o aislados Bajos-Altos están distribuidos en las comunas 2, 4, 5 y 13. La mayoría de los casos o de barrios están en la comuna 2 con 3 en total. Estas anomalías son representadas por los valores cero o en otras palabras los registros sin años. Esto se da principalmente por el valor del campo contra los clústeres de valores altos o con algún registro de año. Lo anterior puede ser validado en la Tabla 14. Los barrios con datos anómalos o aislados Altos-Bajos están distribuidos en las siguientes comunas 4, 17, 21 y 22. La comuna 4 presenta mayor cantidad de casos o clústeres con 3 en total, siendo el 2010 uno de los años con más anomalías con respecto a los otros años. Lo anterior puede ser validado en la Tabla 15.
4.2.
ANÁLISIS DE CONCENTRACIONES DE PARTÍCULAS CONTAMINANTES EN CALI.
En el análisis de concentraciones de partículas contaminantes, los resultados se presentan de la siguiente manera: por cada partícula analizada se muestra una serie de tiempo por estación de monitoreo. De esta manera se presenta un mapa de la interpolación de Kriging de cada una de las siguientes partículas contaminantes, Dióxido de Azufre (SO2), Ozono (O3), Dióxido de Nitrógeno (NO2), Material Particulado 2.5 μm (PM2.5) y Material Particulado 10 μm (PM10).
Ing. Ricardo Rodriguez Otero
55
4.2.1. Dióxido de Azufre (SO2) Las concentraciones de dióxido de azufre en Cali se calcularon a partir de los datos de las estaciones Base Aérea, Cañaveralejo, ERA, Flora y La Ermita. A diferencia de otras partículas contaminantes, el dióxido de azufre no tiene un límite mensual o anual determinado por la OMS, únicamente límites de exposición a corto plazo. Estos umbrales o límites óptimos son de 20 μg/m3 en una media de 24 horas y 500 μg/m3 en una media de 10 minutos de exposición (OMS, 2005). A continuación, en la Ilustración 7, se presentan las series de tiempo de las concentraciones de dióxido de azufre en cada una de las estaciones y un mapa con la concentración anual de dióxido de azufre en Cali. En la estación Base Aérea se colectaron datos de dióxido de azufre desde mayo del 2013 hasta diciembre del 2016. Entre septiembre de 2015 y enero del 2016, se presenta un pico de casi 30 μg/m3 el cual puede ser un valor atípico, esta partícula tiene una tendencia a no superar las 10 μg/m3. En la estación Cañaveralejo se colectaron datos de dióxido de azufre desde abril de 2015 hasta diciembre de 2016. Los datos más elevados llegan a 5 μg/m3 con una tendencia a bajar a valores cercanos a 1 μg/m3. Esta es la estación con los datos más bajos de concentración de dióxido de azufre en la ciudad. En la estación ERA se tiene información de dióxido de azufre, desde enero de 2010 hasta marzo de 2012. Desde esta fecha esta estación dejó de colectar datos de esta partícula. No se observa una tendencia de disminución o aumento de valor en los datos, ya que se presentan variaciones en los valores que no son ni estacionarias ni cíclicas. El valor mínimo es de 6 μg/m 3 y el valor máximo de 17.50 μg/m3. En la estación Ermita se colectaron datos de dióxido de azufre desde marzo del 2014 hasta diciembre del 2016. A pesar de un incremento en los valores de los datos desde el mes noviembre de 2014 hasta febrero de 2015 con un valor 18 μg/m3, la serie tiende a mantenerse con valores menores a las 10 μg/m3. En la estación Flora, se recolectó información de dióxido de azufre, desde junio de 2010 hasta marzo de 2012, la serie tiene una tendencia de mantener valores entre 20 a 25 μg/m3.
Ing. Ricardo Rodriguez Otero
56
Ilustración 7. Serie de tiempo de la concentración de SO2 por estaciones.
Como se observa en el Mapa 9, las concentraciones anuales de dióxido de azufre en Cali, se obtienen a partir de la interpolación de 13 valores promedio de dióxido de azufre con un valor mínimo de 3.2174 μg/m3, un máximo de 20.9046 μg/m3, una media de 8.4485 μg/m3 y una desviación estándar de 5.0566. Como se mencionó en la sección 3.2.2.2 se usó el método Kriging Ordinario, un resultado de esta interpolación es el semivariograma de modelo como se muestra en la Ilustración 8, de igual forma se obtuvieron 4 gráficos adicionales que corresponden a los valores de precisión, el error general, el error estandarizado y el QQplot del modelo geoestadístico como se muestran en la Ilustración 9, Ilustración 10, Ilustración 11 y en la Ilustración 12.
Ing. Ricardo Rodriguez Otero
57
Ilustración 8. Semivariograma de interpolación Kriging Ordinario de SO2.
Ilustración 9. Predicción del modelo para SO2.
Ilustración 11. Error Estandarizado del modelo para SO2.
Ing. Ricardo Rodriguez Otero
Ilustración 10. Error general del modelo para SO2.
Ilustración 12.QQplot del modelo para SO2.
58
Mapa 9. Concentraciรณn de diรณxido de azufre, SO2.
Ing. Ricardo Rodriguez Otero
59
Como se observa en el Mapa 9, las concentraciones anuales de dióxido de azufre en Cali, se presentan en mayor medida en los barrios de las comunas 2, 3, 4, 5, 6 y 9, siendo el occidente la zona donde se presenta menor concentración de dióxido de azufre, más específicamente en los barrios de las comunas 10, 17, 18, 19 y 20. Al no existir un valor o nivel de referencia óptimo para una media anual de estos valores, no es posible indicar qué tan nocivos o no son los valores presentados en el Mapa 9. Como ya se había mencionado en la sección 3.2.1.2, las partículas contaminantes se miden por separado, pero éstas naturalmente se encuentran combinadas con otras partículas en el aire y estas combinaciones son las que presentan efectos nocivos. La Ilustración 8 muestra el semivariograma de la interpolación del Mapa 9, donde se evidencia la correlación de los datos en términos de distancia, en otras palabras la curva en la gráfica representa la correlación, entre menor la distancia entre los puntos de la gráfica, mayor correlación entre ellos, lo cual indica un comportamiento de clúster en los datos hasta que esta correlación disminuye, cada vez que la distancia entre las mediciones se hace más amplia, lo cual muestra que ese dato tiene un valor aleatorio, cuando la curva se estabiliza o alcanza su rango fijo. Como se puede ver en la ilustración la correlación de los datos es alta, dado que se los datos en poca distancia se nivela la varianza de la interpolación, pero como se muestra en la Ilustración 9, Ilustración 10 y la Ilustración 11, la interpolación presenta un error valor bajo en varias estaciones y las mismas están cercanas a la función de interpolación resultante. La ubicación de las 5 estaciones y el QQplot de la interpolación se pueden ver en la Ilustración 12, en la cual se compara los datos obtenidos con una distribución normal. Los datos presentan un comportamiento en la distribución normal, pero al ser pocas estaciones el valor no es tan cercano a la recta resultante.
4.2.2. Ozono (O3) Las concentraciones de ozono en Cali se calculan a partir de los datos de las estaciones Base Aérea, Compartir, Flora y Univalle, como se muestra en la Ilustración 13. El ozono, al igual que el dióxido de azufre no tiene un umbral o nivel mínimo establecido a largo plazo. El único umbral definido por la OMS es un valor óptimo de 100 μg/m3 en una media de ocho horas, a partir de este valor ya se presentan efectos adversos para la salud. Por tanto, no se
Ing. Ricardo Rodriguez Otero
60
puede determinar si los datos registrados en las estaciones son valores óptimos o no para la salud (OMS, 2005).
Ilustración 13. Serie de tiempo de la concentración de O3 por estaciones.
En la estación Base Aérea se tienen datos de ozono desde febrero de 2013 hasta diciembre de 2016. Los valores oscilan desde las 20 μg/m3 hasta casi las 40 μg/m3 con ciertos datos están por debajo de este valor. La serie de tiempo no presenta ciclos o estaciones. La estación Compartir presenta datos desde enero de 2014 hasta diciembre de 2016. Se visualizan valores por encima de las 40 μg/m3 en septiembre de 2015 y llegando a un valor mínimo de 20 μg/m3. En la estación Flora se tiene información desde febrero de 2010 hasta julio de 2012 y desde octubre de 2014 se presenta una pérdida de datos importante. Por lo anterior la serie de tiempo del ozono presenta una gráfica muy irregular. Esta condición no permite tener una lectura clara del comportamiento de la partícula. De todas formas, se puede Ing. Ricardo Rodriguez Otero
61
apreciar una variación en los datos desde los 15 μg/m3 hasta los 40 μg/m3 como valor máximo. En la estación Pance se tienen datos de ozono desde enero de 2013 hasta diciembre de 2016. Se observa una tendencia creciente de los datos desde los 25 μg/m3 hasta superar los 60 μg/m3 en un periodo de 2 años, tendencia que se invierte desde octubre de 2015 hasta diciembre de 2016.La estación Univalle tiene datos de ozono desde enero de 2013 hasta diciembre de 2016. La tendencia en esta estación es la fluctuación de los datos entre los 30 μg/m3 hasta los 50 μg/m3. La estación Univalle es la que en promedio registra los datos más elevados de ozono. La concentración anual de ozono en Cali se presenta en el Mapa 10, el cual se obtiene a partir de la interpolación de 18 valores promedio de ozono con un valor mínimo de 19.942 μg/m3, un máximo de 51.258 μg/m3, una media de 33.317 μg/m3 y una desviación estándar de 8.5764. Como resultado de esta interpolación el semivariograma de modelo se muestra en la Ilustración 14, de igual forma se obtuvieron 4 gráficos adicionales que corresponden a los valores de precisión, el error general, el error estandarizado y el QQplot del modelo geoestadístico como se muestra en la Ilustración 15, Ilustración 16, Ilustración 17 y en la Ilustración 18.
Ilustración 14. Semivariograma de interpolación Kriging Ordinario de O3.
Ing. Ricardo Rodriguez Otero
62
Ilustraciรณn 15. Predicciรณn del modelo para O3
Ilustraciรณn 17. Error Estandarizado del modelo para O3.
Ing. Ricardo Rodriguez Otero
Ilustraciรณn 16. Error general del modelo para O3.
Ilustraciรณn 18. QQplot del modelo para O3.
63
Mapa 10. Concentraciรณn de ozono, O3.
Ing. Ricardo Rodriguez Otero
64
La concentración anual de ozono en Cali se presenta en el Mapa 10. Se puede visualizar una mayor concentración al sur de la ciudad, más específicamente en las comunas 17, 18 y 22. Al no existir datos al oeste de la ciudad, no es posible determinar valores más precisos de esta partícula contaminante en ese sector. El norte de la ciudad presenta menor concentración de ozono, más específicamente en las comunas 2, 4, 5 y 6. No es posible identificar si los valores están en un nivel o umbral óptimo para la salud humana, dado que no hay un valor de referencia para datos de media anual de esta partícula contaminante. Se debe considerar que los bajos valores corresponden a temporadas con datos perdidos, lo cual puede generar sesgo en el análisis ya que estos datos pueden representar valores altos de contaminación o mostrar otra tendencia en la serie de tiempo.
La Ilustración 14 muestra el semivariograma de la superficie de interpolación mostrada en el Mapa 10, si se compara con el de la Ilustración 8 donde tiene un comportamiento típico. La Ilustración 14, presenta diferencias en la función varianza o curva de la gráfica pues los datos están más espaciados o distanciados entre ellos, esto se debe a la posición de las estaciones de monitoreo y que la interpolación abarca un mayor espacio con menos información Lo anterior también se evidencia en la Ilustración 15, Ilustración 16 y en la Ilustración 17 que representan los errores de la interpolación con un valor de error mucho más elevado que la interpolación de la partícula de dióxido de azufre, de igual forma en la Ilustración 18 que corresponde al QQplot de la interpolación la variación o rango de error también es muy diferente ya que el error en los datos es mucho más amplio.
4.2.3. Dióxido de Nitrógeno (NO2) Las concentraciones de dióxido de nitrógeno en Cali se calculan a partir de los datos de las estaciones Era, Flora y Univalle, como se muestra en la Ilustración 19. A diferencia de las 2 partículas contaminantes anteriores, el dióxido de nitrógeno cuenta con niveles mínimos: se pueden presentar problemas para la salud a partir de 40 μg/m3de media anual y desde 200 μg/m3 de media de una hora (OMS, 2006).
Ing. Ricardo Rodriguez Otero
65
Ilustración 19. Serie de tiempo de la concentración de NO2 por estaciones.
En la estación ERA se tienen datos desde enero de 2010 hasta diciembre de 2011. En 2 años la información oscila en promedio entre los 20 μg/m3 hasta casi los 50 μg/m3, gráficamente es difícil definir o identificar una tendencia en la serie de tiempo. La estación Flora tiene datos de dióxido de nitrógeno entre julio de 2010 hasta octubre de 2013. A pesar de que se presenta una oscilación entre los 20 μg/m3 hasta casi los 35 μg/m3, la tendencia es decreciente lo que significaría una menor concentración en el tiempo. La estación Univalle tiene datos de dióxido de nitrógeno desde enero de 2013 hasta diciembre de 2016. Se presenta una oscilación entre los 8 μg/m3 hasta los 21 μg/m3. A pesar de que se ven tendencias a tener valores elevados, se mantiene en el rango de oscilaciones ya mencionado. En el Mapa 11 se puede apreciar la concentración anual de dióxido de nitrógeno, el cual se obtiene a partir de la interpolación de 10 valores promedio de dióxido de nitrógeno con un valor mínimo de 13.0607 μg/m3, un máximo de 38.0044 μg/m3, una media de 23.2575 μg/m3 y una desviación estándar de 8.3422. Como resultado de la interpolación es el Ing. Ricardo Rodriguez Otero
66
semivariograma de modelo como se muestra en la Ilustración 20, de igual forma se obtuvieron 3 gráficos adiciones que corresponden a los valores de precisión, el error general y el error estandarizado del modelo geoestadístico como se muestran en la Ilustración 21, Ilustración 22 y en la Ilustración 23.
Ilustración 20. Semivariograma de interpolación Kriging Ordinario de NO2.
Ing. Ricardo Rodriguez Otero
67
Ilustraci贸n 21. Predicci贸n del modelo para NO2.
Ilustraci贸n 23. Error Estandarizado del modelo para NO2.
Ing. Ricardo Rodriguez Otero
Ilustraci贸n 22. Error general del modelo para NO2.
68
Mapa 11. Concentraciรณn de diรณxido de nitrรณgeno, NO2.
Ing. Ricardo Rodriguez Otero
69
En el Mapa 11 se puede apreciar la concentración anual de dióxido de nitrógeno. Al haber únicamente datos de 3 estaciones, las estimaciones anuales en algunas partes de la ciudad pueden no ser precisas. En el sector de la Estación Era, las comunas 3, 4, 8 y 9, son los lugares en donde se registran los valores más elevados, pero del umbral óptimo de la OMS. Los valores más bajos de concentración se registran en las comunas 17, 18 y 22 al sur de la ciudad. En la Ilustración 20 se muestra el semivariograma de la interpolación del Mapa 11, este semivariograma tiene una curva normal pero a diferencia de los mapas o superficies de interpolación anteriores, tiene pocos puntos o datos y eso se puede evidenciar en la Ilustración 21. La predicción de modelo es débil a comparación de los modelos o interpolaciones anteriores, en adición los errores se indican en posición pero no se generaron líneas o funciones de error como se muestra en la Ilustración 22 y en la Ilustración 23, esto se debe por la posición casi lineal de las tres estaciones que recolectan la información de esta partícula contaminante, dado que no es posible comparar los datos con una distribución normal no se generó una QQplot de la interpolación, tal vez por los pocos datos utilizados lo cual es uno de los defectos de la interpolación Kriging requerir una buena muestra de datos para tener un resultado satisfactorio o con bajo error de estimación.
4.2.4. Material Particulado 10 μm (PM10) Las concentraciones de Material Particulado de 10 micras o μm (en adelante PM10) se calcularon a partir de los datos de las estaciones Cañaveralejo, Compartir, ERA, Flora, La Ermita, Navarro y Pance, como se muestra en la Ilustración 24. Como se mencionó en la sección 3.2.1.2, el material particulado es uno de los contaminantes más nocivos para la salud de los seres humanos. Esta partícula, a diferencia de las anteriores, es la que más datos presenta en casi todas las estaciones de monitoreo ambiental de Cali. Según las guías ambientales de la OMS, los umbrales desde los cuales la concentración de PM10 empieza a ser nociva para la salud humana, son los siguientes: 20 μg/m3 de media anual y 50 μg/m3 de media de 24 horas (OMS, 2005).
Ing. Ricardo Rodriguez Otero
70
Ilustración 24. Serie de tiempo de la concentración de PM10 por estaciones.
En la estación Cañaveralejo los datos de PM10 se analizan desde mayo de 2014 hasta diciembre 2016. En esta estación la tendencia de los datos es decreciente. A pesar de que presenta 2 picos alrededor de 22 μg/m3. La serie tiende a mantener un rango de oscilación entre los 17 a 20 μg/m3 mensuales. En la estación Compartir, los datos analizados van desde mayo de 2015 hasta diciembre de 2016. La serie de tiempo muestra una tendencia decreciente, con oscilaciones desde los 20 μg/m3 hasta los 32 μg/m3. En la estación ERA los datos analizados van desde febrero de 2010 hasta diciembre de 2016. A diferencia de otras estaciones, ERA es la que mayor cantidad de datos tiene en el tiempo. Se presenta una tendencia creciente, en los datos donde se mantiene la oscilación en los datos desde los 10 μg/m3 hasta los 28 μg/m3. En la estación La Ermita los datos analizados van desde junio de 2013 hasta diciembre de 2016. Se puede apreciar un aumento en el valor de los datos, principalmente a final de cada año, de forma que las épocas con bajas lecturas se dan entre febrero y marzo de cada año. En la estación Flora los datos analizados corresponden a los datos recolectados por esta estación desde julio de 2010 hasta diciembre de 2016. Se aprecian 2 tendencias, una creciente desde 2010 hasta octubre 2014, donde alcanza su valor Ing. Ricardo Rodriguez Otero
71
máximo, fecha desde la cual la tendencia cambia a decreciente hasta diciembre de 2016. Pero la tendencia decreciente mantiene una oscilación de valores altos desde los 25 μg/m3 hasta los 18 μg/m3 por mes. En la estación Navarro, los datos analizados están desde julio de 2015 hasta diciembre de 2016. Esta serie tiene una tendencia decreciente en los datos desde los 30 μg/m3 hasta los 16 μg/m3. En la estación Pance, los datos analizados van desde enero de 2013 hasta diciembre de 2016. La tendencia de esta serie es creciente con una oscilación en los datos desde los 11 μg/m3 hasta los 25 μg/m3. Esta serie no permite identificar ciclos o intervalos regulares en los datos. En el Mapa 12 de concentración de PM10 en Cali se obtuvo a partir de la interpolación de 29 valores promedio de PM10 con un valor mínimo de 22.3790 μg/m3, un máximo de 56.9774 μg/m3, una media de 38.3211 μg/m3 y una desviación estándar de 9.3213. El semivariograma de modelo en la Ilustración 25, de igual forma se obtuvieron 4 gráficos adicionales que corresponden a los valores de precisión, el error general, el error estandarizado del modelo geoestadístico y el QQplot del modelo, como se muestran en la Ilustración 26, Ilustración 27, Ilustración 28 y en la Ilustración 29.
Ilustración 25. Semivariograma de interpolación Kriging Ordinario de PM10.
Ing. Ricardo Rodriguez Otero
72
Ilustraciรณn 26. Predicciรณn del modelo para PM10.
Ilustraciรณn 27. Error general del modelo para PM10.
Ilustraciรณn 28. Error Estandarizado del modelo para
Ilustraciรณn 29. QQplot del modelo para PM10.
PM10.
Ing. Ricardo Rodriguez Otero
73
Mapa 12. ConcentraciĂłn de material particulado 10 Îźm, PM10.
Ing. Ricardo Rodriguez Otero
74
En el Mapa 12 de concentración de PM10 en Cali, se debe considerar que, al igual que los mapas anteriores, la representación de los datos corresponde al promedio anual de cada partícula contaminante, donde el valor mínimo es de 32.88 μg/m3, siendo 12 μg/m3 más elevado que el umbral recomendado para la salud. Las comunas del oriente de Cali presentan concentraciones de más del doble del nivel máximo, con un rango de valores de 46 a 53 μg/m3, más específicamente las comunas 14 y 21. En este sector hay presencia de escombreras y una planta de tratamiento aguas residuales o PTAR, adicionalmente son áreas con valores elevados que colindan con los municipios de Palmira y Yumbo, donde hay presencia de industrias e ingenios azucareros. La otra zona con valores elevados se encuentra, en las comunas 1, 2 y 3 donde está la salida a la ciudad de Buenaventura, se presentan valores de 40 a 46 μg/m3. En la Ilustración 25, se puede apreciar el semivariograma del Mapa 12, en el cual fue necesario optimizarlo manualmente para obtener una interpolación útil, ya que con el semivariograma automático, la interpolación no mostraba casi información, solo un valor promedio en la totalidad del área de estudio. Al realizar la optimización del semivariograma se generó una interpolación con mayor cantidad de información, aunque se podría pensar que los datos pueden ser un poco aleatorios a diferencia de los modelos anteriores, esto se debe a que tiene una mayor cantidad de información concentrada en las estaciones de monitoreo. De igual forma como se muestra en la Ilustración 26, en la Ilustración 27 y en la Ilustración 28, la predicción y los errores las posiciones están mucho más ajustadas que en los modelos anteriores, de igual forma en la Ilustración 29 el QQPlot los datos se ajustan a una distribución normal aunque tienen un rango de error amplio.
4.2.5. Material Particulado 2.5 μm (PM2.5) En Cali, las concentraciones de Material Particulado de 2.5 micras μm (en adelante PM2.5) se calculan a partir de los datos de las estaciones Base Aérea, Compartir, Navarro y Univalle, como se muestra en la Ilustración 30. Como ya se mencionó anteriormente, este material particulado es muy nocivo para el ser humano, en especial porque su estructura es muy fina, pues se habla de partículas dispersas en el aire de 2.5 μm o menos.
Ing. Ricardo Rodriguez Otero
75
Según las guías ambientales de la OMS, los umbrales desde los cuales la concentración de PM2.5 empieza a ser nociva para la salud están en los siguientes valores: 10 μg/m3 de media anual y los 25 μg/m3 de media de 24 horas (OMS, 2005).
Ilustración 30. Serie de tiempo de la concentración de PM2.5 por estaciones
En la estación Base Aérea, los datos analizados de PM2.5 están desde febrero de 2013 hasta diciembre de 2016. La serie de tiempo de estos datos muestra una tendencia creciente con oscilaciones desde los 15 μg/m3 hasta los 26 μg/m3. No es posible identificar posibles ciclos por lo irregular de la serie. En la estación Compartir, los datos analizados se tienen desde febrero de 2014 hasta diciembre de 2016. La serie de tiempo de esta información muestra una tendencia decreciente, con una oscilación en los datos desde los 22 μg/m3 hasta los 11 μg/m3, con disminuciones en el mes de octubre de cada año.
Ing. Ricardo Rodriguez Otero
76
En la estación Navarro los datos analizados están desde febrero de 2014 hasta diciembre de 2016. La serie de tiempo de estos datos muestra una tendencia decreciente, con la oscilación de datos desde los 25 μg/m3 hasta los 13 μg/m3. Es de considerar que se presenta una anomalía en septiembre de 2015 con un valor de 33 μg/m3. En la estación Univalle, los datos analizados van desde marzo de 2013 hasta diciembre de 2016. La serie de tiempo de los datos de la estación tiene una tendencia creciente desde marzo de 2013 hasta septiembre de 2015, la cual cambia decreciente hasta diciembre de 2016. La serie es irregular, no se evidencia un ciclo claro en los datos, los cuales varían desde los 8 μg/m3 hasta los 21 μg/m3. El Mapa 13 presenta la distribución espacial de material particulado 2.5 μg generado a partir del promedio anual de los datos de esta partícula, el cual se obtiene a partir de la interpolación de 14 valores, con un valor mínimo de 11.4482 μg/m3, un máximo de 23.8645 μg/m3, una media de 17.8893 μg/m3 y una desviación estándar de 3.4385. El semivariograma de modelo como se muestra en la Ilustración 31, de igual forma se obtuvieron 4 gráficos adicionales que corresponden a los valores de precisión, el error general, el error estandarizado del modelo geoestadístico y el QQplot del modelo, como se muestran en la Ilustración 32, Ilustración 33, Ilustración 34 y en la Ilustración 35.
Ilustración 31. Semivariograma de interpolación Kriging Ordinario de PM2.5.
Ing. Ricardo Rodriguez Otero
77
Ilustraciรณn 32. Predicciรณn del modelo para PM2.5
Ilustraciรณn 33. Error general del modelo para PM2.5
Ilustraciรณn 34. Error Estandarizado del modelo para PM2.5.
Ilustraciรณn 35. QQplot del modelo para PM2.5.
Ing. Ricardo Rodriguez Otero
78
Mapa 13. ConcentraciĂłn de material particulado 2.5 Îźm, PM2.5.
Ing. Ricardo Rodriguez Otero
79
El Mapa 13 presenta la distribución espacial de la concentración de PM2.5. Es importante mencionar que para esta partícula no sea perjudicial para la salud humana, el nivel anual máximo de exposición a ella debe ser de 10 μg/m3 o menor. Teniendo en cuenta lo anterior, se puede observar que en las áreas de la ciudad con los valores más bajos sobrepasan los 5 μg/m3, pero los barrios en las comunas 4, 5, 7, 8, 11, 12, 13, 14, 15 y 16, estarían con valores de más del doble del nivel máximo. A diferencia del Mapa 12 de MP10, este mapa sólo cuenta con la información de 4 estaciones, las cuales están ubicadas hacia el centro de la ciudad, por lo que la precisión de la información al occidente de la ciudad no sería la adecuada por falta de datos de otras estaciones. En la Ilustración 31 se muestra el semivariograma del modelo o interpolación del Mapa 13, el cual tiene un comportamiento típico, por lo que no fue necesario realizar ningún tipo de optimización. Los datos muestran una correlación espacial, en una distancia corta y antes del rango o estabilización de la curva del semivariograma y como se muestra en la Ilustración 32 la predicción está ajustada a 4 estaciones del modelo. En la Ilustración 33 y en la Ilustración 34 se muestra un ajuste al error, como se muestra en la Ilustración 35 en el QQplot del modelo el ajuste y rango de error es alto; tampoco es fuerte la comparación de los datos con una distribución normal, puede ser debido a una gran cantidad de datos pero en pocas ubicaciones o estaciones, aunque la distribución de estas estaciones es más amplia que con otras partículas contaminantes.
4.3.
ANÁLISIS DE DATOS CLIMATOLÓGICOS EN CALI.
Los datos climatológicos de días de lluvia y precipitación total se tomaron de las estaciones CVC, Colegio San Luis, Planta Río Cali, Colegio San Juan Bosco, Cañaveralejo-Edificio CVC y de la estación Planta Río Cauca, en el periodo de 2010 a 2016. A diferencia de las series de tiempo de las partículas contaminantes, las series de tiempo de días de lluvia se presentan únicamente en la Ilustración 36, dado que los datos fueron constantes y estables en las 5 estaciones.
Ing. Ricardo Rodriguez Otero
80
Ilustración 36. Series de Tiempo de Días de Lluvia en Cali.
Como resultado de las series de tiempo de días de lluvia se tiene que el 2012 es el año con menor cantidad de días de lluvia en la ciudad y el 2014 es el año con mayor cantidad En el Mapa 14, se presenta la distribución espacial de las áreas con mayor o menor cantidad días de lluvia en Cali de 2010 a 2016. La intención de mapa es mostrar la intensidad de la precipitación, ya que en pocos días se puede tener valores altos de precipitación o viceversa poca precipitación, pero una gran cantidad de días de lluvia.
Ing. Ricardo Rodriguez Otero
81
Mapa 14. DĂas de Lluvia en Cali.
Ing. Ricardo Rodriguez Otero
82
El Mapa 14 fue generado a partir del promedio anual de los datos, el cual se obtiene a partir de la interpolación de 35 valores, con un valor mínimo de 22 días, un máximo de 167 días, una media de 111.7428 días y una desviación estándar de 33.8668. El semivariograma del modelo se muestra en la Ilustración 37, de igual forma se obtuvieron 4 gráficos adicionales que corresponden a los valores de precisión, el error general, el error estandarizado del modelo geoestadístico y el QQplot del modelo, como se muestran en la Ilustración 38, Ilustración 39, Ilustración 40 y en la Ilustración 41.
Ilustración 37. Semivariograma de interpolación Kriging Ordinario de Días de Lluvia en Cali.
Ing. Ricardo Rodriguez Otero
83
Ilustración 38. Predicción del modelo para los Días de Lluvia en Cali.
Ilustración 40. Error Estandarizado del modelo para los Días de Lluvia en Cali.
Ing. Ricardo Rodriguez Otero
Ilustración 39. Error general del modelo para los Días de Lluvia en Cali.
Ilustración 41. QQplot del modelo para los Días de Lluvia en Cali.
84
De igual forma que las series de tiempo de días de lluvia, las series de precipitación total se presentan únicamente en la Ilustración 42, dado que los datos fueron constantes y estables en las 5 estaciones.
-
Ilustración 42. Series de tiempo de la Precipitación Total Anual en Cali.
Como resultado de las series de tiempo de precipitación total anual se tiene que el 2012 es el año con menor precipitación en la ciudad, en 4 de 5 estaciones. La estación “Planta Río Cali” tiene un valor menor de precipitación total en el 2013; por su parte el 2016 es el año con el valor más bajo de las estaciones “Planta Río Cauca” y “Colegio San Luis”. En el Mapa 15 se presenta la distribución espacial de las áreas con mayor o menor de precipitación total en Cali de 2010 a 2016.
Ing. Ricardo Rodriguez Otero
85
Mapa 15. Precipitaciรณn total en Cali.
Ing. Ricardo Rodriguez Otero
86
El Mapa 15 se generó a partir del promedio anual de los datos, mediante la interpolación de 35 valores, con un valor mínimo de 319.1 mm, un máximo de 2,095 mm, una media de 1,117.611 mm y una desviación estándar de 453.4855. El semivariograma de modelo como se muestra en la Ilustración 43, de igual forma se obtuvieron 4 gráficos adicionales que corresponden a los valores de precisión, el error general, el error estandarizado del modelo geoestadístico y el QQplot del modelo, como se muestran en la Ilustración 44, Ilustración 45, Ilustración 46 y en la Ilustración 47.
Ilustración 43. Semivariograma de interpolación Kriging Ordinario de Precipitación Total.
Ing. Ricardo Rodriguez Otero
87
Ilustración 44. Predicción del modelo para Precipitación Total.
Ilustración 46. Error Estandarizado del modelo para Precipitación Total.
Ilustración 45. Error general del modelo para Precipitación Total.
Ilustración 47. QQplot del modelo para Precipitación Total.
La precipitación y la intensidad de las lluvias están vinculados con diversos casos de IRA. De igual forma, al ser un evento atmosférico común y recurrente, puede haber un efecto sobre las partículas contaminantes analizadas en esta tesis, adicionalmente los días de lluvia en la ciudad indican en que zonas llueve con más frecuencia, pero la precipitación total indica que intensidad llovió en dichas zonas. El Mapa 14 presenta las áreas con mayor o menor cantidad de días de lluvia en Cali, donde los barrios de las comunas 9, 10, 17, 18, 18 y 20 Ing. Ricardo Rodriguez Otero
88
con un promedio de 124 a 140 días de lluvia al año; las áreas con menos días de lluvia son los barrios de las comunas 2, 4, 5, 7 y 8 al norte de Cali, con un promedio de días de 88 días a 98 días de lluvia. En el Mapa 15 se presentan las áreas con la mayor o menor precipitación total anual en Cali, las comunas con las mayores precipitaciones son las comunas 10, 17, 18, 19 y 20, con precipitaciones de 1289 mm hasta los 1385 mm en promedio. Las zonas con menor precipitación son las comunas 2, 4, 5, 6 y 7, con precipitaciones de 905 mm a 953 mm en promedio. Al comparar ambos mapas las áreas de mayores días de lluvia y de precipitación total coinciden en su distribución geográfica, al igual que las áreas con menor precipitación y de días de lluvia. En la Ilustración 37 se muestra el semivariograma de la interpolación del Mapa 14, este semivariograma tiene un comportamiento típico con datos que se correlacionan a corta distancia antes de que la curva alcance a estabilizarse. La predicción del modelo se ajusta correctamente a una línea recta como lo muestra la Ilustración 38, de igual forma los errores se ajustan como se puede ver en la Ilustración 39 y en la Ilustración 40, pero en el QQplot del modelo se puede observar en la Ilustración 41, que presenta la relación de los datos con la distribución normal. De igual forma que con la interpolación de días de lluvia, la Ilustración 43 corresponde al semivariograma del Mapa 15, el cual presenta una diferencia con las interpolaciones anteriores. El área estable del semivariograma es inexistente y la gráfica se asemeja más a una línea que a una curva en gran parte del recorrido, pero con muy poca distancia entre las mediciones, lo cual indica una alta correlación de los datos, siendo la interpolación más confiable de esta investigación. La predicción del mapa es muy estable ya que presenta una variación muy pequeña como se muestra en la Ilustración 44, los errores de la interpolación presentan buen ajuste como se muestra en la Ilustración 45 y en la Ilustración 46, de igual forma el QQplot a diferencia de los mapas anteriores presenta un variación muy pequeña en los datos.
Ing. Ricardo Rodriguez Otero
89
4.4.
REGRESIÓN LINEAL (MÍNIMOS CUADRADOS ORDINARIOS - OLS) EN CALI.
Las variables de IRA, partículas contaminantes y variables climatológicas fueron normalizadas utilizando el método Z-score ya mencionado en la sección 3.2.3, se utilizó el software estadístico IBM SPSS para la normalización de las variables para que los datos de cada una de las variables estén en una misma escala numérica, conservando sus proporciones o características. Antes de crear el modelo de regresión lineal mediante el método de Mínimos Cuadrados Ordinarios - OLS, se realizó una exploración del modelo de regresión, usando el software ArcGIS 10.5.1, utilizando las siguientes variables, las cuales se representaron utilizando los siguientes nombres: NOR_SEX (valor normalizado del género o sexo de cada uno de los pacientes o casos), NOR_EDAD (valor normalizado de edad de cada uno de los pacientes o casos), NOR_PM25 (valor normalizado del valor promedio de PM2.5 por barrio de cada uno de los pacientes o casos), NOR_PM10 (valor normalizado del valor promedio de PM10 por barrio de cada uno de los pacientes o casos), NOR_NO2 (valor normalizado del valor promedio de NO2 por barrio de cada uno de los pacientes o casos), NOR_ESTR (valor normalizado del estrato socioeconómico del barrio donde se ubica cada uno de los pacientes o casos), NOR_SO2 (valor normalizado del valor promedio de SO2 por barrio de cada uno de los pacientes o casos), NOR_DLLUVIA (valor normalizado del valor promedio de Días de Lluvia por barrio de cada uno de los pacientes o casos), NOR_PRETOT (valor normalizado del valor promedio de Precipitación Total por barrio de cada uno de los pacientes o casos), NOR_O3 (valor normalizado del valor promedio de O3 por barrio de cada uno de los pacientes o casos). Los valores promedio de las variables de contaminación y climáticos se tomaron de las superficies interpoladas y se le asignó un valor promedio a cada barrio, sin embargo, las variables socioeconómicas al ser valores únicos no se modificaron ni se promediaron, solamente se normalizaron de igual forma que el resto de los valores. Como resultado de la exploración del modelo de regresión, se tiene el porcentaje de significancia de cada una de las variables, como se muestra en la Tabla 17. Al tener significancia en el modelo, se considera que todas las variables son válidas. Como se muestra en la Tabla 18, existen tres variables que tienden a la coliniaridad entre ellas, las variables NOR_PRETOT, NOR_DLLUVIA y NOR_O3, lo cual indica que en la ecuación de Ing. Ricardo Rodriguez Otero
90
regresiรณn lineal solo se debe usar en una de estas variables, ya que en combinaciรณn con las otras 2 se da la misma informaciรณn, generando errores en el cรกlculo. Para mรกs informaciรณn estadรญstica de las variables exploradas ver la Tabla 16. A continuaciรณn, se presenta el resultado del modelo OLS. En la Ilustraciรณn 48 se muestra el histograma de cada una de las variables utilizadas y diagramas de dispersiรณn de los datos en cada una de las variables usadas. Las dispersiones tienden a ser paralelas por causa de la normalizaciรณn de las variables.
Ilustraciรณn 48. Histogramas y diagramas de dispersiรณn de variables OLS.
Ing. Ricardo Rodriguez Otero
91
En la Ilustración 49 se muestran los datos generales del modelo OLS
Ilustración 49. Datos generales OLS.
En la Ilustración 50 se muestra el histograma global de las variables usadas y si su comportamiento se asemeja a una distribución o curva normal estadística.
Ilustración 50. Histograma y comportamiento global de variables.
Ing. Ricardo Rodriguez Otero
92
Ilustración 51. Diagrama de dispersión sobre la predicción del modelo OLS
En la Ilustración 51 se muestra la dispersión de los valores predichos por el modelo y los residuales del mismo. Los puntos rojos serían equivalentes a los puntos calientes del Mapa 4 y de la misma manera, los de color azul se asemejan a los puntos fríos del mapa mencionado. Por último, los puntos de color amarillo representan los puntos que no son significativos en el modelo. Se destaca que los clústeres o puntos calientes y fríos en la ciudad se van a mantener, pero en forma decreciente. Del mismo modo, los puntos mantienen una tendencia paralela, no convergen entre ellos. Sin embargo, muestra una relación lineal entre las variables explicativas y la variable de IRA. El Mapa 16 es el resultado del modelo OLS, el cual muestra las predicciones excesivas o escasas del modelo.
Ing. Ricardo Rodriguez Otero
93
Mapa 16. RegresiĂłn Lineal (MĂnimos cuadrados ordinarios - OLS).
Ing. Ricardo Rodriguez Otero
94
En la Tabla 16 se presenta información de las variables explicativas, en la Tabla 17 presenta la significancia de las variables usadas en el modelo, en la Tabla 18 se presentan las variables con tendencia a la coliniaridad múltiple, en la Tabla 19 los valores de los coeficientes utilizados en el modelo y en la Tabla 20 se presenta el diagnostico de los coeficientes del modelo OLS. Las tablas mencionadas y sus cifras permiten realizar comprobaciones o análisis comparativos en caso de que otras personas deseen validar o tener una base estadística para futuros estudios. Tabla 16. Resultado preliminar de las variables explicativas según la exploración del modelo de regresión. Prob
Robust_SE
Intercept
Variable
-0.00000077974
0.02115681
-0.0000368
0.99997058
0.02110999866
-0.0000369
0.99997051525
0.00000000
NOR_ESTR
-0.06630853830
0.02543140
-2.6073486
0.00918485
0.02518901415
-2.6324388
0.00853627094
-0.06630855
NOR_SEX
-0.26315438003
0.02196753
-11.9792410
0.00000000
0.03489039873
-7.5423150
0.00000000002
-0.26315442
NOR_EDAD
-0.09070527741
0.02337727
-3.880062
0.00011750
0.02640573344
-3.4350599
0.00062024662
-0.09070533
0.08699903873
0.04627905
1.879879
0.06026673
0.05506808213
1.5798450
0.11431270560
0.08699909
NOR_NO2
-0.10935395775
0.03632787
-3.010193
0.00265422
0.04095150679
-2.6703280
0.00763461346
-0.10935403
NOR_PM10
0.10897274590
0.02842799
3.833290
0.00014081
0.03092149238
3.5241748
0.00044934012
0.10897280
NOR_PM25
-0.06173630532
0.04020300
-1.535614
0.12480413
0.03573257743
-1.7277316
0.08419700436
-0.06173635
0.17786643166
0.03987431
4.460676
0.00001127
0.04791484620
3.7121361
0.00022356743
0.17786653
NOR_PRETOT
NOR_SO2
Coef
StdError
t_Stat
Robust_t
Robust_Pr
Tabla 17. Significancia de cada variable del modelo OLS. Summary of Variable Significance Variable
NOR_SEX
% Significant
% Negative
% Positive
100
100
0
NOR_EDAD
92.23
100
0
NOR_PM25
81.41
100
0
NOR_PM10
75.22
0
100
NOR_NO2
72.59
100
0
NOR_ESTR
72.25
100
0
NOR_SO2
65.25
0.64
99.36
NOR_DLLUVIA
47.27
76.59
23.41
NOR_PRETOT
46.82
42.73
57.27
NOR_O3
40.91
39.09
60.91
Ing. Ricardo Rodriguez Otero
StdCoef
95
Tabla 18. Variables con tendencia a la coliniaridad múltiple. Summary of Multicollinearity* Variable
VIF
Violations
Covariates
NOR_ESTR
1.46
0 --------
NOR_SEX
1.12
0 --------
NOR_EDAD
1.23
0 --------
NOR_DLLUVIA
816.61
184 NOR_PRETOT (71.60), NOR_O3(21.79)
NOR_PRETOT
997.13
198 NOR_DLLUVIA (71.60), NOR_O3(26.46)
NOR_NO2
5.16
NOR_O3
0 --------
28.75
104 NOR_PRETOT (26.46), NOR_DLLUVIA (21.79)
NOR_PM10
2.45
0 --------
NOR_PM25
4.06
0 --------
NOR_SO2
4.91
0 --------
Tabla 19. Coeficientes resultantes OLS. Variable
Coeficiente StdError
t-Statistic
Intercept
-0.000001 0.021157
-0.000037
NOR_ESTR
-0.066309 0.025431
-2.607349 0.009185*
0.025189 -2.632439 0.008536*
1.444907
NOR_SEX
-0.263154 0.021968 -11.979241 0.000000*
0.03489 -7.542315 0.000000*
1.078107
NOR_EDAD NOR_PRETO T
-0.090705 0.023377
NOR_NO2
-0.109354 0.036328
-3.010194 0.002654*
NOR_PM10
0.108973 0.028428
3.83329 0.000141*
NOR_PM25
-0.061736 0.040203
NOR_SO2
0.086999 0.046279
0.177866 0.039874
Probability Robust_SE Robust_t Robust_Pr 0.999971
-3.880062 0.000118* 1.879879
-1.535614
0.060267
0.124804
4.460677 0.000011*
0.02111 -0.000037
VIF
0.999971 --------
0.026406
-3.43506 0.000620*
0.055068
1.579845
1.22092
0.114313 4.784853
0.040952 -2.670328 0.007635*
2.948354
0.030921
1.805477
3.524175 0.000449*
0.035733 -1.727732 0.047915
0.084197 3.610911
3.712136 0.000224*
3.552106
El modelo resultante puede explicar el 9.2% de los casos de IRA en Cali, lo cual puede ser confirmado con los valores de R2 y el ajuste de R2 con un valor de 8.9%. El ajuste tiende a ser un poco menor que el R2 original, estas son las medidas principales de rendimiento del modelo. Entre más cercano sea el valor R2 y su ajuste a uno, mayor será la relación de las variables explicativas con la variable a encontrar. Estos valores se encuentran en el diagnóstico del modelo en la Tabla 20. Es de considerar que el valor de R2 puede ser un poco bajo para este tipo de modelos. Para el presente estudio no se consideraron dos variables que pueden confirmar o aumentar el valor de R2, que son la contaminación producida por el transporte de la ciudad, más específicamente los óxidos de carbono (COX), y el hecho de que la red de monitoreo de la ciudad no colecta la
Ing. Ricardo Rodriguez Otero
96
información de las partículas contaminantes de forma “pareja” en todas las estaciones, por lo que se sugiere considerar este resultado como válido para este tipo de modelo.
Tabla 20. Diagnóstico de coeficientes OLS. Diag_Name
Diag_Value
AIC
5599.86679048000
AICc
5599.97543245000
R2
0.09269189835
AdjR2
0.08911100797
F-Stat F-Prob Wald
Wald-Prob
K(BP)
K(BP)-Prob JB JB-Prob
Sigma2
Definition Akaike's Information Criterion: A relative measure of performance used to compare models; the smaller AIC indicates the superior model. Corrected Akaike's Information Criterion: second order correction for small sample sizes. R-Squared, Coefficient of Determination: The proportion of variation in the dependent variable that is explained by the model. Adjusted R-Squared: R-Squared adjusted for model complexity (number of variables) as it relates to the data.
25.88515378920 Joint F-Statistic Value: Used to assess overall model significance. Joint F-Statistic Probability (p-value): The probability that none of 0.00000000000 the explanatory variables have an effect on the dependent variable. 100.86247708100 Wald Statistic: Used to assess overall robust model significance. Wald Statistic Probability (p-value): The computed probability, using robust standard errors, that none of the explanatory variables have 0.00000000000 an effect on the dependent variable. Koenker's studentized Breusch-Pagan Statistic: Used to test the reliability of standard error values when heteroskedasticity (non152.86909587700 constant variance) is present. Koenker (BP) Statistic Probability (p-value): The probability that heteroskedasticity (non-constant variance) has not made standard 0.00000000000 errors unreliable. Jarque-Bera Statistic: Used to determine whether the residuals 4055.62183655000 deviate from a normal distribution. Jarque-Bera Probability (p-value): The probability that the residuals 0.00000000000 are normally distributed. Sigma-Squared: OLS estimate of the variance of the error term 0.91133539707 (residuals).
En la Tabla 20 de diagnóstico se presentan otras variables como la evaluación de la significancia del modelo, a través de los indicadores F conjunto y los índices estadísticos Wald, los cuales al tener valores p pequeños indican que el modelo es significativo con un nivel de confianza del 100%. Esto se explica al tener probabilidades de cero, se rechaza la hipótesis nula donde no hay relación alguna de las variables, por esto a pesar de que no son indicadores muy útiles, el resultado del modelo es válido, aunque falte información. En la Tabla 19 se muestran los coeficientes de cada una de las variables explicativas del modelo, también se encuentra información de la probabilidad o probabilidad robusta, Prueba T y Factor de inflación de la varianza (VIF, por sus siglas en inglés). Como se mencionó en la sección 2.4, la fórmula de regresión lineal para encontrar la relación de la variable dependiente, realizando la sumatoria de las variables explicativas del cociente de estas Ing. Ricardo Rodriguez Otero
97
variables con un coeficiente, el valor del signo que antecede a cada coeficiente, ya sea positivo o negativo, indica qué tipo de relación y qué fuerza tiene cada variable en el modelo como se muestra en la Tabla 19 y Tabla 17 donde se muestra la significancia de cada variable explicativa en el modelo y el porcentaje de qué tan negativa o positiva es la variable en la ecuación. En la Tabla 19, también se muestra un valor p o probabilidad por cada variable, donde p al ser cercano a cero es más probable que la importancia de la variable sea mayor, el asterisco al lado de cada valor representa un 10% aproximadamente de significación de la variable en el modelo. En este caso las variables seleccionadas sí tienen una importancia alta en el modelo. En la Tabla 19, también se muestra el Factor de inflación de la varianza – VIF, el cual indica qué tan redundante es una variable explicativa con respecto a las demás. Las variables que presentan valores mayores a 7.5 puede que estén ofreciendo la misma información que otras, en otras palabras, se puede presentar redundancia de información afectando el modelo, para el modelo se seleccionaron las variables con valores menores a 7.5 como se muestra en la tabla ya mencionada. El comportamiento de las variables se puede observar en la Ilustración 48 que muestra los histogramas y diagramas de dispersión de las variables, al ser normalizadas los gráficos de dispersión muestran de forma directa los patrones de cada una de las variables, en la Ilustración 50 se muestra el histograma del comportamiento general de modelo con una
distribución normal. A pesar de que las variables presentan varias diferencias entre sí, el modelo no presenta sesgos, adicional a esto en la Ilustración 51 se muestra el diagrama de dispersión global del modelo donde se ve agrupamiento de datos, tanto significativos como no significativos, por tanto, la predicción de los datos tiende a la autocorrelación. En el Mapa 16 se presenta el resultado del modelo OLS, que corresponde a los residuales de resultado del modelo de regresión lineal global, los residuales son la diferencia de los valores observados menos los valores estimados por el modelo. En este mapa se evidencia que los barrios en rojo tienden a presentarse mayor cantidad de casos de IRA, los cuales se presentan en mayor cantidad de barrios en de las comunas 2, 7, 10, 11, 18, 19 y 21. Los barrios en color azul corresponden a barrios donde los valores estimados por el modelo son más elevados que los casos observados de IRA, los cuales están ubicados en las comunas 5, 8,
Ing. Ricardo Rodriguez Otero
98
11, 17 y 21. La mayoría de los barrios están ubicados en las áreas periféricas de Cali, donde se presentan las mayores variaciones en los datos de partículas contaminantes.
4.4.1. Regresión Lineal (Regresión Ponderada Geográficamente GWR). La regresión ponderada geográficamente (GWR, por sus siglas en inglés) es la versión local del modelo de regresión lineal OLS, donde se explica la relación de la variable dependiente a nivel local. A diferencia del anterior modelo, no se aplicaron las mismas variables explicativas para evitar sesgos por causa de coliniaridad. Se usaron las variables con los mejores indicadores de rendimiento obtenidos a partir de la exploración del modelo de regresión, las variables usadas tenían un valor de Factor de inflación de la varianza (VIF, por sus siglas en inglés) menor a 7.5 y que no tuviera conflictos de coliniaridad como muestra la Tabla 18. Para este modelo se usaron las siguientes variables: NOR_SEX (valor normalizado del género o sexo de cada uno de los pacientes o casos), NOR_EDAD (valor normalizado de edad de cada uno de los pacientes o casos), NOR_PM25 (valor normalizado del valor promedio de PM2.5 por barrio de cada uno de los pacientes o casos), NOR_PM10 (valor normalizado del valor promedio de PM10 por barrio de cada uno de los pacientes o casos), NOR_ESTR (valor normalizado del estrato socioeconómico del barrio donde se ubica cada uno de los pacientes o casos), NOR_SO2 (valor normalizado del valor promedio de SO2 por barrio de cada uno de los pacientes o casos), para un total de 6 variables explicativas. A diferencia del modelo global OLS, los modelos de regresión espacial locales generan una ecuación de regresión lineal por cada polígono o entidad que se esté evaluando de la variable a explicar, dependiendo de la vecindad entre entidades y sus valores, por ese motivo al tener pocos cambios de valor a nivel local algunas variables tienden a la coliniaridad. Por tal motivo se elaboró un modelo GWR con variables compatibles entre sí. De igual forma que en el modelo OLS, las variables socioeconómicas son únicas como edad, género y las variables ambientales se utilizó el valor promedio por barrio, pero no se usaron las variables climatológicas por problemas de coliniaridad. El Mapa 17 es el resultado del modelo GWR, el cual muestra las predicciones excesivas o escasas del modelo. Ing. Ricardo Rodriguez Otero
99
Mapa 17. Regresiรณn Lineal (Regresiรณn ponderada geogrรกficamente - GWR).
El modelo GWR generado a partir de las variables explicativas con el mejor rendimiento de VIF y los otros indicadores obtenidos en la exploraciรณn de la regresiรณn. Ing. Ricardo Rodriguez Otero
100
Los valores cercanos a cero o muy bajos muestran que el modelo no funciona por falta de variables o inestabilidad de estas. En este caso el modelo tiene valores de “Local R2” que explican desde un 68% de casos de IRA en los barrios de Cali hasta un mínimo del 5% de explicación. Adicionalmente, muestra los valores estimados o predicciones del modelo, los errores de estimación y los errores de coeficientes de cada variable, entre más pequeño es el error de coeficientes, más confiable es la variable. En el Mapa 17 se representan los residuales del modelo local GWR, donde los barrios de color rojo representan que el valor observado es mayor al valor estimado. Los barrios de las comunas 2, 4, 7, 18, 19, 20 y 22 presentan este tipo de valores. Los barrios de color azul son las zonas donde el valor estimado por el modelo es superior al valor observado. Los barrios de las comunas 2, 8, 11, 17 son las zonas que presentan mayor concentración de este tipo de valores. Es de evaluar que los barrios de las comunas 2, 7, 11 y 21 presentan más valores observados que calculados o estimados tanto en el modelo OLS como en este modelo. A pesar de que este modelo tiene una mejor precisión que el modelo OLS se confirma que los barrios periféricos de Cali son los que presentan los mayores problemas en correlación de partículas contaminantes e IRA.
Ing. Ricardo Rodriguez Otero
101
5. ANÁLISIS DE RESULTADOS En esta sección se muestra el análisis de los resultados presentados en la sección 4, analizando el resultado de cada mapa por comuna.
5.1.
ANÁLISIS ESPACIAL DE INFECCIONES RESPIRATORIAS AGUDAS (2010-2016)
En esta sección se muestra el análisis de los resultados de infecciones respiratorias agudas o IRA en Cali.
5.1.1. Análisis de puntos calientes y fríos en infecciones respiratorias agudas (2010-2015), usando el índice local “Getis-Ord Gi*”. En el mapa de análisis de puntos calientes y fríos en IRA en el periodo de 2010 a 2015 usando el índice “Getis-Ord Gi*”, se identifica que el área del centro de la ciudad es un área con casos de IRA pero con una baja cantidad de casos, por lo que se podría decir que es una zona de tránsito o de permanencia de pocas horas, dado que es una área comercial, entre otras actividades. Al contrario, los puntos calientes se ubican en la periferia de la ciudad ya que se caracteriza por ser áreas residenciales, lo cual podría indicar que los focos de infección pueden ser permanentes y cercanos o hay alta exposición a alguna de las causas de IRA.
5.1.2. Análisis de clústeres y datos anómalos de infecciones respiratorias agudas (2010-2015), usando el índice “Local Moran’s Anselin”. En el caso del mapa de análisis de clústeres y datos anómalos de IRA, en el periodo de 2010 a 2015, este análisis no se analizó en relación con alguna característica socio demográfica de los afectados por IRA. Únicamente se analizó la distribución espacial de la totalidad de casos, como se indica en la descripción del mapa. Este mapa muestra concentración de clústeres con valores altos de casos de afectados por IRA en la periferia de la ciudad, al norte de esta y varios clústeres de valores anómalos y valores bajos en el centro de la ciudad. Lo anterior podría indicar que, en el centro de la ciudad, la población es flotante, está de paso y tiende a enfermarse menos por IRA, a diferencia de las zonas periféricas de la ciudad
Ing. Ricardo Rodriguez Otero
102
que son ya áreas residenciales, por lo que esas zonas podrían tener varios focos de infección o causas de IRA.
5.1.3. Análisis de clústeres y datos anómalos de infecciones respiratorias agudas (2010-2015) según la edad de los afectados usando el índice “Local Moran’s I Anselin” El mapa de análisis de clústeres y datos anómalos de IRA, en el periodo de 2010 a 2015 según la edad de los afectados, presenta una distribución espacial casi homogénea en la ciudad, entre valores altos y bajos de afectados, donde los clústeres de valores altos representan a niños y adultos mayores y los clústeres bajos representan el resto de la población. El resultado del análisis del índice local de Moran indica las áreas o barrios con la población más propensa a enfermarse con algún tipo de IRA, independiente de la causa o si tiene relación directa con alguna partícula contamínate. Varias áreas con valores no significativos en el análisis, presentan traslapes con focos contaminantes, son pocos los clústeres con valores altos que concuerdan con algunos focos contaminantes, lo cual podría indicar que la población más propensa a enfermar por IRA no es población flotante o que este de paso en estas zonas, si no que reside directamente en esas áreas identificadas. Es de considerar que la información de las personas afectadas se asoció a la unidad espacial más pequeña posible que, para este este estudio, fueron los polígonos de barrios como ya se ha mencionado en capítulos anteriores, por lo que la precisión puede variar considerablemente.
5.1.4. Análisis de clústeres y datos anómalos de infecciones respiratorias agudas (2010-2015) según el género de los afectados, usando el índice “Local Moran’s I Anselin” Para el mapa de análisis de clústeres y datos anómalos de IRA, en el periodo de 2010 a 2015, según el género del afectado, como ya se menciona en la descripción del mapa, las mujeres representan un 60 % de la población afectada por IRA, pero en agrupaciones de pocos individuos, a diferencia de los hombres, los cuales a pesar de que solo son el 40 % de las
Ing. Ricardo Rodriguez Otero
103
personas registradas en los casos de IRA están en agrupaciones con cantidades más altas por barrio que las mujeres en la ciudad. El mapa presenta un contraste entre los clústeres de valores bajos y altos ya que se presentan en casi toda la ciudad a diferencia de los otros mapas de análisis de clústeres, en algunos de los clústeres de valores altos en especial las comunas 2, 13 y 14 traslapan directamente en áreas identificadas como focos contaminantes, como el antiguo relleno sanitario Navarro y actividades comerciales e industriales al norte de la ciudad. Al oeste de la ciudad es difícil identificar el por qué de los clústeres con valores altos, en particular en hombres siendo los más afectados.
5.1.5. Análisis de clústeres y datos anómalos de infecciones respiratorias agudas (2010-2015), por año, usando el índice “Local Moran’s Anselin” El mapa de análisis de clústeres y datos anómalos de infecciones respiratorias agudas en el periodo de 2010 a 2015, distribuido por año, muestra alta concentración de afectados en áreas periféricas de la ciudad que en algunos casos coinciden con varios focos contaminantes o áreas con altas concentraciones de partículas contaminantes. De las áreas identificadas con altas concentraciones de partículas están las comunas 2 y 4 al norte de la ciudad. Esta área el norte de la ciudad no tiene la misma cantidad de precipitaciones y días de lluvia que el resto de la ciudad. En esta área, se encuentra el terminal de transportes de la ciudad y es un área receptora de la contaminación atmosférica generada en los municipios vecinos. De igual forma algunos barrios de las comunas 13 y 15 también tienen clústeres con una cantidad alta de personas afectadas por IRA, estos barrios traslapan con el área de influencia del antiguo relleno sanitario Navarro. En adición a lo anterior, en el mapa también se observan algunos barrios de las comunas 3, 5 y 7 y de la comuna 22 y 17, con clústeres de valores altos de afectados por IRA que tiene algunos sitios con presencia de escombreras y acumulación de basuras ilegales. Algunos de estos barrios tienen áreas residenciales extensas, por lo que la exposición a partículas contaminantes podrían ser mucho más alta que la población flotante en otras áreas con altas concentraciones de partículas contaminantes.
Ing. Ricardo Rodriguez Otero
104
5.2.
ANÁLISIS DE CONCENTRACIONES DE PARTÍCULAS CONTAMINANTES EN CALI.
En esta sección se muestra el análisis de los resultados de las concentraciones de partículas contaminantes en Cali.
5.2.1. Dióxido de Azufre (SO2) El mapa de concentración anual de dióxido de azufre muestra valores homogéneos en casi toda la ciudad, pero en la comuna 2 se presenta la mayor concentración de dióxido de azufre. Dado que el dióxido de azufre se produce por la combustión de Diesel entre otros materiales, se asumiría que las actividades industriales de otros municipios afectan esta zona. De igual forma, el transporte público por ser el principal usuario de Diesel en la ciudad, puede ser una fuente de dióxido de azufre, al ser una fuente de emisión móvil puede afectar o dispersar la partícula contaminante de forma homogénea. Esta partícula contaminante también puede tener altas concentraciones al norte de la ciudad por la presencia del terminal de transporte y por ser el área de salida hacia otros municipios, no es claro si también la baja frecuencia de lluvias o de precipitaciones influye a que sea alta la concentración de esta partícula al norte de la ciudad.
5.2.2. Ozono (O3) El mapa de concentración anual promedio de ozono muestra altas concentraciones de este gas en la ciudad, es de tener en cuenta que el ozono se produce de forma natural por la interacción del sol y óxidos de nitrógeno(NOX) que son los principales precursores del ozono a baja altura. A diferencia del mapa de dióxido de nitrógeno, la concentración se da al sur de la ciudad. Esto puede deberse a que, por acción del viento y procesos químicos como los ya mencionados, sumado a la interacción con otros factores climáticos al sur de la ciudad pueden ser otro tipo de precursor de la producción de ozono en esa zona. De igual forma que la interpolación de las demás partículas contaminantes, la interpolación de ozono solo cuenta con 4 nodos de los cuales, no hay estaciones de monitoreo en el centro y oeste de la ciudad por lo que la precisión de la interpolación puede verse afectada. Ing. Ricardo Rodriguez Otero
105
5.2.3. Dióxido de Nitrógeno (NO2) El mapa de concentración anual de dióxido de nitrógeno presenta sus mayores valores en el centro y norte de la ciudad, pero la interpolación presenta un problema de interpolación hacia el oeste y este de la ciudad por ausencia de datos, por lo que esto puede afectar la precisión de la información, ya que se cuenta solo con información de 3 estaciones, las cuales geométrica y geográficamente están alineadas en el centro de la ciudad, teniendo que estimar la información de la periferia de la ciudad. Dado que los óxidos de nitrógeno (NOX) se generan principalmente por procesos de combustión, uno de sus principales productores de esta partícula la combustión generada por automóviles. El centro de la ciudad al ser una zona con alta congestión vehicular, por diversas actividades comerciales y de igual forma el norte de la ciudad presenta valores altos de concentraciones de NOX, esto se puede deber por la presencia del terminal de transportes, la congestión en salidas a otros municipios, las actividades industriales de otros municipios y por ultimo las quemas e incendios forestales aporta a la concentración de esta partícula contaminante.
5.2.4. Material Particulado 10 μm (PM10) El mapa de PM10 muestra que toda la ciudad supera el valor promedio óptimo de exposición de 12µg/m3 de este tipo de partículas contaminantes. Esto puede deberse a diversos focos contaminantes como la generada por automóviles y transporte público, como por causa de las industrias en la comuna 4 y otras actividades de los municipios al norte de Cali. En el mapa resaltan las comunas 14 y 21 por sus valores elevados de PM10, como se comentó en la descripción del mapa, esto se puede deber a la presencia de escombreras y la planta de Puerto Mallarino. El resto de mapa es “homogéneo”, lo cual se puede deber a la ubicación de las estaciones de monitoreo y falta de algunos nodos complementarios. También podría indicar que la forma de dispersión de esta partícula sea homogénea o que los focos de contaminación sean fuentes móviles como el transporte público o de alguna estas partículas por su tamaño pueden “viajar” o desplazarse más fácilmente por la acción del viento en la ciudad.
Ing. Ricardo Rodriguez Otero
106
5.2.5. Material Particulado 2.5 μm (PM2.5) El mapa de PM2.5 muestra que en promedio la ciudad excede el valor máximo de exposición de 10µg/m3, siendo las comunas al sur de la ciudad y la comuna 21 las zonas de valores promedio más bajos. Esto se puede deber a que no son áreas tan comerciales o activas y con mayor presencia de árboles. A diferencia del centro y norte de la ciudad que presentan valores promedio más elevados, en particular la comuna 13 donde antes se encontraba el relleno sanitario Navarro. Las causas de estos valores pueden deberse a las escombreras ilegales de la zona, quemas de diversos materiales en particular en barrios de invasión. También se debe considerar la presencia del terminal de transporte en la comuna 2 y los focos fijos de las industrias en la 4 y municipios vecinos, como principales de focos contaminantes en relación con material particulado al norte de la ciudad De igual forma que con otras partículas contaminantes, se presenta el principal problema de una red de monitoreo poco densa y consistente y en algunos casos los datos en el tiempo tampoco son consistentes, por lo que la interpolación puede tener baja precisión en algunas zonas de la ciudad. Adicionalmente, es de tener en cuenta que esta partícula puede verse afectada en su propagación y concentración por efectos climáticos como la precipitación o lluvia y vientos, estos últimos no se analizaron en este estudio.
5.3.
ANÁLISIS DE DATOS CLIMATOLÓGICOS EN CALI.
Como resultado del análisis de datos climatológicos de Cali, se obtuvieron 2 mapas, que corresponden a los días de lluvia promedio anual y a la precipitación total promedio anual en Cali, en ambos mapas se observa que el norte y centro de la ciudad presentaron la menor cantidad de días de lluvia y una precipitación menor con respecto al resto de la ciudad, a pesar de que ambas interpolaciones son muy parecidas gráficamente, por causa de la ubicación de las estaciones climáticas, cada mapa maneja una variable diferente y una escala diferente de valores, por lo cual no habría motivo para descartar dicha información. Dada la forma y extensión de la ciudad, se pueden presentar microclimas en diferentes áreas de la ciudad, lo cual puede influir en la forma en que interactúan las partículas contaminantes e IRA, dado que cada partícula contaminante tiene propiedades fisicoquímicas muy diferentes. A pesar de que la red de monitoreo climático esta mejor distribuida que la Ing. Ricardo Rodriguez Otero
107
ambiental, no cuenta con nodos en la periferia, lo cual puede afectar la interpolación de cada una de las variables climáticas.
5.4.
REGRESIÓN LINEAL (MÍNIMOS CUADRADOS ORDINARIOS - OLS) EN CALI.
Al analizar el mapa resultante del modelo OLS, el cual agrupa de forma global las variables ya mencionadas en este estudio, el modelo solo puede explicar el 9.2 % de los casos totales de IRA analizados. Esto puede deberse a que faltó información de varias partículas contaminantes en el periodo de tiempo estudiado. Adicionalmente, para este estudio no se tuvo en cuenta la malla vial, ni es preciso el valor de partículas contaminantes aportadas por el tráfico y transporte público de la ciudad. El mapa muestra la distribución de la correlación de casos de IRA y partículas contaminantes a lo largo de la ciudad donde la periferia de la ciudad presenta los valores más altos en términos de la desviación estándar. A diferencia de los mapas anteriores, esta combina de forma uniforme la información de los demás mapas en un modelo de regresión global. Estos valores altos pueden significar las áreas que realmente se encuentran afectadas por IRA relacionada por partículas contaminantes, que a su vez son las áreas residenciales más pobladas de la ciudad. Las áreas de valores bajos en la desviación estándar pueden corresponder a los sitios con concentración de casos IRA y baja exposición a partículas contaminantes, aunque en el norte de la ciudad puede ser lo contrario, pocos casos con altas exposición a partículas contaminantes. Esto es difícil de determinar dado que la red de monitoreo no es lo suficientemente densa y esto influyó en la información de algunas partículas contaminantes, reduciendo la precisión de la regresión. Los sectores de la ciudad con valores intermedios o entre -0.5 y 0.5 están distribuidos en la mayoría de la ciudad, lo cual puede significar que los focos de contaminación son puntuales o que la población afectada de estos sectores no esa expuesta directamente a estos focos contaminantes o es población flotante de estos focos. En otras palabras realizan viajes esporádicos al centro y norte de la ciudad o la causa de IRA puede no tener relación alguna con la contaminación atmosférica de la ciudad.
Ing. Ricardo Rodriguez Otero
108
5.4.1. Regresión Lineal (Regresión Ponderada Geográficamente GWR). Lo que se puede extraer del mapa del modelo de regresión local lineal usando el método de regresión ponderada geográficamente o GRW, es que el norte y centro de la ciudad son las áreas que más presentan cambios en términos de desviación estándar tanto por la presencia de valores muy bajos, como de valores altos en varios barrios de las comunas 1 a la 14, lo cual es un resultado diferente al obtenido en el mapa del modelo OLS. Esto se puede deber a, como se ha indicado en mapas anteriores, a la concentración de varias partículas contaminantes posiblemente por la cercanía a los municipios de Palmira y Yumbo, las quemas de los residuos de palma de azúcar y la cercanía con la zona industrial del municipio de Yumbo. En adición a lo anterior, son zonas con alta influencia del tráfico y transporte público por ser la salida hacia el norte del departamento y son áreas de comerciales con mucha población flotante. Es de tener en cuenta que las variables usadas en el modelo se determinaron a partir de la Tabla 18 y la Tabla 19, dado que estas tablas muestran la evaluación y comportamiento estadístico de las variables usadas en el modelo. Por último, se debe tener en cuenta que tanto al norte y centro de la ciudad se presentaron una menor cantidad de días de lluvia y precipitaciones por lo que el factor climático también puede tener influencia en la propagación de IRA y la exposición a partículas contaminantes.
5.5. •
RESPUESTAS A PREGUNTAS DE INVESTIGACIÓN.
¿Cuáles son las zonas con mayor contaminación en el aire en Cali?
Las zonas con mayor contaminación atmosférica son el centro y norte de ciudad desde la comuna 9 a la comuna 2 y el sector de las comunas 13, 14 y 21.
•
¿En qué épocas del año se presenta mayor concentración de partículas
contaminantes y qué factores pueden influir en las altas concentraciones? La respuesta a esta pregunta se encuentra en la Ilustración 7, Ilustración 13, Ilustración 19, Ilustración 24 y la Ilustración 30, que corresponden a las series de tiempo de cada una de las partículas contaminantes evaluadas en este estudio. En adición, se sugiere revisar las series
Ing. Ricardo Rodriguez Otero
109
de tiempo de las variables climatológicas representadas en la Ilustración 36 y la Ilustración 42.
•
¿En cuáles barrios de la ciudad de Cali se presenta mayor cantidad de IRA en
sus habitantes? ¿Estas áreas coinciden con las de mayor contaminación atmosférica? Serían los barrios periféricos y con áreas residenciales extensas. Una respuesta más específica a esta pregunta se puede encontrar en la Tabla 6, Tabla 7 y en Tabla 8 que muestran de forma globa la calificación de cada barrio analizado
•
¿Cómo varían las concentraciones de partículas contaminantes en el tiempo?
La respuesta a esta pregunta la encontrara en la Ilustración 7, Ilustración 13, Ilustración 19, Ilustración 24 y la Ilustración 30, que corresponden a las series de tiempo de cada una de las partículas contaminantes evaluadas en este estudio.
Ing. Ricardo Rodriguez Otero
110
6. CONCLUSIONES Y RECOMENDACIONES 6.1.
CONCLUSIONES
En el desarrollo de esta investigación, a partir de la metodología propuesta y la implementación del análisis se cumplió el objetivo principal, ya que gracias al análisis de puntos calientes y clúster de los casos de IRA en Cali y no solo con la cantidad de casos por tipo de IRA, sino también frente a otras variables socioeconómicas en relación con la edad y sexo de los afectados se demostró la relación directa de la exposición ante las contaminantes en el ambiente, factores climáticos como la precipitación e intensidad de la misma y su influencia en los casos de IRA en Cali. Del análisis de puntos calientes y clúster realizado se puede concluir que los barrios periféricos de Cali son los sitios con mayor cantidad de casos y que las áreas centrales de Cali tienen menor cantidad, pero distribuidos en mayor cantidad de barrios. Se evidenció que, de cada 10 personas afectadas por IRA, 6 son mujeres y que las afectadas están principalmente en las áreas centrales de la ciudad. También se evidenció que los niños de 0 a 5 años y las personas mayores de 50 son las poblaciones más afectadas por IRA en Cali. Del análisis de las partículas contaminantes se concluye que la contaminación por partículas finas en toda la ciudad supera en más del doble los niveles de exposición en el largo plazo recomendados por la OMS. También se puede concluir que los barrios de las comunas al oriente de Cali o los colindantes con el Río Cauca y los municipios de Yumbo y Palmira registran en su mayoría, las concentraciones más altas de las partículas contaminantes evaluadas. Del análisis de las variables climatologías, se concluye que el sur de Cali es el área con mayor precipitación y número de días, adicionalmente los años 2010 y 2011 coinciden con la mayor cantidad de casos de IRA, por lo que se estima que el clima tiene una alta influencia en la aparición de casos de IRA en esta ciudad. Sin embargo, se debe considerar que la precipitación, de forma combinada con las partículas contaminantes, agravar enfermedades respiratorias como asma, entre otras de este tipo. En el análisis geoestadístico realizado a cada partícula contaminante, se encontró que en las áreas céntricas de la ciudad durante los meses de fin de año presentan las concentraciones más altas de partículas finas. No obstante, no fue posible identificar otros ciclos temporales de las demás partículas por falta de información a causa del tiempo fuera de servicio de las Ing. Ricardo Rodriguez Otero
111
estaciones, que no todas colectan los mismos datos y que la red de monitoreo no es lo suficientemente densa para tener información más precisa y detallada. A partir de los modelos de regresión lineal espacial, se concluye que los modelos globales no son tan precisos como los locales, pero para tener resultados óptimos estos modelos deben ser complejos al combinar varias variables explicativas. En el caso del modelo global aplicado, las variables explicativas de las partículas contaminantes muestran una influencia sobre los casos de IRA, lo cual sugiere que, si hay una posible relación entre IRA y partículas contaminantes, pero la precisión de esta influencia se afecta por falta de información en algunas áreas y que en algunos casos los datos fueron recolectados por 3 o 4 de las 9 estaciones, lo cual en términos de distancia puede afectar a los cálculos del modelo, por lo que este modelo no es satisfactorio, por su baja probabilidad de explicación de los casos de IRA con las variables usadas. Adicionalmente, la forma en que se registra la información de los pacientes también puede afectar el resultado, a pesar de que esta información es discreta en comparación a las otras variables y aunque fue necesario agrupar la información por barrios, esto reduce la precisión del resultado. A diferencia de las variables de partículas contaminantes, las variables explicativas relacionadas con los casos de IRA presentan una mayor influencia en el modelo global, por lo cual se puede concluir que, por la edad, estrato socioeconómico del barrio del paciente y el género, hay poblaciones más vulnerables que otras. De los modelos locales se puede concluir que pueden dar información más específica sobre un fenómeno, pero es necesario seleccionar las variables con el mejor rendimiento para evitar problemas de coliniaridad entre ellas, dificultando el análisis, por la redundancia de información que se puede presentar a nivel local. Es evidente que la variación en el R2 local donde en algunos barrios el modelo logra explicar un 62 % de los casos, en otros solo se alcanza el 5%, esto se explica por la falta de información de varias de las partículas contaminantes, como los óxidos de carbono (COX) los cuales provienen de la combustión de gasolina y diésel de los medios de transporte. Se debe considerar que no se analizaron el grado de arborización de los barrios de Cali. Al igual que el modelo global, se puede concluir que, en los casos de IRA, independiente de las diferencias del número de casos, tanto observados como estimados por los modelos, sí se Ing. Ricardo Rodriguez Otero
112
manifiesta una relación entre la concentración de partículas contaminantes y los casos de IRA. En un principio se pensó analizar cuáles eran las áreas en Cali con mayor densidad de población afectadas por IRA, dado que esa información no se encuentra a nivel de la unidad mínima espacial de la investigación y que los rangos temporales son proyecciones estadísticas genéricas, por lo cual no es recomendable hacer ese tipo de análisis. Es así como solamente se trabajó con los registros de casos de IRA. En futuros estudios para un análisis poblacional y casos de IRA se debe buscar la forma de que el registro de información de los pacientes sea más específico y detallado.
6.2.
RECOMENDACIONES
Para futuros modelos de regresión espacial, se recomienda el uso de la regresión logística, aunque este tipo de regresión funciona exclusivamente con superficies de interpolación o datos Raster, por lo que se requiere trabajo adicional en el cálculo de los coeficientes de cada una de las variables. Así mismo se recomienda que de manera adicional, se incorpore o agregar información o variables relacionadas con el transporte público y el parque automotor de Cali. Por último, se recomienda agregar más variables dicotómicas, como presencia o no de árboles, presencia o no de transporte publico entre otras variables, teniendo en cuenta que la información debe estar a una escala menor a 1:100,000. Adicionalmente, se recomienda para futuras investigaciones incluir información de partículas contaminantes como los óxidos de carbono (COX) entre otras partículas, debido a que agregar nuevas variables hará más fácil la cuantificación del impacto de la contaminación atmosférica y relación con IRA. De igual forma también se recomienda que se analice la interacción del viento con cada una de las partículas contaminantes. Por otra parte, se recomienda a las entidades que aportaron información para esta investigación que realicen una actualización en los métodos y equipos empleados en la recolección de datos. De manera particular se le recomienda al DAGMA, en tanto es el ente municipal encargado del monitoreo ambiental de la ciudad, densificar la red de monitoreo y de actualizar cada una de las estaciones para que todas colecten la misma información de partículas contaminantes, así como los mismos datos climatológicos como humedad, fuerza y dirección del viento, entre otros datos. Ing. Ricardo Rodriguez Otero
113
Se recomienda a la Secretaría de Salud de Cali una mejora a la forma de recolección de información epidemiológica de IRA u otras enfermedades, ya que esta información con la cual se desarrolló el presente estudio proviene de 4 fuentes diferentes, por lo que se debe unificar esta información o crear un mecanismo de registro de información epidemiológica centralizado. También se debe considerar el agregar información de la dirección del paciente tanto de su residencia como de su entorno diario, lo cual permitiría identificar las áreas afectadas con mayor facilidad.
Ing. Ricardo Rodriguez Otero
114
7. REFERENCIAS BIBLIOGRÁFICAS Ahmad, K., Abdulla, A. y Koas, A. (2010). GIS-based Mapping and Statistical Analysis of Air Pollution and Mortality in Brisbane, Australia. Queensland University of Technology. Alfonso, Q. P., Saury, T. M. y Belisario, P. R. (2013). Determinación de Metales y Material Particulado PM 2.5 en muestras del aire de Villa del Rosario-Norte de Santander. Determination of Metals and Particulate Matter PM 2.5 in Air Samples from Villa Del Rosario, North Santander., 11(2), 40–50. Accedido el 4 de julio de 2017, en http://search.ebscohost.com/login.aspx?direct=true&db=fua&AN=100117786&lang= es&site=ehost-live Anselin, L. (1995). Local Indicators of Spatial Association-LISA. Geographical Analysis, 27(2), 93–115. Anselin, L. (1996). Interactive techniques and exploratory spatial data analysis. In Geographical Information Systems (2nd ed., pp. 253–266). JOHN WILEY & SONS, INC. Accedido el 30 de marzo de 2017 en http://www.geos.ed.ac.uk/~gisteac/gis_book_abridged/files/ch17.pdf Aponte, C. H., Silva, J. P. y Laín, S. (2010). Inventario de emisiones de contaminantes atmosféricos primarios de fuentes fijas puntuales en la Comuna 4 de la ciudad de Cali. El Hombre y La Máquina, 34(1), 106–114. Accedido el 24 de febrero de 2017, en http://www.redalyc.org/articulo.oa?id=47817108011 Arcia, M. M., Martínez, J. I. y Isaguirre, R. D. (2005). Análisis estadístico y análisis espacial sobre la precipitación ocurrida en los departamentos de Leon, Chinandega Y Managua, Nicaragua (1984-2005). Universidad Nacional Autónoma De NicaraguaLeón. Aya Vásquez, D. A. y Correa Ortega, J. M. (2012). Concentración Industrial en la Ciudad de Cali y su Área Conurbada 2012. Revista de Economía & Administración, 14(1), 31–43. Baccarelli, A. A., Hales, N., Burnett, R. T., Jerrett, M., Mix, C., Dockery, D. W. y Pope, C. A. (2016). Particulate air pollution, exceptional aging, and rates of centenarians: A nationwide analysis of the United States, 1980-2010. Environmental Health Perspectives, 124(11), 1744–1750. https://doi.org/10.1289/EHP197 Bereitschaft, B. y Debbage, K. (2013). Urban Form, Air Pollution, and CO 2 Emissions in Large U.S. Metropolitan Areas. The Professional Geographer, 65(March 2015), 612– 635. https://doi.org/10.1080/00330124.2013.799991 Botero, S., Tróchez, A. y Olaya, J. (2004). Contaminación por Particulas Suspendidas Totales en las comunas 6 y 7 de Cali, Colombia:Un modelo estadístico para la Evaluación de la Calidad del Aire. Ingenierría de Recursos Naturales, (2), 17+. Buzai, G. (2014). El Análisis espacial Multivariado: 6.5.Análisis Cluster. En Monica Ing. Ricardo Rodriguez Otero
115
Erlich (Ed.), Mapas Sociales Urbanos (1st ed., pp. 191–199). Ciudad Autonoma de Buenos Aires: Lugar Editorial. Buzai, G. (2015). Análisis Espacial en Geografia de la salud: resoluciones con sistemas de información geográfica (1st ed.). Ciudad Autonoma de Buenos Aires: Lugar Editorial. Buzai, G. y Baxendale, C. (2013). Análisis Socio-espacial con Sistemas de Información Geográfica. XIV Conferencia iberoamericana de sistemas de informacion geografica. Chasco, C. (2009). Análisis Exploratorio de Datos Espaciales al Servicio del Geomarketing. In III Seminario sobre Nuevas Tecnologías en la Investigación, el Marketing y la Comunicación. e-Participación (p. 21). Accedido el 31 de mayo de 2017, en http://dds.cepal.org/infancia/guide-to-estimating-childpoverty/bibliografia/capitulo-IV/Chasco Coro (2009) Analisis exploratorio de datos espaciales al servicio del Geomarketing.pdf Da Silva, J. y Cardozo, O. (2016). Análisis espacial del precio del suelo con modelos de regresión lineal múltiple ( MRLM ) y Sistemas de Información Geográfica ( SIG ), Resistencia ( Argentina ). Revista Geográfica de Valparaíso, 51(October 2015), 57– 74. Accedido el 23 de enero de 2018, en http://geografiapucv.cl/wpcontent/uploads/2016/05/51_4.pdf Dávalos, E. (2007). La caña de azúcar: ¿una amarga externalidad? *. Desarrollo y Sociedad, (1), 117–164. Departamento Administrativo de Planeación. (2014). Cali en cifras 2013. Cali. Accedido el 1 de mayo de 2017, en http://www.cali.gov.co/planeacion/publicaciones/cali_en_cifras__pub ESRI, Environmental Systems Research Institute. (s.f.). Mínimos cuadrados ordinarios (OLS)—ArcGIS Pro | ArcGIS Desktop. Accedido el 23 de enero de 2018, en http://pro.arcgis.com/es/pro-app/tool-reference/spatial-statistics/ordinary-leastsquares.htm Fang, C., Liu, H., Li, G., Sun, D. y Miao, Z. (2015). Estimating the Impact of Urbanization on Air Quality in China Using Spatial Regression Models. Sustainability, 7(12), 15570–15592. https://doi.org/10.3390/su71115570 Getis, A. y Ord, J. K. (2010). The Analysis of Spatial Association by Use of Distance Statistics. Geographical Analysis, 24(3), 189–206. https://doi.org/10.1111/j.15384632.1992.tb00261.x Giraldo, R. (2011). 4. Predicción Espacial. In Introducción a la geoestadistica (1st ed., p. 94). Bogotá: Universidad Nacional de Colombia,Facultad de Ciencias Departamento de Estadística. Gorai, A., Tchounwou, P. y Tuluri, F. (2016). Association between Ambient Air Pollution and Asthma Prevalence in Different Population Groups Residing in Eastern Texas, USA. International Journal of Environmental Research and Public Health, (13), 18. https://doi.org/10.3390/ijerph13040378 Ing. Ricardo Rodriguez Otero
116
Guo, D. y Mennis, J. (s.f.). Spatial data mining and geographic knowledge discovery—An introduction. Computers, Environment and Urban Systems, 33(6), 403-408. https://doi.org/10.1016/j.compenvurbsys.2009.11.001 Hernández Cadena, L., Téllez Rojo, M. M., Sanín Aguirre, L. H., Lacasaña Navarro, M., Campos, A. y Romieu, I. (2000). Relación entre consultas a urgencias por enfermedad respiratoria y contaminación atmosférica en Ciudad Juárez, Chihuahua. Salud Pública de México, 42(4), 288–297. https://doi.org/10.1590/S0036-36342000000400003 Huang, G. y Huang, G. (2012). Dynamic analysis for geographical profiling of serial cases based on bayesian-time series. Journal of Software, 7(6), 1242–1249. https://doi.org/10.4304/jsw.7.6.1242-1249 Jaramillo, M., Núñez, M. E. y Ocampo, W. (2004). Inventario de emisiones de contaminantes atmosféricos convencionales en la zona de Cali-Yumbo Inventory of conventional atmospheric pollutant emissions in the Cali-Yumbo zone. Revista Facultad de Ingeniería, Universidad de Antioquia, (31), 38–48. Jasarevic, T., Thomas, G. y Osseiran, N. (2014). 7 millones de muertes cada año debidas a la contaminación atmosférica. OMS Accedido el 9 de enero de 2017, en http://www.who.int/mediacentre/news/releases/2014/air-pollution/es/ Joly, D. (2010). Spatial Analysis, Cartography and Climate. In P. (Carrega (Ed.), Geographical Information and Climatology (first, pp. 29–69). ISTE Ltd and Jhon Wiley & Sons, Inc. Kefi, M., Yoshino, K. y Setiawan, Y. (2012). Assessment and mapping of soil erosion risk by water in Tunisia using time series MODIS data. Paddy and Water Enviroment, (10), 59–73. https://doi.org/10.1007/s10333-011-0265-3 Krivoruchko, K. (2011). Spatial Statistical Data Analysis for GIS Users Spatial Statistical Data Analysis for GIS Users. (ESRI, Ed.). Ingram Publisher Services. Lavado, J. C. (2015). Evaluacion de Autocorrelación Espacial Global y Local para Zonas de Transito. In Rede Ibero-americana de Estudo em Polos Geradores de Viagens Red PGV / Brasil RESUMEN (p. 14). Lee, S. S. y Wong, N. S. (2010). Reconstruction of epidemic curves for pandemic influenza A (H1N1) 2009 at city and sub-city levels. Virology Journal, 7, 321. https://doi.org/10.1186/1743-422X-7-321 Levine, N. (1996). Spatial statistics and GIS: Software tools to quantify spatial patterns. Journal of the American Planning Association, 62(3), 192–381. https://doi.org/10.1080/01944369608975702 Li, L., Zhang, X. y Piltner, R. (2008). An application of a shape function based spatiotemporal interpolation method to ozone and population-based environmental exposure in the contiguous U.S. Journal of Environmental Informatics, 12(2), 120– 128. https://doi.org/10.3808/jei.200800130 Lindström, J., Szpiro, A. A., Sampson, P. D., Oron, A. P., Richards, M., Larson, T. V, … Ing. Ricardo Rodriguez Otero
117
Sheppard, · L. (2014). A flexible spatio-temporal model for air pollution with spatial and spatio-temporal covariates. Environ Ecol Stat, 21, 411–433. https://doi.org/10.1007/s10651-013-0261-4 Mas, J.-F. (2018). Análisis espacial con R: Usa R como un Sistema de Información Geográfica. (G. Cuevas García and R. Hewitt, Eds.). European Scientic Institute. Accedido el 13 de agosoto de 2018, en https://eujournal.org/files/journals/1/books/JeanFrancoisMas.pdf Melo, E. C. y de Freitas Mathias, T. A. (2010). Distribución y auto-correlación espacial de indicadores de la salud de la mujer y del niño en el estado de Paraná , Brasil. Rev. Latino-Am. Enfermagem, 18(6), 10. Mustaffa, Z. y Yusof, Y. (2011). A comparison of normalization techniques in predicting dengue outbreaik. International Conference on Business and Economics Research, 1, 345–349. Nejadkoorki, F. y Nicholson, K. (2012). Integrating passive sampling and interpolation techniques to assess the spatio-temporal variability of urban pollutants using limited data sets. Environmental Engineering and Management Journal, 11(9), 1649–1655. Olson, D. L., Moshkovich, H. y Mechitov, A. (2008). Fuzzy Sets in Data Mining an Ordinal Classification. In K. D. Lawrence, S. Kudyba and R. K. Klimberg (Eds.), Data Mining Methods and Applications (pp. 239–252). Auearbach Publications Taylor & Francis Group. OMS, Organización mundial para la Salud. (2005). Guías de calidad del aire de la OMS relativas al material particulado, el ozono, el dióxido de nitrógeno y el dióxido de azufre Actualización mundial 2005 Resumen de evaluación de los riesgos.OMS. Accedido el 7 de julio de 2016, en https://apps.who.int/iris/bitstream/handle/10665/69478/WHO_SDE_PHE_OEH_06.0 2_spa.pdf;sequence=1 OMS, Organización mundial para la Salud. (2006). Guías de calidad del aire de la OMS relativas al material particulado, el ozono, el dióxido de nitrógeno y el dióxido de azufre. Actualización mundial 2005. Ginebra, Suiza: OMS. Accedido el 21 de marzo de 2018, en http://www.who.int/phe/health_topics/AQG_spanish.pdf Onofrio, A., Mazzetta, C., Robertson, C., Smans, M., Boyle, P. y Boniol, M. (2016). Maps and atlases of cancer mortality : a review of a useful tool to trigger new questions. ECancer, 1–19. https://doi.org/10.3332/ecancer.2016.670 Ordóñez, C., Varela, M. R. y Reyes, A. (2011). Desarrollo de un SIG para el análisis de patrones espaciales de incendios en viviendas. III Jornadas de SIG Libre, (11), 1–18. Accedido el 16 de noviembre de 2017 en http://geofocus.rediris.es/2011/Articulo1_2011.pdf Páez, A. y Scott, D. M. (2004). Spatial statistics for urban analysis : A review of techniques with examples. GeoJournal, (61), 53–67. Pantaleoni, E. (2013). Combining a road pollution dispersion model with GIS to determine Ing. Ricardo Rodriguez Otero
118
carbon monoxide concentration in Tennessee. Environ Monit Assess, (185), 2705– 2722. https://doi.org/10.1007/s10661-012-2742-6 Pennekamp, C. (1999). Cartographic rules for visualisation of time related geographical data sets. Piro, F. N., Madsen, C., Næss, Ø., Nafstad, P. y Claussen, B. (2008). A comparison of self reported air pollution problems and GIS-modeled levels of air pollution in people with and without chronic diseases. Environmental Health : A Global Access Science Source. https://doi.org/10.1186/1476-069X-7-9 Rico, M. N., Céspedes, C., Espina, R., Espíndola, E., Fernández, F. y Alejandra, S. (2014). Guía para estimar la pobreza infantil: La distribución espacial de la pobreza infantil. Accedido el 9 de noviembre de 2017 en http://dds.cepal.org/infancia/guia-paraestimar-la-pobreza-infantil/guia-contenido-442.php Robayo, R. A., Mattey, P. E., Silva, Y. F., Burgos, D. M. y Delvasto, S. (2015). Los residuos de la construcción y demolición en la ciudad de Cali: un análisis hacia su gestión, manejo y aprovechamiento. Tecnura, 19(44), 157–170. https://doi.org/10.14483/udistrital.jour.tecnura.2015.2.a12 Rodríguez, J. (2009). Contaminación ambiental y enfermedades respiratorias. Métodos En Ecología y Sistemática, 4(1), 29–34. Romero, M., Bermejo, P., Lacasaña, M., Rojo, M., Aguilar, J. y Romieu, I. (2004). Contaminación atmosférica, asma bronquial e infecciones respiratorias agudas en menores de edad, de La Habana. Salud Pública de México, 46(3), 222–233. Rosales, J., Torres, V. y Olaiz, G. (2001). Los efectos agudos de la contaminacion del aire en la salud de la poblacion: evidencia de estudios epidemiologicos. Instituto Nacional de Salud Pública, 43(623). Accedido el 6 de julio de 2016 en https://www.scielosp.org/pdf/spm/2001.v43n6/544-555 Samet, J. (2014). Some current challenges in research on air pollution y health. Salud Pública de México, 56(4), 379–386. Accedido el 9 de enero de 2017 en http://www.medigraphic.com/pdfs/salpubmex/sal-2014/sal144i.pdf Sánchez, J., Urrego, J., Ildefonso, C., Caraballo, L., Zakzuk, J. y Bornacelly, A. (2013). Niveles de Contaminantes en el aire de Cartagena, Colombia. Revista de La Universidad Industrial de Santander. Salud, 45(3), 35–44. Senthil, M. kumar, Sivasankar, V. y Gopalakrishna, G. V. T. (2017). Quantification of benzene in groundwater sources and risk analysis in a popular South Indian Pilgrimage City – A GIS based approach. Arabian Journal of Chemistry, 10, S2523– S2533. https://doi.org/10.1016/j.arabjc.2013.09.022 Shad, R., Ashoori, H. y Afshari, N. (2008). Evaluation of Optimum Methods for Predicting Pollution Concentration in Gis Environment. International Archives of the Photogrammetry, Remote Sensing and Spatial Information Sciences., XXXVII.(2), 315–320. Ing. Ricardo Rodriguez Otero
119
Sotelo, Y. F., Caicedo, K. L. y Zapata, H. (2013). Mortalidad por enfermedades respiratorias agudas en niños menores de 6 años en dos municipios del Valle del Cauca , con alta y baja contaminación atmosférica , durante 2008 y 2009. Ciencia y Salud, 2(6), 29–32. Superczynski, S. D. y Christopher, S. A. (2011). Exploring land use and land cover effects on air quality in Central Alabama using GIS and remote sensing. Remote Sensing, 3(12), 2552–2567. https://doi.org/10.3390/rs3122552 Tsai, P.-J., Lin, M.-L., Chu, C.-M. y Perng, C.-H. (2009). Spatial autocorrelation analysis of health care hotspots in Taiwan in 2006. BMC Public Health, 9(1), 464. https://doi.org/10.1186/1471-2458-9-464 Valencia, J., Espinosa, A., Parra, A. y Peña, M. (2011). Percepción del riesgo por emisiones atmosféricas provenientes de la disposición nal de residuos sólidos Perception of risk arising from atmospheric emissions from an open solid-waste disposal site. Rev. Salud Pública, 13(6), 930–941.
Ing. Ricardo Rodriguez Otero
120
8. ANEXOS Tabla 21. Puntos fríos de IRA Índice GETIS ORD GI*.
Barrio San Pascual Los Libertadores Porvenir Jorge Isaacs Salomia La Esmeralda El Sena Los Parques Barranquilla Base Aérea Parque de la Caña Simón Bolívar Las Américas Rafael Uribe Primitivo Crespo Municipal Benjamín Herrera Saavedra Galindo El Troncal Santa Fé Santa Mónica Popular Atanasio Girardot La Floresta Industrial El Trébol Manuel María Buenaventura Belalcázar Santa Mónica Belalcázar Guayaquil Sucre Junín Barrio Obrero Alameda Aranjuez San Cristóbal Las Acacias Colseguros Andes Santa Elena El Prado 20 de Julio Alfonso Barberena A.
comuna 03 03 04 04 04 04 05
Cod_Event 1 3 3 5 3 1 3
GiZScore -3.98957548 -3.30036462 -3.83083386 -3.67124135 -5.03384276 -2.81587176 -3.36899606
GiPValue NNeighbors 6.61917E-05 155 0.000965593 196 0.00012771 87 0.000241375 95 4.80744E-07 95 0.004864508 87 0.000754425 90
05 07 07 08 08 08 08 08 08 08 08 08
3 5 5 3 3 3 3 2 1 3 1 3
-2.52410977 -4.93864378 -3.4210055 -5.48944462 -4.27676556 -5.84516669 -5.3384405 -4.24412889 -5.41625448 -8.2258971 -4.0943874 -5.85338767
0.01159917 7.86678E-07 0.000623901 4.032E-08 1.89628E-05 5.06061E-09 9.37495E-08 2.19444E-05 6.08605E-08 0 4.23286E-05 4.8166E-09
109 107 110 131 123 130 139 125 118 129 113 146
-1 -3 -3 -3 -3 -3 -3 -3 -3 -3 -3 -3
08 08 08 08 08
3 3 3 3 3
-5.78788745 -5.58917412 -5.76233929 -3.05321279 -2.70633604
7.12771E-09 2.28152E-08 8.2956E-09 0.002264053 0.006803017
141 143 134 85 142
-3 -3 -3 -2 -1
09 09
2 -5.85338767 3 -5.94959534
4.8166E-09 2.68806E-09
146 141
-3 -3
09 09 09 09 09 09 09 10 10 10 10 11 11
3 3 3 3 3 3 3 5 1 3 3 5 3
-3.64927271 -3.67996539 -4.19538018 -3.3303329 -5.14862632 -4.21155825 -2.99790939 -4.22166902 -5.70267407 -3.7106283 -2.8020533 -4.33251647 -4.80286479
0.000262984 0.000233266 2.72414E-05 0.000867422 2.62401E-07 2.53615E-05 0.002718385 2.425E-05 1.17942E-08 0.000206745 0.005077848 1.47415E-05 1.56412E-06
144 155 151 159 114 162 162 149 137 139 132 141 132
-3 -3 -3 -3 -3 -3 -2 -3 -3 -3 -2 -3 -3
12
3 -3.83477043
0.000125682
155
-3
Ing. Ricardo Rodriguez Otero
Gi_Bin -3 -2 -3 -3 -3 -2 -3
121
Asturias Fenalco Kennedy Miraflores
12 12 19
3 -3.65319671 3 -2.93103757 3 -3.74095599
0.000258996 0.003378319 0.000183322
172 170 178
-3 -2 -3
San Fernando Nuevo Eucarístico Urbanización Colseguros Santa Isabel Los Cámbulos
19 19
1 -3.48153818 3 -3.25551382
0.000498543 0.001131874
131 122
-3 -2
19 19 19
3 -3.25532691 3 -2.72063147 3 -2.45089308
0.001132619 0.006515736 0.014250228
151 247 134
-2 -1 -1
Tabla 22. Barrios con clústeres “bajos” de IRA Índice local Moran.
Barrio Altos de Menga San Vicente Santa Rita San Pascual Santa Rosa La Esmeralda Metropolitano del Norte Villa del Prado - El Guabito Los Guaduales Chapinero Municipal Benjamín Herrera El Troncal
Manuel Maria Buenaventura Las Acacias Prados de Oriente La Esperanza San Carlos Bello Horizonte El Poblado II El Pondaje Puerta del Sol Laureano Gómez Los Portales Nuevo Rey
Comuna
Cod_Event
02 02 02 03 03 04
2 1 1 1 1 1
05
LMiIndex
LMiZScore
LMiPValue
3.408556831 13.61015188 13.67011809 68.58629884 82.10511134 27.41528546
2.023320986 3.352675917 4.304090333 8.196269668 9.019492464 5.317469183
0.044 0.044 0.02 0.002 0.002 0.002
COType
NNeighbors
LL LL LL LL LL LL
40 48 88 134 134 59
2 6.772623223 2.839821538
0.044 LL
87
05
1
123.255436 11.41994444
0.002 LL
81
06 08 08
2 17.08400317 4.159241681 1 13.81434725 3.782314254 2 6.950800162 2.701869312
0.002 LL 0.002 LL 0.004 LL
97 113 86
08 08
1 27.55455955 5.130685442 1 54.93132468 7.727661882
0.002 LL 0.002 LL
96 74
09 10
2 3.498053129 1.887585409 1 27.46303103 5.836218862
0.036 LL 0.002 LL
125 109
11 11 11
1 27.45595242 4.880324127 2 6.834146057 2.827833707 2 17.07473647 4.028207137
0.002 LL 0.032 LL 0.006 LL
109 101 122
12 13 13 14
1 2 2 2
0.002 0.022 0.002 0.01
LL LL LL LL
130 130 150 115
15
2
0.002 LL
94
17
2 3.471714147
0.034 LL
131
Ing. Ricardo Rodriguez Otero
27.43159978 6.854589852 13.66488857 10.23756963
4.854842654 2.520913151 4.267489746 3.213167264
13.6925543 3.816858939 1.84857993
122
El Gran Limonar Lourdes
17 18
1 54.8302144 7.914887861 2 3.412233593 1.902366155
0.002 LL 0.042 LL
139 89
Santa Bárbara 19 El Lido 19
2 10.17590587 3.061556011 2 17.11980753 4.094189303
0.016 LL 0.004 LL
113 252
San Fernando Nuevo 19
1 95.97708075 10.16757521
0.002 LL
102
Tabla 23. Barrios con clústeres “Altos” de IRA Índice local Moran.
Barrio Vista Hermosa Sector Patio Bonito Sector Altos de Normandia Bataclán La Campiña La Paz Juanambú Granada El Piloto El Hoyo La Merced El Nacional El Calvario Evaristo Garcia Guillermo Valencia Chiminangos I Petecuy II Fonaviemcali Petecuy III
Comuna
Cod_Event
LMiIndex
LMiZScore
LMiPValue
COType
NNeighbors
01
5 0.009760997 3.833848407
0.024 HH
1
01
5 0.009760997 3.681976374
0.03 HH
1
02 02 02 02 02 03 03 03 03 03
5 4 4 4 4 5 3 4 4 4
04
4
04
0.121283185 3.467264397 3.472521356 3.491615061 17.2242106 0.064642645 9.71417E-05 10.26350167 10.30283671 23.92600073
3.809133012 2.145501251 2.017014676 1.816117017 4.181974095 1.815897207 0.083433446 3.142694482 3.022327869 4.851818654
0.002 0.028 0.034 0.022 0.002 0.036 0.04 0.008 0.012 0.002
HH HH HH HH HH HH HH HH HH HH
58 54 55 78 77 63 81 125 130 132
0.03471084 1.525852243
0.05 HH
112
3
8.7821E-05 2.300786164
0.016 HH
91
05 06 06 06
4 3 4 4
10.29149571 3.255907964 7.07183E-05 2.56125037 3.462876237 1.856829308 3.464148788 1.735081722
06
HH HH HH HH
110 57 97 62
4 6.851413949 2.527956991
0.04 HH
119
06 07
4 10.35074285 3.513374239 3 4.81844E-05 1.765021742
0.002 HH 0.042 HH
70 65
07
3
7.5904E-05 3.134708572
0.004 HH
47
Urbanización El Angel del Hogar 07 Puerto Nuevo 07
5
0.07118823 1.714723822
0.042 HH
72
4 3.477334799 1.757504841
0.028 HH
48
Sector Puente del Comercio Urbanización Calimio Los Pinos Alfonso Lopez II
Ing. Ricardo Rodriguez Otero
0.012 0.01 0.034 0.032
123
Alfonso Lopez III Fepicol Las Ceibas La Gran Colombia Los Sauces Villablanca Rodrigo Lara Bonilla José Manuel Marroquín II Unicentro Cali La Playa Horizontes Sector Meléndez Sector Cañaveralejo Guadalupe Cañaveral Planta de Tratamiento El Remanso Los Lideres Club Campestre Ciudad Campestre Parcelaciones Pance
07 07 07
3 0.00010365 0.091429929 4 6.83144875 2.643315817 4 13.74859007 3.604874324
0.05 HH 0.04 HH 0.008 HH
55 58 73
11 11 13
4 10.29253455 3.400542882 4 10.30332539 3.182353203 4 3.349602824 2.018716988
0.004 HH 0.01 HH 0.046 HH
117 100 140
13
4 3.440641386 1.778590448
0.042 HH
138
14
4 13.77135263 3.956736955
0.002 HH
134
17 17 18
4 0.043784136 2.166766042 5 0.096338509 2.06569197 5 0.098150444 1.77105789
0.016 HH 0.018 HH 0.046 HH
67 52 88
18
5 0.109680622 2.585228333
0.006 HH
67
19 19
5 0.084874103 2.950826615 5 0.066453315 2.62938068
0.006 HH 0.01 HH
55 41
21 21 21
5 0.064656593 1.838636245 3 0.000257253 6.480399477 5 54.99984997 7.643656029
0.03 HH 0.002 HH 0.002 HH
95 61 54
22
4 0.048809834 2.841364098
0.006 HH
82
22
5 0.074213586 2.165832912
0.018 HH
86
22
4 30.97664447 5.741584593
0.002 HH
9
Tabla 24. Barrios con clústeres “Bajos” de IRA por las edades de afectados, Índice local Moran. Barrio Sector Patio Bonito Vista Hermosa Ciudad de Los Alamos Urbanización La Merced El Nacional San Cayetano San Pascual Santa Rosa Flora Industrial Jorge Isaacs Las Delicias Olaya Herrera Los Andes Metropolitano del Norte Villa del Sol
Ing. Ricardo Rodriguez Otero
Comuna 1 1 2 2 3 3 3 3 4 4 4 4 5 5 5
Edad 0 0 1 2 1 2 6 2 2 0 7 1 2 2 3
LMiIndex 0.000885078 0.000885078 16.17278257 8.509755694 3.420926726 5.275723033 3.75188896 6.355716659 0.050257559 0.021403499 2.009908209 16.17278257 4.247066148 2.15408388 6.87770828
LMiZScore 1.158178506 1.143133075 4.032925427 2.745654091 1.86497139 2.457138169 1.971735748 2.673552495 4.298958038 2.235899481 1.519994608 4.032925427 2.04027891 1.46030341 2.653742589
LMiPValue 0.026 0.02 0.002 0.002 0.006 0.002 0.008 0.002 0.002 0.016 0.046 0.002 0.01 0.048 0.002
124
Los Guaduales Petecuy I Sector Puente del Comercio Urbanización Calimio Alfonso Lopez I Las Ceibas Primitivo Crespo Santa Fé Simón Bolívar Villa Colombia Barrio Obrero Belalcázar Bretaña Junín Las Granjas San Judas Tadeo I El Prado El Recuerdo La Independencia León XIII Los Conquistadores San Carlos Villanueva Marroquín III Omar Torrijos Sector Laguna del Pondaje José Manuel Marroquín II Manuela Beltrán Promociones Populares B Ciudad Córdoba El Morichal El Retiro Mojica Antonio Nariño Brisas del Limonar Ciudad 2000 La Alborada República de Israel Caney Cañaverales - Los Samanes El Limonar Mayapan - Las Vegas Alférez Real Alto Nápoles Los Chorros Mario Correa Rengifo Sector Alto de los Chorros Camino Real - Los Fundadores Cañaveral El Lido San Fernando Nuevo
Ing. Ricardo Rodriguez Otero
6 6 6 6 7 7 8 8 8 8 9 9 9 9 10 10 11 11 11 11 11 11 12 13 13 13 14 14 14 15 15 15 15 16 16 16 16 16 17 17 17 17 18 18 18 18 18 19 19 19 19
5 1 1 4 11 1 1 9 21 1 8 1 1 5 2 1 0 2 11 0 2 1 4 8 11 1 3 2 4 6 2 9 15 4 1 3 0 2 6 2 19 8 6 6 8 9 1 4 0 1 4
4.076708597 4.621451398 2.287996161 2.667651221 6.426033088 4.58582703 1.205258505 2.729043281 0.01186808 16.13763875 5.495721015 2.349324196 4.60537205 5.738803607 7.444227738 9.259632312 0.051284269 2.158654073 3.429793795 0.049338551 2.145319239 5.785571236 3.621935101 5.463609313 2.123108253 4.575213511 3.916383894 7.488576702 7.208405943 24.64602797 13.90073627 3.777594082 2.586204755 14.37462535 0.030725564 13.73396703 0.038925929 9.584588437 17.17203217 11.73830136 2.635475185 6.038921824 2.205892202 4.493465803 6.69174433 0.021833478 4.628361239 2.657405304 0.039764386 6.059181786 6.27052584
2.08328595 2.110556302 1.536660747 1.610558541 2.591753167 2.035398806 1.100002711 1.60688387 3.948837765 4.140249713 2.373599093 1.581458251 2.101321562 2.402435849 2.732342534 2.99894899 3.54976014 1.501593423 1.846283769 2.984357731 1.500602838 2.336112575 1.892872841 2.364025742 1.499574256 2.243547902 1.962957793 2.665994513 2.820128415 5.169021774 3.887416518 1.997398128 1.56664475 3.903848246 1.850984535 3.587915405 2.437158897 3.07483027 4.205024347 3.509641975 1.717086235 2.505342024 1.508954117 2.252423744 2.688052006 1.981698092 2.310040057 1.69609447 4.960894916 2.501785569 2.455571955
0.018 0.002 0.026 0.05 0.002 0.004 0.008 0.038 0.002 0.002 0.006 0.006 0.004 0.004 0.002 0.002 0.002 0.018 0.024 0.002 0.04 0.002 0.014 0.002 0.05 0.004 0.01 0.002 0.004 0.002 0.002 0.014 0.042 0.002 0.034 0.002 0.006 0.002 0.002 0.002 0.032 0.002 0.044 0.008 0.002 0.014 0.002 0.028 0.002 0.002 0.002
125
Santa Bárbara Tejares - Cristales U. D. A. Galindo Plaza de Toros Unidad Residencial El Coliseo Unidad Residencial Santiago de Cali Belén Belisario Caicedo Brisas de Mayo Cementerio - Carabineros El Cortijo La Sultana Lleras Camargo Siloé Tierra Blanca Calimio Desepaz Ciudadela del Rio - CVC El Remanso Los Lideres Pizamos I Pizamos III - Las Dalias Villamercedes I - Villa Luz - Las Garzas
19 19 19 19 19 20 20 20 20 20 20 20 20 20 21 21 21 21 21 21 21
1 2 0 0 1 4 0 2 0 1 1 9 1 3 13 5 9 0 1 0 0
3.429643833 6.365439856 0.158591932 0.238538567 2.4522881 4.744032869 0.284148502 8.767058924 0.059268577 7.252430132 1.392103356 2.992697612 176.7176683 6.390264676 4.570078838 3.289109672 0.039061377 5.019562334 2.306357933 0.023896384 0.023494859
1.764954953 2.510494609 9.69473126 11.96561878 1.658602556 2.36855169 13.81437453 2.96440916 4.522849349 2.738202396 1.296866052 1.861289894 12.75887848 2.629079575 2.272773088 1.831317077 3.657173081 2.222925232 1.546334537 2.270233722 2.509867734
0.008 0.004 0.002 0.002 0.002 0.002 0.002 0.002 0.002 0.002 0.002 0.018 0.002 0.002 0.01 0.03 0.002 0.002 0.016 0.008 0.008
Parcelaciones Pance
22
7
6.088094467
2.308604594
0.008
Tabla 25. Barrios con clústeres “Altos” de IRA por las edades de afectados. Índice local Moran.
Barrio Terron Colorado Área en Desarrollo - Parque del Amor Arboledas El Bosque Granada La Flora Menga Santa Teresita Sector Altos de Normandia - Bataclán Vipasa El Peñón La Merced Los Libertadores San Juan Bosco Salomia Chiminangos I Ciudadela Floralia Alfonso Lopez III Siete de Agosto El Trébol Urbanización La Nueva Base Cristóbal Colón Departamental El Dorado La Selva
Ing. Ricardo Rodriguez Otero
Comuna 1 2 2 2 2 2 2 2 2 2 3 3 3 3 4 5 6 7 7 8 8 10 10 10 10
Edad 43 35 64 32 65 47 59 27 65 61 51 54 45 59 71 87 68 72 68 65 59 53 54 69 54
LMiIndex LMiZScore LMiPValue 9.98518934 3.15623831 0.002 0.01487513 6.17516671 0.002 39.4950599 6.33538107 0.002 0.00771838 3.80255757 0.002 13.0316161 3.56846021 0.004 19.1322001 4.2780131 0.002 9.29270047 3.07105103 0.004 0.00221956 6.00362427 0.002 13.0316161 3.56846021 0.004 14.6301788 4.09603961 0.002 6.34205558 2.66140645 0.01 3.98379745 1.8906937 0.044 4.18434137 2.04126716 0.03 12.9229868 3.46803346 0.002 27.8093755 5.22803145 0.002 19.2297527 4.47031088 0.002 87.7369166 9.55957438 0.002 3.67332905 1.88879797 0.044 36.3420123 6.24986931 0.002 10.4652233 3.27886837 0.002 9.30689305 2.8722161 0.012 12.3172575 3.45515033 0.002 6.65740155 2.73775944 0.006 9.5998682 3.30372194 0.002 6.58278446 2.64575702 0.016
126
La Gran Colombia Nueva Floresta El Poblado I El Pondaje Lleras Restrepo Los Comuneros II Los Lagos Alfonso Bonilla Aragón El Vallado Los Comuneros I Mariano Ramos Unión de Vivienda Popular Bosques del Limonar El Gran Limonar - Cataya El Ingenio Lili Santa Anita - La Selva Buenos Aires Meléndez Nápoles 3 de Julio Cuarto de Legua - Guadalupe El Refugio Los Cámbulos San Fernando Viejo Urbanización Colseguros Desepaz Invicali Valle Grande Club Campestre Urbanización Ciudad Jardín
11 12 13 13 13 13 13 14 15 15 16 16 17 17 17 17 17 18 18 18 19 19 19 19 19 19 21 21 22 22
80 58 52 63 62 47 70 38 46 58 79 81 65 36 79 56 51 52 42 50 36 68 44 44 77 91 55 46 92 89
15.0159776 22.6353697 12.5456831 9.40002379 6.7026102 4.42727723 26.5483071 2.52308957 8.62677009 19.1695753 72.5056321 15.5737141 7.78370047 0.00839476 72.6646316 41.223004 11.5585431 5.68379002 12.5719325 10.6341485 0.01016476 21.1426749 6.95476904 3.21115452 44.7598695 29.2840967 11.3411525 9.96143414 0.25584542 219.934636
4.01765372 4.76532737 3.47423319 3.15829489 2.46604586 2.15990242 4.81220297 1.69981515 2.88757893 4.51256244 8.43354604 4.1384684 2.81392766 1.80045104 8.95256947 6.35942213 3.44659699 2.33962774 3.63800795 3.31061755 1.75520534 5.05086348 2.71629438 2.00670603 6.94056359 5.72391273 3.27083013 3.137343 10.4565843 13.8368011
Tabla 26. Barrios con clústeres “Altos” de IRA según el género de afectados, Índice local Moran.
Barrio Terron Colorado Santa Mónica Santa Teresita Altos de Menga La Paz San Vicente Menga Chipichape Granada
Ing. Ricardo Rodriguez Otero
Comun Cod_Sex LMiZScor LMiPVal COTyp a o LMiIndex e ue e 27.693175 5.3602868 1 2 78 66 0.002 HH 0.0156113 2.2076084 2 2 6 96 0.018 HH 0.1144318 4.8991622 2 2 17 88 0.002 HH 1.3529504 1.1664757 2 2 26 51 0.002 HH 1.4377702 1.2452623 2 2 01 14 0.002 HH 1.3326669 1.1672990 2 2 84 66 0.022 HH 6.6246418 2.5462722 2 2 47 71 0.002 HH 6.6625858 2.5163028 2 2 22 97 0.002 HH 6.5946062 2.6367925 2 2 32 24 0.01 HH
0.002 0.002 0.006 0.004 0.018 0.022 0.002 0.048 0.004 0.002 0.002 0.002 0.006 0.036 0.002 0.002 0.002 0.008 0.004 0.004 0.042 0.002 0.006 0.032 0.002 0.002 0.004 0.002 0.002 0.002
127
Prados del Norte
2
2
Vipasa Sector Altos de Normandia Bataclán
2
2
2
2
Urbanización La Merced
2
2
Arboledas
2
2
La Flora
2
2
El Nacional
3
2
San Pedro
3
2
El Peñón
3
2
Santa Rosa
3
2
San Nicolás
3
2
La Isla
4
2
Popular
4
2
Chiminangos I
5
2
Petecuy III
6
2
Los Guaduales
6
2
Jorge Eliécer Gaitán
6
2
Alfonso Lopez II
7
2
San Marino
7
2
Las Ceibas
7
2
Alfonso Lopez I
7
2
El Troncal
8
2
El Trébol
8
2
Bretaña
9
2
Guayaquil
9
2
Junín
9
2
San Judas Tadeo II
10
2
Colseguros Andes
10
2
Las Granjas
10
2
Ing. Ricardo Rodriguez Otero
7.9704890 88 9.3164640 09 6.5946062 32 10.598458 73 21.119422 79 34.346982 45 3.9465928 08 6.5694417 87 7.8952519 22 7.8697692 39 9.2072077 86 3.9908894 12 9.2227736 98 3.9063435 77 1.3383046 49 6.5253036 08 14.524225 17 0.0545972 85 0.0235384 42 5.2609186 81 19.804766 47 5.2167973 86 5.1979454 48 5.2319500 66 6.5707963 89 9.2189568 69 0.0477541 31 3.9616203 84 9.2819435 84
2.8270625 45 3.1380088 86 2.6367925 24 3.2295914 74 4.9728488 68 5.8744255 91 2.0078644 61 2.5656499 72 2.7574225 95 2.6616488 71 3.0840964 75 2.0098061 28 3.2107199 03 2.1045120 45 1.1759963 34 2.6484501 8 3.6666878 78 5.6875760 94 2.2153251 58 2.2924113 82 4.5502762 02 2.2620272 01 2.1884134 86 2.3500965 55 2.7213407 9 3.0347910 59 3.0679382 72 1.8889054 78 3.0127236 22
0.002 HH 0.002 HH 0.01 HH 0.002 HH 0.002 HH 0.002 HH 0.04 HH 0.004 HH 0.012 HH 0.01 HH 0.004 HH 0.002 HH 0.002 HH 0.044 HH 0.024 HH 0.008 HH 0.002 HH 0.002 HH 0.016 HH 0.032 HH 0.002 HH 0.022 HH 0.036 HH 0.028 HH 0.01 HH 0.004 HH 0.002 HH 0.03 HH 0.002 HH
128
San Judas Tadeo I
10
2
José Holguín Garcés
11
2
Maracaibo
11
2
La Gran Colombia
11
2
El Jardín
11
2
San Carlos
11
2
La Independencia
11
2
Villanueva
12
2
El Pondaje
13
2
Omar Torrijos
13
2
Los Lagos
13
2
Manuela Beltrán
14
2
Promociones Populares B
14
2
El Retiro
15
2
Mojica
15
2
El Morichal
15
2
Ciudad 2000
16
2
Mariano Ramos
16
2
Antonio Nariño
16
2
Mayapan - Las Vegas
17
2
Cañaverales - Los Samanes
17
2
Caney
17
2
El Limonar
17
2
Lourdes
18
2
Sector Alto de los Chorros
18
2
Buenos Aires
18
2
Alto Nápoles
18
2
Los Chorros
18
2
Santa Bárbara
19
2
Ing. Ricardo Rodriguez Otero
10.628578 99 0.0977953 03 1.3710362 37 3.9498616 96 5.2814814 89 6.6019027 2 10.557857 69 5.2181606 32 5.2077784 15 6.5492404 01 10.466131 43 9.2277936 47 10.528210 09 9.1937217 11 14.455711 51 17.089965 83 18.506798 75 19.816249 25 21.075366 22 13.090825 19 14.604284 05 30.333208 39 34.292227 83 1.3453630 59 5.2846711 66 6.5091742 93 7.8952751 2 14.479404 59 3.9625745 71
3.2985734 13 5.9580665 85 1.1099475 98 2.0146047 14 2.4507741 29 2.4603953 9 3.0467043 7 2.3553441 7 2.4190972 33 2.4549575 3.3825225 3 3.0903919 05 3.1306640 38 3.1075512 2 3.7489654 54 4.3783886 55 4.3756408 45 4.5611384 44 4.5228996 91 3.6318277 47 3.9605181 3 5.7799050 35 6.0901649 27 1.1151092 49 2.3168672 86 2.6195010 18 2.8640996 94 3.6597390 58 1.9221336 22
0.002 HH 0.002 HH 0.004 HH 0.046 HH 0.006 HH 0.004 HH 0.002 HH 0.022 HH 0.03 HH 0.016 HH 0.002 HH 0.002 HH 0.002 HH 0.004 HH 0.002 HH 0.002 HH 0.002 HH 0.002 HH 0.002 HH 0.002 HH 0.002 HH 0.002 HH 0.002 HH 0.048 HH 0.014 HH 0.006 HH 0.01 HH 0.002 HH 0.036 HH
129
Urbanización Colseguros
19
2
Bellavista
19
2
El Lido
19
2
Tejares - Cristales
19
2
Cuarto de Legua - Guadalupe
19
2
Nueva Tequendama Camino Real - Joaquin Borrero Sinisterra
19
2
19
2
La Sultana Venezuela - Urbanización Cañaveralejo
20
2
20
2
El Cortijo
20
2
Brisas de Mayo
20
2
Siloé
20
2
Ciudad Talanga
21
2
Ciudadela del Rio - CVC
21
2
Calimio Desepaz
21
2
5.2759084 3 6.6563919 79 6.8806989 67 7.9041233 89 9.2267939 42 10.524841 29 17.093103 16 1.5267028 61 1.5142363 8 8.2070576 91 10.744867 45 201.81638 65 5.2493785 7 5.2774374 23 18.448836 44
2.2903114 93 2.6106924 67 2.6468161 69 2.7691186 79 2.9802426 14 3.3856708 69 4.1986466 51 1.3689174 75 1.3474647 99 3.1091250 05 3.3930094 96 14.453729 67 2.2530517 74 2.1635281 81 3.9962268 87
0.02 HH 0.002 HH 0.002 HH 0.006 HH 0.004 HH 0.002 HH 0.002 HH 0.002 HH 0.002 HH 0.002 HH 0.002 HH 0.002 HH 0.034 HH 0.02 HH 0.002 HH
Tabla 27. Barrios con clústeres “Bajos” de IRA según el género de afectados, Índice local Moran.
Barrio Vista Hermosa Sector Patio Bonito Centenario Normandia Ciudad de Los Alamos Brisas de Los Alamos La Merced San Cayetano San Pascual San Antonio El Calvario San Juan Bosco Los Libertadores Porvenir Jorge Isaacs Calima Las Delicias Salomia Flora Industrial Olaya Herrera
Ing. Ricardo Rodriguez Otero
Comuna 1 1 2 2 2 2 3 3 3 3 3 3 3 4 4 4 4 4 4 4
Cod_Sexo 0 0 1 1 1 1 1 1 1 1 1 1 1 1 0 1 1 1 1 1
LMiIndex 0.004840519 0.004840519 3.2148928 4.254096404 7.483305082 8.03037239 1.619649747 2.690336989 2.685224051 3.199662221 3.744757685 3.752763602 3.77629425 0.015262819 0.067482913 0.570037534 1.612593972 4.294059875 7.483305082 7.483305082
LMiZScore LMiPValue COType 2.617092664 0.026 LL 2.701144621 0.016 LL 1.76911218 0.018 LL 2.099973514 0.032 LL 2.82611975 0.01 LL 2.856821922 0.004 LL 1.303197573 0.032 LL 1.733241116 0.028 LL 1.674630838 0.03 LL 1.877926803 0.044 LL 2.002720432 0.024 LL 1.83166499 0.022 LL 1.839088961 0.016 LL 2.220930419 0.006 LL 3.133866013 0.004 LL 0.836638999 0.018 LL 1.300745701 0.046 LL 2.19111515 0.002 LL 2.82611975 0.01 LL 2.82611975 0.01 LL
130
Chiminangos II Paseo de Los Almendros Los Andes El Sena Los Parques Barranquilla Villa del Sol Villa del Prado - El Guabito Torres de Comfandi Paso del Comercio San Luis II Urbanización Calimio Los Alcazares San Luis Ciudadela Floralia Base Aérea Parque de la Caña Urbanización El Angel del Hogar Siete de Agosto Simón Bolívar Las Américas Rafael Uribe Primitivo Crespo Municipal Benjamín Herrera Saavedra Galindo Industrial Urbanización La Nueva Base Santa Fé Santa Mónica Popular Atanasio Girardot La Floresta La Base Villa Colombia Manuel Maria Buenaventura Belalcázar Sucre Barrio Obrero Alameda Santo Domingo Departamental Panamericano Cristóbal Colón El Prado 20 de Julio Prados de Oriente El Recuerdo Aguablanca San Pedro Claver Alfonso Barberena A. El Paraíso Eduardo Santos
Ing. Ricardo Rodriguez Otero
5 5 5 5 5 5 5 5 6 6 6 6 6 6 7 7 7 7 8 8 8 8 8 8 8 8 8 8 8 8 8 8 8 9 9 9 9 9 10 10 10 10 11 11 11 11 11 11 12 12 12
0 1 1 1 1 1 1 1 1 1 1 1 1 1 0 0 0 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 0 1 1 1 1 1 1 0 1
0.093710594 2.165117655 2.172274179 2.703074106 3.245405766 3.758595053 4.798503599 6.972260255 0.023528982 1.097157206 1.621788765 3.762318745 4.810227796 15.51241221 0.069725594 0.067479911 0.092702519 6.431287858 0.046242921 0.562344338 0.587694178 0.577046876 1.11093316 1.113224966 1.127087655 1.626909171 2.699458638 2.711610651 2.717378226 3.247064915 3.253819206 3.768228155 7.504189157 0.551898281 1.097183821 3.220211086 4.828180904 7.493993314 0.558200673 2.703138048 2.678961068 5.333438654 0.100185235 1.110258736 1.094632113 1.093092661 1.620965781 2.141433314 0.043010971 0.096335204 0.028906481
2.39369997 1.595318883 1.532696017 1.75471482 1.743320852 1.888894771 2.180045928 2.705415588 3.514870862 1.04291478 1.273707051 1.937939314 2.158598294 3.950128957 3.513071229 2.56744883 3.083535594 2.60439345 5.035573014 0.726516289 0.765866935 0.736351888 1.074770427 1.039865234 1.093812996 1.330214863 1.65094302 1.598452043 1.588827631 1.898658001 1.779621445 1.753863726 2.616565386 0.776784933 1.125991412 1.767848063 2.211722106 2.801097229 0.709184092 1.791343265 1.663987529 2.323099019 3.004864096 1.026262998 1.160094919 1.019804366 1.236170043 1.560474942 4.033731191 2.428445373 2.554962977
0.006 0.018 0.022 0.012 0.014 0.016 0.036 0.002 0.002 0.026 0.024 0.014 0.022 0.002 0.002 0.01 0.004 0.002 0.002 0.026 0.036 0.028 0.03 0.038 0.034 0.02 0.022 0.016 0.016 0.014 0.02 0.02 0.002 0.032 0.016 0.014 0.008 0.002 0.05 0.014 0.048 0.014 0.002 0.036 0.022 0.028 0.048 0.048 0.002 0.014 0.006
LL LL LL LL LL LL LL LL LL LL LL LL LL LL LL LL LL LL LL LL LL LL LL LL LL LL LL LL LL LL LL LL LL LL LL LL LL LL LL LL LL LL LL LL LL LL LL LL LL LL LL
131
Julio Rincón Asturias Doce de Octubre El Rodeo Sindical Nueva Floresta Lleras Restrepo II Los Robles Villablanca Yira Castro Charco Azul Ricardo Balcázar El Poblado II Ulpiano Lloreda Sector Laguna del Pondaje Calipso El Diamante Los Comuneros II Villa del Lago Marroquín III El Poblado I Los Naranjos II Los Naranjos José Manuel Marroquín II Alfonso Bonilla Aragón José Manuel Marroquín I Alirio Mora Beltrán Los Comuneros I El Vallado Ciudad Córdoba República de Israel El Gran Limonar - Cataya Ciudadela Pasoancho La Playa Los Portales - Nuevo Rey Urbanización San Joaquin El Gran Limonar Las Quintas de Don Simón Santa Anita - La Selva Ciudad Capri La Hacienda El Ingenio Primero de Mayo Lili Cuarteles de Nápoles Horizontes Sector Meléndez Francisco Eladio Ramírez El Jordán Alférez Real Sector Alto Jordán
Ing. Ricardo Rodriguez Otero
12 12 12 12 12 12 13 13 13 13 13 13 13 13 13 13 13 13 13 13 13 14 14 14 14 14 14 15 15 15 16 17 17 17 17 17 17 17 17 17 17 17 17 17 18 18 18 18 18 18 18
1 1 1 1 1 1 0 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 0 1 1 1 1 1 1 1 1 1 1 0 0 0 1 1 1 1
0.045641963 0.576656934 0.574638339 3.241541007 3.239862341 6.970596742 0.195027714 0.029175544 0.556123697 0.56670394 1.123655199 1.093303207 1.087706997 2.19274545 2.170433554 2.695145971 2.673502179 3.22260215 3.785315589 4.838979332 5.884734962 0.027089974 1.66608265 2.189384129 5.869034011 9.071839485 10.71494344 5.884012028 6.94925128 17.62743853 4.795010093 0.031719422 0.04104299 0.100148962 0.556972117 1.095902592 2.171897211 2.166554827 5.88167471 5.909123549 6.927683828 8.011165473 9.596585686 14.43949304 0.146895587 0.187559506 0.150761235 0.589315044 0.578040353 1.638909628 3.238861141
3.684067005 0.794516677 0.815108765 1.895023067 1.731489304 2.545819054 3.655524491 2.768244155 0.792962863 0.769542585 1.164422762 1.117403432 1.142540283 1.395210105 1.44788746 1.713969749 1.680183839 1.872107799 1.997372903 2.223579614 2.436356686 2.595698236 1.395689685 1.555971217 2.343784137 3.052495542 3.321174558 2.42860701 2.583166739 4.23814781 2.150545505 3.419668463 4.750287241 3.156060018 0.76255583 1.00190983 1.469756116 1.534550607 2.5116392 2.375380929 2.585115694 2.726966852 3.24218313 3.781705916 4.545272288 5.204761066 5.074401639 0.805401249 0.739069936 1.310518756 1.886483742
0.002 0.024 0.028 0.008 0.016 0.006 0.002 0.006 0.032 0.038 0.03 0.024 0.02 0.026 0.022 0.018 0.05 0.012 0.01 0.004 0.006 0.006 0.02 0.018 0.02 0.002 0.002 0.01 0.004 0.002 0.03 0.004 0.002 0.002 0.03 0.042 0.03 0.024 0.008 0.004 0.006 0.006 0.004 0.002 0.002 0.002 0.002 0.026 0.024 0.026 0.012
LL LL LL LL LL LL LL LL LL LL LL LL LL LL LL LL LL LL LL LL LL LL LL LL LL LL LL LL LL LL LL LL LL LL LL LL LL LL LL LL LL LL LL LL LL LL LL LL LL LL LL
132
Caldas Polvorines Nápoles Meléndez Urbanización Militar Eucaristico Camino Real - Los Fundadores Miraflores Champagnat Cañaveralejo - Seguros Patria El Cedro Los Cámbulos San Fernando Nuevo Pampa Linda San Fernando Viejo El Refugio Planta de Tratamiento Pizamos I Los Lideres Pizamos II Potrero Grande Desepaz Invicali Valle Grande Ciudad Campestre Urbanización Rio Lili Parcelaciones Pance Urbanización Ciudad Jardín
18 18 18 18 19 19 19 19 19 19 19 19 19 19 19 19 21 21 21 21 21 21 21 22 22 22 22
1 1 1 1 0 1 1 1 1 1 1 1 1 1 1 1 0 1 0 1 1 1 1 0 1 1 1
3.756455675 4.836283428 5.910327168 16.06131026 0.090756428 0.554004025 1.617438544 2.173027141 2.148913882 2.151314848 2.688236843 3.216908251 3.768260402 4.80122565 5.366446644 6.950014057 0.158901204 1.090929941 27.13381786 2.684380995 3.742487949 4.25200246 8.020735848 0.124407132 0.566056959 4.81220852 17.11198794
2.069439391 2.233534092 2.506759725 3.999284931 2.472932384 0.724562176 1.27684988 1.528619593 1.413740449 1.379159984 1.587826098 1.699299379 1.839941045 2.249114907 2.40482651 2.603067689 5.60726404 1.08484869 5.188523105 1.667558345 1.917489409 2.10574405 3.052012389 4.986489908 0.759614185 2.227435899 3.943415434
0.014 0.006 0.006 0.002 0.012 0.032 0.05 0.018 0.048 0.046 0.024 0.026 0.018 0.026 0.01 0.01 0.002 0.03 0.002 0.014 0.038 0.038 0.002 0.002 0.036 0.022 0.002
LL LL LL LL LL LL LL LL LL LL LL LL LL LL LL LL LL LL LL LL LL LL LL LL LL LL LL
Tabla 28. Barrios con clústeres “Altos” de IRA según el año en el que se presentó la infección, Índice local Moran.
Barrio El Bosque Altos de Menga La Campiña La Paz Chipichape Granada Sector Altos de Normandia - Bataclán Ciudad de Los Alamos Brisas de Los Alamos La Flora La Merced San Pascual Santa Rosa El Calvario San Juan Bosco Sultana - Berlín - San Francisco Flora Industrial Olaya Herrera Chiminangos I Villa del Prado - El Guabito
Ing. Ricardo Rodriguez Otero
Comuna 2 2 2 2 2 2 2 2 2 2 3 3 3 3 3 4 4 4 5 5
Año 2010 2011 2014 2014 2011 2013 2013 2011 2011 2011 2014 2012 2012 2013 2011 2011 2011 2011 2015 2012
LMiIndex 0.001421068 0.024418213 0.029007377 0.028883594 0.119612548 0.128030918 0.128030918 0.330422275 0.356087855 0.615084814 0.082553357 0.127087422 0.151246289 0.183857734 0.168515838 0.039484672 0.330422275 0.330422275 0.083407404 0.222106479
LMiZScore LMiPValue COType 1.048005646 0.002 HH 0.157019713 0.05 HH 0.163403636 0.002 HH 0.186731398 0.012 HH 0.392463352 0.032 HH 0.372709816 0.004 HH 0.372709816 0.004 HH 0.616712718 0.042 HH 0.578918344 0.014 HH 0.85851435 0.004 HH 0.290778078 0.002 HH 0.326069687 0.002 HH 0.395775046 0.002 HH 0.481650625 0.002 HH 0.394789672 0.022 HH 0.149426959 0.038 HH 0.616712718 0.042 HH 0.616712718 0.042 HH 0.336187105 0.002 HH 0.4589594 0.004 HH
133
Torres de Comfandi Paso del Comercio Fonaviemcali Petecuy III Sector Puente del Comercio Urbanización Calimio Los Guaduales Fepicol Las Ceibas Alfonso Lopez I Sucre Maracaibo La Gran Colombia Los Sauces Los Robles Rodrigo Lara Bonilla El Poblado II El Pondaje Las Orquídeas Puerta del Sol Laureano Gómez Mojica El Gran Limonar - Cataya Los Portales - Nuevo Rey El Gran Limonar Cañaverales - Los Samanes Lili El Jordán Caldas Sector Altos de Santa Isabel Santa Isabel El Lido San Fernando Nuevo Belén Siloé Parcelaciones Pance
Ing. Ricardo Rodriguez Otero
5 6 6 6 6 6 6 7 7 7 9 11 11 11 13 13 13 13 14 14 15 15 17 17 17 17 17 18 18 19 19 19 19 20 20 22
2011 2010 2014 2014 2013 2013 2011 2015 2014 2011 2011 2013 2015 2013 2010 2011 2011 2012 2010 2012 2011 2011 2013 2012 2012 2011 2011 2010 2011 2011 2010 2012 2012 2010 2010 2014
0.307285265 0.001650249 0.028461842 0.027883701 0.053870111 0.078893978 0.120903029 0.056797828 0.106962201 0.355784887 0.143892245 0.028462776 0.084416991 0.078922666 0.003748161 0.026677567 0.05052204 0.100725266 0.017138833 0.075747734 0.097734035 0.261503991 0.00387664 0.027692537 0.101122713 0.26087033 0.638594378 0.016890423 0.16743454 0.026835824 0.027231066 0.126561413 0.175001141 0.119647561 3.461136945 0.241517221
0.566597647 1.106148237 0.159401998 0.186133421 0.247520827 0.2583816 0.382141663 0.252899788 0.337408699 0.628921792 0.406360875 0.192574021 0.241681228 0.295344269 1.718862918 0.157962888 0.228177528 0.278223185 0.025994114 0.309470247 0.318592694 0.523693398 2.051418005 0.196642944 0.337402933 0.457790146 0.783080237 0.099949392 0.430383556 0.154105791 0.190704378 0.356039129 0.466523941 0.357751371 1.871422042 0.515940183
0.042 0.05 0.014 0.014 0.01 0.002 0.028 0.002 0.002 0.014 0.028 0.012 0.002 0.004 0.024 0.044 0.02 0.006 0.01 0.012 0.024 0.016 0.012 0.006 0.006 0.05 0.008 0.022 0.042 0.034 0.016 0.008 0.002 0.03 0.028 0.002
HH HH HH HH HH HH HH HH HH HH HH HH HH HH HH HH HH HH HH HH HH HH HH HH HH HH HH HH HH HH HH HH HH HH HH HH