Master Thesis ǀ Tesis de Maestría submitted within the UNIGIS MSc programme presentada para el Programa UNIGIS MSc at/en
Interfaculty Department of Geoinformatics- Z_GIS Departamento de Geomática – Z_GIS University of Salzburg ǀ Universidad de Salzburg
Mapeo del nivel freático mediante técnicas geoestadísticas incorporando datos auxiliares. Dos estudios de caso en Colombia.
Water table mapping by geostatistical techniques, using auxiliary data. Two case studies in Colombia. by/por
Luis Eduardo Toro Espitia 11714073 A thesis submitted in partial fulfilment of the requirements of the degree of Master of Science– MSc Advisor ǀ Supervisor: Pablo Cabrera Barona PhD
Pereira - Colombia, julio 13 de 2020
COMPROMISO DE CIENCIA Por medio del presente documento, incluyendo mi firma personal, certifico que mi tesis es Ăşnicamente el resultado de mi propio trabajo. He citado todas las fuentes que he usado en mi tesis y en todos los casos he indicado su origen.
Pereira, julio 13 de 2020 (Lugar, Fecha)
(Firma)
DEDICATORIA A mi madre por haberme inculcado el deseo de aprender.
AGRADECIMIENTOS El autor de la presente tesis agradece en primera instancia a la Corporación Autónoma Regional de Caldas (CORPOCALDAS) por permitir el uso de datos de su propiedad para el desarrollo del trabajo de grado; en especial a Adriana Mercedes Martínez Gómez y a Paola Alejandra Vásquez Cardona por su gestión. También deseo expresar mis más sinceros agradecimientos al Grupo de Investigación en Agua y Saneamiento (GIAS) de la Universidad Tecnológica de Pereira (UTP) por su excelente desempeño en la recolección de datos. También agradezco a UNIGIS por haber brindado las bases que han hecho posible el desarrollo de esta tesis. Particularmente, a Pablo Cabrera Barona por su apoyo y guía, y a Gabriela Ramón por su paciencia.
5
RESUMEN Una representación adecuada de la superficie freática de los acuíferos someros es esencial para determinar aspectos como dirección y sentido del flujo de agua subterránea, delimitación de zonas naturales de recarga y descarga, y tipos de conexión hidráulica entre aguas superficiales y subterráneas. En la presente tesis se ha estimado la configuración de dos superficies freáticas para sendos acuíferos libres mediante la aplicación y evaluación del rendimiento de cuatro herramientas geoestadísticas: Kriging Ordinario (OK), Kriging Universal (UK), Kriging con Deriva Externa (KED) y co-Kriging (CK), utilizando en las dos últimas herramientas la cota topográfica y la conductividad eléctrica del agua como variables secundarias. Los estudios de caso son La Dorada y la cuenca de la quebrada Carminales, ambos en el departamento de Caldas en Colombia. Ambas áreas de estudio se diferencian entre sí en aspectos como tamaño, topografía, límites y geología. En el proceso de selección de las dos mejores configuraciones de superficie freática, se construyeron 107 variogramas experimentales con sus respectivos variogramas teóricos. El rendimiento de cada herramienta de interpolación ha sido evaluado mediante la estimación de ocho índices de error calculados a partir de validación cruzada. Las mejores tablas de agua han sido seleccionadas comparando las superficies interpoladas con información hidrogeológica recolectada en campo, así como datos aportados por residentes de las dos áreas de estudio. La herramienta KED fue la que exhibió las mejores estadísticas de acuerdo con los cálculos de validación cruzada. Esta tendencia se observó en las dos áreas de estudio y con todos los conjuntos de datos utilizados. Sin embargo, las superficies freáticas generadas con KED no siempre reflejaron en forma fiel los rasgos hidrológicos observados en campo. Aunque los índices de error calculados a partir de la validación cruzada son una buena guía, no son suficientes para evaluar el rendimiento de las herramientas kriging. Es necesario validar las superficies generadas o, por lo menos, contrastarlas con información hidrogeológica obtenida a través de medios independientes. Respecto a las variables secundarias, sólo la información topográfica usada con la técnica CK, y únicamente en el estudio de caso de La Dorada, mejoró notablemente la estimación de la configuración de la tabla de agua. El mal rendimiento mostrado por la conductividad eléctrica se debe a su baja correlación con la variable principal (nivel freático). La inclusión de manantiales en el set de datos para la interpolación no representó una mejora sensible en los productos generados. Estos resultados sólo son válidos para los dos estudios de caso aquí abordados y para el set de datos utilizado. La mejor superficie freática para la Dorada se obtuvo con la herramienta CK, usando la cota como variable secundaria. En este caso, el 70% de los puntos de control (manantiales y humedales) utilizados para evaluar la representatividad de la tabla de agua generada, coincidió con las zonas potenciales de descarga identificadas mediante álgebra de mapas. La mejor superficie freática para la quebrada Carminales se obtuvo con la herramienta UK, la cual reproduce en gran medida el carácter perenne de esta quebrada. Tres de los cuatro puntos de control empleados en este estudio de caso coincidieron con las zonas potenciales de descarga generadas mediante álgebra de mapas. Las dos mejores superficies freáticas pueden ser utilizadas por CORPOCALDAS para delimitar las principales zonas de recarga y optimizar las redes de observación de calidad de las aguas subterráneas en las dos áreas de estudio.
6
ABSTRACT An adequate representation of the water table of shallow aquifers is essential to determine aspects such as the direction of groundwater flow, delimitation of natural recharge and discharge areas, and types of hydraulic connection between surface and groundwater. In this thesis, the configuration of water tables for two unconfined aquifers has been estimated by applying and evaluating the performance of four geostatistical tools: Ordinary Kriging (OK), Universal Kriging (UK), Kriging with External Drift (KED) and co-Kriging (CK). In the last two tools, the topographical elevation and the electrical conductivity of water were used as secondary variables. This thesis was performed in La Dorada and the basin of the Carminales creek, both in the department of Caldas in Colombia. Both study areas differ from each other in aspects such as size, topography, boundaries, and geology. In selecting the two best water table configurations, 107 experimental variograms were constructed with their respective theoretical variograms. The performance of each interpolation tool was evaluated by estimating eight statistics calculated from cross-validation. The best water tables were selected comparing the interpolated surfaces with hydrogeological information collected in the field and data provided by residents of the two study areas. The KED tool exhibited the best statistics according to the cross-validation calculations. This trend was observed in the two study areas and with all the data sets. However, the KEDgenerated groundwater surfaces did not always accurately reflect the hydrologic features observed in the field. Although the statistics calculated from cross-validation are a good guide, they are not sufficient to evaluate the performance of the kriging tools. It is necessary to validate the generated surfaces or, at least, contrast them with hydrogeological information obtained through independent tools. Regarding the secondary variables, only the topographic information used with the CK technique, and only in the La Dorada case study, significantly improved the estimation of the water table's configuration. The poor performance shown by electrical conductivity is due to its low correlation with the primary variable (water table). The inclusion of springs in the data set for interpolation did not represent a noticeable improvement in the outputs generated. These results are only valid for the two case studies addressed here and for the data set used. The best phreatic surface for La Dorada was obtained with the CK tool, using the topography as a secondary variable. In this case, 70% of the control points (springs and wetlands) used to evaluate the representativeness of the generated water table, coincided with the potential discharge areas generated by map algebra. The best water table for the Carminales creek was obtained with the UK tool, which mainly reproduces its stream's perennial nature. Three of the four control points used in this case study coincided with the potential discharge zones generated by map algebra. The two best water tables can be used by CORPOCALDAS to delimit the main recharge areas and optimize the groundwater quality observation networks in the two study areas.
7
TABLA DE CONTENIDO 1. INTRODUCCIÓN
13
1.1. Antecedentes
13
1.2 Objetivos y preguntas de investigación 1.2.1. Objetivo general 1.2.2. Objetivos específicos 1.2.3. Preguntas de investigación
16 16 16 17
1.3 Hipótesis
17
1.4 Justificación y alcance
18
2. REVISIÓN DE LITERATURA
20
2.1. Nociones sobre geoestadística
20
2.2. Trabajos previos
27
3. METODOLOGÍA
31
3.1. Áreas de estudio
31
3.2. Aspectos metodológicos 3.2.1. Procedencia y preparación de los datos 3.2.2. Exploración de los datos 3.2.3. Análisis estructural de los datos 3.2.4. Interpolación de los niéveles freáticos 3.2.5. Evaluación de los mapas, discusión y conclusiones
32 33 39 40 46 47
4. RESULTADOS Y DISCUSIÓN
50
4.1. La Dorada 4.1.1. Exploración de datos, La Dorada 4.1.2. Construcción y selección de variogramas, La Dorada 4.1.3. Generación de mapas, La Dorada
50 50 55 70
4.2. Carminales 4.2.1. Exploración de datos, Carminales 4.2.2. Construcción y selección de variogramas, Carminales 4.2.3. Generación de mapas, Carminales
85 88 91 97
4.3. Discusión de los resultados 4.3.1. Limitaciones de los datos utilizados 4.3.2. Evaluación rendimiento interpoladores 4.3.3. Síntesis de los resultados obtenidos
114 117 121 123
5. CONCLUSIONES
133
6. REFERENCIAS
139
8 ANEXO A-1: DATOS DE LA DORADA
144
ANEXO A-2: DATOS DE CUENCA DE LA QUEBRADA CARMINALES
146
ANEXO B: SCRIPTS R
147
9
GLOSARIO ALOS
Advanced Land Observing Satellite
ASE
Error Estándar Promedio (siglas en inglés).
CE
Conductividad Eléctrica.
CK
Co-kriging. Ver definición en la página 46.
CORPOCALDAS
Corporación Autónoma Regional de Caldas.
D
Índice de Willmott
DEM
Modelo Digital de Elevación (siglas en inglés).
GIAS
Grupo de Investigación en Agua y Saneamiento.
JAXA
Agencia Aeroespacial del Japón (siglas en inglés)
KED
Kriging con Deriva Externa. Ver definición en la página 46.
MAE
Error Absoluto Medio (siglas en inglés)
ME
Error Medio (siglas en inglés)
MSE2
Error Estandarizado Medio (siglas en inglés)
Msnm
Metros sobre el nivel del mar
NF
Nivel Freático.
OK
Kriging Ordinario. Ver definición en la página 45.
PALSAR
Phased Array Type L-band Synthetic Aperture Radar
r
2
Coeficiente de Correlación de Pearson
RMSE
Error Raíz Cuadrada de la Media (siglas en inglés)
RMSSE
Error Raíz Cuadrada de la Media, Estandarizada (siglas en inglés)
UK
Kriging Universal. Ver definición en la página 46
UTP
Universidad Tecnológica de Pereira.
10
LISTA DE FIGURAS
Figura 1. Localización de las dos áreas de estudio. ....................................................... 32 Figura 2. Plan de trabajo. Últimas cuatro fases. ............................................................ 35 Figura 3. Variable para interpolar. Nivel freático respecto al nivel medio del mar (C). 38 Figura 4. Variograma típico .......................................................................................... 41 Figura 5. Esquema, ejercicios para seleccionar los mejores modelos de variograma ... 44 Figura 6. Mapa ubicación puntos de observación, La Dorada (Caldas) ........................ 52 Figura 7. Histograma y diagrama de Cajas y Bigotes, datos de nivel freático, La Dorada (Caldas)........................................................................................................................... 53 Figura 8. Gráfica QQPlot Normal, nivel freático, La Dorada (Caldas) ........................ 53 Figura 9. Nivel freático vs cota del terreno, La Dorada (Caldas).................................. 54 Figura 10. Histogramas para dos subconjuntos de datos de nivel freático, La Dorada (Caldas)........................................................................................................................... 55 Figura 11. Configuración red puntos de observación subconjuntos 146 y 102, NF, La Dorada (Caldas) .............................................................................................................. 55 Figura 12. Nivel freático vs conductividad eléctrica, La Dorada (Caldas) ................... 56 Figura 13. Variogramas experimentales y teóricos omnidireccionales (las etiquetas de los puntos indican cantidad de pares de puntos en cada banda) ..................................... 58 Figura 14. Variogramas experimentales y teóricos direccionales ................................. 60 Figura 15. Ajuste parámetro “anis”, selección de variogramas direccionales .............. 64 Figura 16. Variogramas, aplicación co-Kriging con Cota como variable auxiliar ........ 69 Figura 17. Histogramas de la conductividad eléctrica del agua subterránea, La Dorada ........................................................................................................................................ 69 Figura 18. Variogramas, aplicación co-Kriging con CE como variable auxiliar .......... 70 Figura 19. Sitios referencia la Dorada ........................................................................... 72 Figura 20. Datos observados vs valores interpolados, herramientas OK, UK y KED, La Dorada ............................................................................................................................ 76 Figura 21. Efecto de escala para los errores, herramientas OK, UK y KED, La Dorada ........................................................................................................................................ 78 Figura 22. Superficies interpoladas con OK, UK y KED, set con 191 registros. La Dorada ............................................................................................................................ 79 Figura 23. Varianzas estimadas, interpolación con OK, UK y KED, set con 191 registros. La Dorada ....................................................................................................... 80 Figura 24. Zonas potenciales de recarga y descarga de agua subterránea, interpolación con OK, UK y KED, set con 191 registros. La Dorada .................................................. 81 Figura 25. Tabla de agua interpolada, variando el vecindario de búsqueda, interpolación con OK, UK y KED, set con 146 registros. La Dorada .................................................. 82 Figura 26. Varianzas de kriging, variando el vecindario de búsqueda, interpolación con OK, UK y KED, set con 146 registros. La Dorada ........................................................ 83 Figura 27. Zonas de descarga y recarga de agua subterránea, variando el vecindario de búsqueda, interpolación con OK, UK y KED, set con 146 registros. La Dorada .......... 84 Figura 28. Valores observados vs valores interpolados, interpolación con OK y CK, La Dorada ............................................................................................................................ 85 Figura 29. Valores observados vs errores, interpolación con OK y CK, La Dorada .... 86 Figura 30. Interpolación NF, aplicando CK con la cota y la CE como variables auxiliares. La Dorada ...................................................................................................... 86
11 Figura 31. Varianzas de kriging, interpolación con OK y CK. La Dorada ................... 87 Figura 32. Zonas de descarga y recarga de agua subterránea, interpolación con OK y CK. La Dorada................................................................................................................ 87 Figura 33. Mapa ubicación puntos de observación, Carminales (Caldas) .................... 89 Figura 34. Histograma y diagrama de Cajas y Bigotes, datos de nivel freático, n = 104. Carminales ...................................................................................................................... 90 Figura 35. Cota vs NF, Carminales (Caldas). Las etiquetas indican profundidad de los pozos ............................................................................................................................... 91 Figura 36. Histograma y diagrama de Cajas y Bigotes, datos de nivel freático, n = 88. Carminales ...................................................................................................................... 92 Figura 37. CE vs NF, Carminales (Caldas) ................................................................... 93 Figura 38. Ejemplos de variogramas construidos para Carminales, OK, UK y KED. .. 96 Figura 39. Histogramas de las variables secundarias para aplicar CK, Carminales.... 100 Figura 40. Variogramas y co-variograma, aplicación CK con Cota como variable auxiliar. Carminales. ..................................................................................................... 101 Figura 41. Variogramas y co-variograma, aplicación CK con CE como variable auxiliar. Carminales. ..................................................................................................... 101 Figura 42. Comparación valores observados vs valores interpolados. Carminales .... 104 Figura 43. Posible efecto de escala a errores obtenidos con datos de Carminales ...... 107 Figura 44. Superficies interpoladas con OK, UK y KED. Set de 102 registros. Carminales .................................................................................................................... 108 Figura 45. Varianzas calculadas para las superficies interpoladas con OK, UK y KED. Carminales. ................................................................................................................... 109 Figura 46. Posibles zonas de descarga de agua subterránea según OK, UK y KED. Carminales .................................................................................................................... 110 Figura 47. superficies freáticas interpoladas con OK, usando el set de 88 registros. Carminales .................................................................................................................... 111 Figura 48. Varianzas para las interpolaciones realizadas con UK, set de 88 registros. Carminales .................................................................................................................... 113 Figura 49. Zonas de descarga de agua subterránea, según KED, set 88 registros. Carminales .................................................................................................................... 114 Figura 50. Comparación valores observados vs valores interpolados. CK. Carminales ...................................................................................................................................... 115 Figura 51. Superficies interpoladas, generadas con OK y CK. Carminales ................ 116 Figura 52. Varianzas de datos interpolados, obtenidas con OK y CK. Carminales .... 117 Figura 53. Zonas de descarga de agua subterránea, según OK y CK. Carminales ..... 118 Figura 54. Mejores tablas de agua interpoladas, La Dorada. ...................................... 126 Figura 55. Desviaciones estándar asociadas a los datos interpolados, La Dorada. ..... 127 Figura 56. Zonas potenciales de descarga y recarga de agua subterránea, La Dorada.128 Figura 57. Mejores tablas de agua interpoladas, Carminales. ..................................... 130 Figura 58. Desviaciones estándar asociadas a los datos interpolados, Carminales. .... 131 Figura 59. Zonas potenciales de descarga y recarga de agua subterránea, Carminales. ...................................................................................................................................... 132
12
LISTA DE TABLAS
Tabla 1. Principales rasgos de las dos áreas de estudio. ................................................ 33 Tabla 2. Variogramas generados en la fase de análisis estructural de La Dorada. Set 191 datos. ............................................................................................................................... 61 Tabla 3. Variogramas generados en la fase de análisis estructural de La Dorada. Set 146 datos. ............................................................................................................................... 62 Tabla 4. Variogramas generados en la fase de análisis estructural de La Dorada. Set 102 datos. ............................................................................................................................... 63 Tabla 5. Selección variogramas. Cálculo de indicadores de error, datos de La Dorada. Set 191 datos................................................................................................................... 66 Tabla 6. Selección variogramas. Cálculo de indicadores de error, datos de La Dorada. Set 146 datos................................................................................................................... 67 Tabla 7. Selección variogramas. Cálculo de indicadores de error, datos de La Dorada. Set 102 datos................................................................................................................... 68 Tabla 8. Modelos de variograma generados, aplicación CK, La Dorada ...................... 69 Tabla 9. Errores estimados en la construcción de las superficies interpoladas, métodos OK, UK y KED, La Dorada. .......................................................................................... 74 Tabla 10. Errores estimados en la construcción de las superficies interpoladas, métodos OK y CK, La Dorada. ..................................................................................................... 81 Tabla 11. Variogramas generados en la fase de análisis estructural de Carminales. Set 102 datos. ........................................................................................................................ 94 Tabla 12. Variogramas generados en la fase de análisis estructural de Carminales. Set 88 datos. .......................................................................................................................... 95 Tabla 13. Selección variogramas. Cálculo de indicadores de error, datos de Carminales. Set 102 datos................................................................................................................... 98 Tabla 14. Selección variogramas. Cálculo de indicadores de error, datos de Carminales. Set 102 datos................................................................................................................... 99 Tabla 15. Modelos de variograma generados, aplicación CK, Carminales ................... 99 Tabla 16. Errores estimados en la construcción de las superficies interpoladas, métodos OK, UK y KED, Carminales. ....................................................................................... 103 Tabla 17. Errores estimados en la construcción de las superficies interpoladas, métodos OK y CK, Carminales. .................................................................................................. 112 Tabla 18. Conteo concordancia manantiales y puntos auxiliares con zonas de descarga de agua subterránea ...................................................................................................... 129
13
1. INTRODUCCIÓN
En la mayoría de los estudios hidrogeológicos, la información inicialmente disponible está en forma de datos puntuales dispersos. Uno de los mayores retos de los investigadores es estimar valores de las variables de interés en sitios donde no ha sido posible recolectar datos, con el fin de obtener una imagen más completa de las características espaciales del fenómeno bajo estudio. Para llevar a cabo esta tarea, es necesario acudir a técnicas de interpolación. Estos métodos varían en complejidad y eficiencia (Rouhani, 1986). La presente tesis pretende mejorar el conocimiento de dos acuíferos en Colombia a través de la interpolación de los niveles freáticos. En este capítulo se presenta el marco general del presente trabajo.
1.1. Antecedentes En las ciencias ambientales como la hidrogeología, es frecuente abordar fenómenos que espacialmente son continuos. El conocimiento de dichos fenómenos requiere la caracterización de variables que están distribuidas en el espacio. En geoestadística, estas variables reciben el nombre de variables regionalizadas, término acuñado por Matheron (1965) en su tesis doctoral “Les variables régionalisées et leur estimation une application de la théorie de fonctions aléatoires aux sciences de la nature”.
La posición del nivel freático en un acuífero somero es una variable regionalizada (Kitanidis, 1997). Usualmente sólo se tiene a disposición mediciones puntuales del nivel freático. Estas mediciones se llevan a cabo en pozos y aljibes1. Rara vez se cuenta con pozos diseñados y construidos para este fin. Por ende, los responsables en ejecutar El término “aljibe” en Colombia y Venezuela hace referencia a una excavación hecha a mano para captar agua subterránea (en inglés: hand-dug well). En esos términos se emplea la palabra “aljibe” en el presente documento. 1
14 valoraciones hidrogeológicas se ven forzados a acudir a captaciones de producción para obtener valores de esta variable. Esta situación genera muchas limitaciones siendo las principales: 1) no siempre es posible obtener mediciones confiables de la ubicación natural del nivel freático debido a que la explotación de la captación distorsiona la configuración de la tabla de agua generando un cono de abatimiento alrededor del pozo o aljibe; 2) muchas captaciones tienen filtros en más de una unidad hidrogeológica, haciendo difícil interpretar las mediciones de nivel de agua obtenidas en tales captaciones; 3) la distribución de pozos y aljibes con frecuencia es muy desigual en el área de interés, dando lugar a sectores con muchas captaciones en donde la información es redundante, mientras que otros sectores carecen totalmente de pozos y aljibes.
Por lo anterior, la recolección de datos confiables de la posición natural del nivel freático es una actividad ardua y costosa, cuyo resultado es un conjunto de datos dispersos y a veces insuficientes para comprender la naturaleza y configuración de la superficie freática, también llamada tabla de agua en acuíferos libres. Sin embargo, los hidrogeólogos requieren un conocimiento preciso sobre la variación del nivel freático en el espacio con el fin de hacer interpretaciones ajustadas a la realidad, y los tomadores de decisiones (autoridades ambientales) necesitan este nivel de conocimiento para administrar y preservar las reservas de agua subterránea en sus áreas de jurisdicción.
Los métodos de interpolación espacial son herramientas muy útiles para enfrentar el problema de escasez de datos. Con ellos es posible obtener estimaciones de la variable de interés en puntos donde dicha variable no ha sido medida. Hay un número considerable de estos métodos. Por ejemplo, Li y Heap (2008) evaluaron 38 herramientas de interpolación. Existen varias maneras de clasificar estas herramientas. Una de las más utilizadas es agrupar los métodos en 1) determinísticos y 2) estocásticos. Un tercer grupo está conformado por herramientas híbridas (combinación de los primeros dos grupos). Los métodos estocásticos incorporan la noción de “aleatoriedad” y proveen tanto estimaciones del valor de la variable de interés como las incertidumbres asociadas a dichas estimaciones. En cambio, los métodos determinísticos no incorporan el concepto de error o incertidumbre y sólo ofrecen las estimaciones de las variables de interés (Li y Heap, 2014). En términos generales, los métodos estocásticos han mostrado
15 tener un rendimiento superior respecto a los métodos determinísticos (ver por ejemplo Varouchakis y Hristopulos, 2012), aunque es necesario anotar que todas las herramientas tienen debilidades y no siempre ofrecen la misma utilidad en todas las posibles situaciones de aplicación.
Con el nombre de kriging se conoce a un grupo de herramientas de interpolación de datos espaciales. Estas técnicas tienen en cuenta el tipo de correlación entre mediciones de una misma variable. Aunque su origen se remonta a la minería de oro (el nombre “kriging” fue propuesto en honor al ingeniero de minas Danie Krige, pionero en el desarrollo de las técnicas de interpolación), hoy día las herramientas kriging son utilizadas con regularidad en muchas disciplinas científicas. Zhou, Guo, Ho y Wu (2007) analizaron 2691 publicaciones entre 1967 y 2005 y hallaron que los cinco primeros campos de aplicación de estas herramientas fueron en orden de mayor a menor: geociencias, combinación de varias disciplinas, recursos hídricos, ciencias ambientales, y agricultura + suelo.
La idea fundamental que soporta la interpolación geostadística (kriging) es que las mediciones realizadas en puntos cercanos tienden a ser más similares que las mediciones entre puntos lejanos (Gotway y Hartford, 1996). En esencia, kriging provee la mejor estimación lineal no sesgada. Por estimación lineal se entiende que la interpolación se realiza asumiendo que los valores observados de la variable de interés siguen una distribución normal. Por “no sesgada” se entiende que los errores cometidos durante la interpolación tienen una media de cero. Estos métodos de interpolación requieren para su validez de varias condiciones, como la propiedad de “estacionariedad”. Esta propiedad establece que la diferencia observada entre dos puntos no depende de la ubicación absoluta de ellos sino de la distancia que los separa.
La parte débil de las herramientas kriging reside en los supuestos que se deben cumplir. Por ejemplo, la condición de “estacionariedad” no siempre es observada en el conjunto de datos que servirán de base para la interpolación. Con el fin de subsanar estas debilidades, se han desarrollado variantes de los métodos kriging que abordan características particulares de cada set de datos. Esta familia es numerosa y tiende a
16 aumentar. Li y Heap (2014) evaluaron varios factores que afectan el rendimiento de quince herramientas kriging, como el diseño de muestreo y grado de correlación entre variables primarias y secundarias. Los efectos de estos factores sobre el rendimiento de interpolación no siempre son consistentes y de ahí que es difícil seleccionar de antemano el mejor método para un set de datos específico.
En la presente tesis se propone estimar mediante kriging la posición de la tabla de agua en dos acuíferos libres en Colombia, ubicados en entornos geológicos y geográficos distintos. Para ello, se propone utilizar cuatro herramientas:
• • • •
Kriging Ordinario (OK) Kriging Universal (UK) coKriging Ordinario (CK) Kriging con Deriva Externa (KED)
La variable principal es la posición del nivel freático (o tabla de agua). Variables secundarias son la cota topográfica y la conductividad eléctrica del agua subterránea. Se pretende evaluar si la inclusión de las dos (o solo una) de las variables auxiliares mencionadas mejora significativamente la interpolación de la tabla de agua.
1.2 Objetivos y preguntas de investigación
1.2.1. Objetivo general Mapear el nivel freático mediante las herramientas Kriging Ordinario, Kriging Universal, coKriging Ordinario y Kriging con Deriva Externa, con apoyo de datos auxiliares de altitud y conductividad eléctrica en dos acuíferos ubicados en el departamento de Caldas, Colombia.
1.2.2. Objetivos específicos •
Evaluar el rendimiento de la altitud como dato auxiliar, en la estimación de la tabla de agua de los dos acuíferos objeto de estudio, mediante el uso de coKriging Ordinario y Kriging con Deriva Externa.
17 •
Identificar la utilidad de la conductividad eléctrica del agua subterránea como dato auxiliar en la interpolación de la tabla de agua de los dos acuíferos libres, mediante el uso de coKriging Ordinario.
•
Determinar si la incorporación de manantiales disminuye la incertidumbre en la estimación de la tabla de agua, para el estudio de caso de La Dorada, a través del uso de Kriging Ordinario, Kriging Universal, co-Kriging Ordinario y Kriging con Deriva Externa.
1.2.3. Preguntas de investigación •
¿En cuánto disminuye la incertidumbre asociada a la interpolación de los niveles freáticos en acuíferos libres someros, cuando la información topográfica es utilizada como variable secundaria?
•
¿La mejora observada en la interpolación del nivel freático cuando se utiliza la cota como variable auxiliar es similar en los casos de zonas planas (La Dorada) y zonas con un fuerte gradiente altitudinal (Carminales)?
•
¿Es la conductividad eléctrica del agua subterránea una variable secundaria útil en la interpolación del nivel freático cuando no existe una correlación evidente con la variable principal?
•
¿La incorporación de la información proveída por los manantiales mejora la caracterización de la tabla de agua mediante herramientas Kriging?
1.3 Hipótesis El uso de información topográfica y de la conductividad eléctrica del agua subterránea como datos secundarios para la interpolación de niveles freáticos medidos en pozos y aljibes, disminuye la incertidumbre asociada a la modelación de nivel freático mediante técnicas Kriging.
18
1.4 Justificación y alcance Conocer la configuración de la superficie freática de un acuífero libre es esencial para determinar aspectos como dirección, sentido y velocidad del flujo del agua subterránea, identificar las principales zonas naturales de recarga y descarga del acuífero, y detectar flujos locales, intermedios y regionales. Además, una buena caracterización de la tabla de agua permite un mejor diseño de las redes de observación para hidrogeoquímica ya que es necesario seleccionar varios puntos de medición en una misma línea de flujo. Por ende, es crucial modelar la superficie freática con el mejor detalle posible, a pesar de que, en la mayoría de los casos, se cuenta con pocos puntos de medición de niveles de agua y éstos a su vez suelen estar irregularmente distribuidos en el área de interés.
La geoestadística ofrece herramientas que permiten estimar valores de una variable espacial en puntos donde ésta no ha sido medida en campo, a partir de mediciones cercanas. Además, la geoestadística tiene la capacidad de estimar el error asociado a cada interpolación. Esto último es fundamental a la hora de tal información ser utilizada por los tomadores de decisiones ya que el alcance real de la información obtenida con la interpolación depende del grado de incertidumbre asociado.
Aunque la interpolación de niveles freáticos (NF) mediante técnicas geoestadísticas ha sido documentada a través de muchos estudios de caso, se ha observado que los factores que influyen sobre el rendimiento de las herramientas de interpolación no siempre son consistentes y por tal motivo es difícil seleccionar de antemano el mejor método para un set de datos específico (Li y Heap, 2014). Por consiguiente, es altamente recomendable en cualquier estudio de caso emplear más de una técnica de interpolación. Además, en la presente tesis, se propone evaluar el rendimiento de la conductividad eléctrica (CE) del agua subterránea como variable auxiliar para la interpolación de los niveles freáticos. La revisión bibliográfica realizada hasta el momento no ha encontrado reporte alguno sobre la utilización de la conductividad eléctrica como dato secundario para la interpolación de los niveles freáticos.
19 La evaluación de cuatro herramientas kriging se hará a través de datos recolectados en dos áreas de estudio. Los dos acuíferos seleccionados en la presente tesis de maestría están en Colombia, en el área de jurisdicción de la Corporación Autónoma Regional de Caldas (CORPOCALDAS). Esta entidad es la autoridad ambiental regional del departamento de Caldas, y es responsable de la administración de los recursos renovables naturales, entre ellos el agua subterránea. Recientemente, CORPOCALDAS se ha interesado por incluir las zonas de recarga de los acuíferos como determinantes ambientales; es decir, la delimitación de las zonas de recarga de los acuíferos deberá ser un factor para tener en cuenta en la revisión de los planes de ordenamiento del uso del suelo por parte de los municipios (P.A. Vásquez, comunicación personal, febrero 8, 2018). Por tal motivo, la delimitación de las principales zonas de recarga deberá ser ejecutada con las mejores herramientas disponibles.
A 2018 varios estudios hidrogeológicos realizados en los dos acuíferos objeto de la presente tesis de maestría han propuesto diversas redes de flujo (representaciones de la superficie freática), pero todas ellas presentan falencias evidentes. Algunas redes de flujo han sido elaboradas a mano a juicio del hidrogeólogo de turno (Toro, 2017), y otras aparentemente son el resultado del uso indiscriminado de algunas técnicas de interpolación (Universidad Tecnológica de Pereira, 2016), todas ellas determinísticas. Todas estas redes de flujo no ofrecen el detalle mínimo requerido para delimitar en forma clara las principales zonas de recarga de los acuíferos.
Por lo anterior, se propone el uso de las técnicas geoestadísticas para mejorar la caracterización de la superficie freática en el municipio de La Dorada y en la cuenca de la quebrada Carminales, y así obtener la información básica requerida por CORPOCALDAS para incorporar las zonas de recarga como determinantes ambientales en estos dos sectores de su área de jurisdicción.
20
2. REVISIÓN DE LITERATURA
En este apartado sólo se menciona los aspectos más fundamentales de la interpolación con métodos geoestadísticos. Isaaks y Srivastava (1989) y Webster y Oliver (2007) ofrecen una completa descripción de la teoría básica en geoestadística, con un enfoque muy práctico. Cressie (1993) presenta en sus primeros cinco capítulos los fundamentos de la geoestadística, los cuales requieren conocimientos básicos en cálculo lineal y estadística. El texto de Stein (1999) es apropiado para los interesados en profundizar en la teoría de Kriging y ofrece además un enfoque diferente al adoptado por la mayoría de los investigadores. Para los interesados en aplicar kriging bajo el ambiente de R, el texto de Bivand, Pebesma y Gómez-Rubio (2013) es muy ilustrativo.
2.1. Nociones sobre geoestadística Los procesos que actúan en el ambiente obedecen a leyes físicas y son, en este sentido, determinísticos; es decir, las variaciones que se observan en las variables ambientales tienen una causa física. Sin embargo, son tantos los procesos que se combinan e interactúan entre sí para dar resultado al medio ambiente, que pareciera que las variables ambientales fueran el resultado de fenómenos aleatorios (Webster, 2000). Por ejemplo, la posición del nivel freático en un acuífero libre, en un momento determinado, puede ser el resultado de las condiciones litológicas y estratigráficas del acuífero, del régimen de precipitación que ha antecedido la medición del nivel de agua, de los mecanismos de recarga preponderantes en el acuífero, de las bondades y deficiencias estructurales del pozo o aljibe en donde la medición fue realizada, del régimen de extracción de agua subterránea en los alrededores del punto de observación, etc. Aunque las variables ambientales parezcan el resultado de procesos aleatorios, eso no
21 significa que en realidad lo sean; tal conceptualizaciĂłn simplemente es el resultado de nuestra “ignoranciaâ€? (Isaaks y Srivastava, 1989).
El enfoque estocĂĄstico adoptado en el anĂĄlisis de los datos de campo permite evitar la complejidad del fenĂłmeno bajo estudio. Este enfoque es un “artilugioâ€? que se emplea para poder evaluar muchos fenĂłmenos ambientales. Por ende, una vez tomada la decisiĂłn de concebir los datos de campo como resultado de algĂşn proceso aleatorio, se debe definir el proceso aleatorio hipotĂŠtico que supuestamente ha dado lugar a los datos observados en campo (Isaaks y Srivastava, 1989).
Casi todos los mĂŠtodos de interpolaciĂłn pueden ser considerados como formas de ponderaciĂłn de datos. La fĂłrmula de predicciĂłn general puede ser escrita como (Webster y Oliver, 2007): đ?‘ ∗ đ?‘§(đ?‘Ľ = ∑ đ?œ†đ?‘– đ?‘§(đ?‘Ľđ?‘– ) 0)
(1)
đ?‘–=1
Siendo x0 el punto donde se desea estimar la variable de interĂŠs; xi, i = 1, 2, ‌, N son los puntos donde hay informaciĂłn; z(xi) es el valor de la variable aleatoria en el punto xi; ď Źi son los factores de ponderaciĂłn asignados a los datos; y z*(x0) es la predicciĂłn que se desea obtener.
Z(x) es una variable aleatoria, de la cual z(xi) es una realizaciĂłn. En nuestro caso, la variable
aleatoria es la posiciĂłn del nivel freĂĄtico expresado en metros sobre el nivel del mar (msnm). Los niveles medidos en un mismo pozo ubicado en el punto x1 pueden ser considerados como realizaciones de una misma variable aleatoria Z(x1). Los niveles medidos en otro pozo ubicado en el punto x2 son realizaciones de otra variable aleatoria Z(x2). Por tanto, en teorĂa, en cada punto de observaciĂłn hay un nĂşmero infinito de
realizaciones. Cada mediciĂłn de nivel en particular puede ser concebido como el fruto de un proceso aleatorio de acuerdo con alguna ley, con una distribuciĂłn de probabilidad determinada. Entonces, en el punto x la propiedad Z(x) es considerada como una variable aleatoria que tiene un valor medio ď , una varianza ď ł2, momentos de orden superior y
22 una función de distribución acumulada (cdf). El conjunto de variables aleatorias Z(x1), Z(x2),…, Z(xN) da lugar a una función aleatoria (Z(x)). Una campaña de muestreo de niveles
llevada a cabo en N pozos dentro del área de interés representa una realización de la función aleatoria. Ésta puede estar constituida por un número infinito de puntos de observación (pozos y aljibes) dentro del dominio de interés, y en cada punto de observación se podría obtener un número infinito de mediciones de nivel. Es decir, que una función aleatoria es doblemente infinita (Webster y Oliver, 2007).
Hay que recordar que, en geoestadística, se considera que las variables aleatorias están espacialmente correlacionadas, en alguna escala. Por tanto, las mediciones realizadas en puntos cercanos tienden a ser más similares que las mediciones entre puntos lejanos. Si en cada punto de observación se conociera la media, la varianza y la distribución de probabilidad del nivel freático, sería entonces posible predecir un nuevo valor de esta propiedad en cualquier lugar dentro del dominio de interés (Webster y Oliver, 2007).
Infortunadamente, en cada realización de la función aleatoria lo usual es tener una sola medición por punto de observación. Con un único valor no es posible hacer inferencias. Con el fin de superar esta limitación, la geoestadística hace uso de una suposición conocida como “estacionariedad” (Oliver y Webster, 2014). La condición de estacionariedad permite asumir que el grado de variación es el mismo de un lugar a otro. En otras palabras, la suposición de “estacionariedad” permite considerar datos tomados de diferentes puntos como miembros de una misma muestra y de ahí que se pueda utilizar el conjunto de datos observados para hacer inferencias sobre los valores centrales y demás información esencial sobre la distribución de la población.
La teoría que sustenta las herramientas geoestadísticas es compleja. Como ya se ha mencionado, una de las debilidades de este enfoque es la cantidad de supuestos que los datos observados deben cumplir para poder usar en forma correcta este tipo de herramientas. El proceso kriging inicialmente concebido se conoce actualmente como kriging ordinario (OK). A partir de él se han desarrollado variantes con el fin de abordar conjuntos de datos con características particulares. Li y Heap (2008) presentan una concisa descripción de veintiuna variantes de kriging y cinco herramientas híbridas. Cada
23 una de estas variantes ofrece una soluciĂłn particular para estimar los factores de ponderaciĂłn en la ecuaciĂłn (1).
A pesar de la complejidad asociada a la teorĂa de kriging, en general el proceso de interpolaciĂłn puede ser resumido en dos pasos (Guekie sino, Marache, Lastennet y Breysse, 2016):
Paso 1: AnĂĄlisis del variograma: El variograma es utilizado para expresar la dependencia espacial entre observaciones vecinas (Chilès y Delfiner, 1999). Cuando sĂłlo se tiene la variable primaria, el variograma puede ser calculado de acuerdo con la siguiente ecuaciĂłn: đ?‘ (â„Ž,đ?œƒ)
đ?›ž(â„Ž,đ?œƒ)
1 2 = ∑ [đ?‘?(đ?‘Ľđ?‘– ) − đ?‘?(đ?‘Ľđ?‘– +â„Ž) ] 2đ?‘ (â„Ž,đ?œƒ)
(2)
đ?‘–=1
donde N(h,ď ą) es el nĂşmero de pares de puntos separados por una distancia h en la direcciĂłn ď ą.
Si ademĂĄs de la variable primaria, se dispone de una variable auxiliar (variable secundaria), la cual estĂĄ correlacionada con la variable primaria, entonces en tal caso se utiliza el covariograma que puede ser calculado de la siguiente manera: đ?‘ (â„Ž,đ?œƒ)
đ?›žđ?‘?đ?‘† (â„Ž,đ?œƒ)
1 = ∑ [đ?‘?(đ?‘Ľđ?‘– ) − đ?‘?(đ?‘Ľđ?‘– +â„Ž) ][đ?‘†(đ?‘Ľđ?‘– ) − đ?‘†(đ?‘Ľđ?‘– +â„Ž) ] 2đ?‘ (â„Ž,đ?œƒ)
(3)
đ?‘–=1
, donde las letras Z y S se refieren a la variable primaria y secundaria, respectivamente (Chilès y Delfiner, 1999).
Con las ecuaciones 2 y 3 se pueden calcular los variogramas y covariogramas experimentales; es decir, aquellos obtenidos a partir del conjunto de datos a disposiciĂłn. En la prĂĄctica, tanto el variograma como el covariograma experimental se construyen
24 agrupando pares de datos por bandas (o clases) con un ancho de valor h, en forma análoga a como se construye un histograma. Al final se obtiene un conjunto ordenado de valores (h, ). Las decisiones que se tomen durante la construcción del variograma, como la selección del valor h, repercutirán en la calidad de la interpolación. El variograma (o covariograma) experimental consiste en semivarianzas () calculadas para anchos de banda (h) discretos. Sin embargo, el nivel freático es una variable continua. Por tal motivo, es necesario ajustar un modelo teórico de variograma al variograma experimental. Un variograma teórico es una expresión matemática que describe la forma como las variables aleatorias se correlacionan entre sí. Es una curva que ignora las fluctuaciones erráticas entre pares de datos, pero captura la tendencia general. Además, estos modelos teóricos garantizan que las predicciones no tendrán varianzas negativas (Oliver y Webster, 2014). Al igual que la construcción del variograma experimental, la selección del variograma teórico es un paso fundamental en el proceso de interpolación.
Existen varios modelos teóricos cuyas descripciones pueden ser encontradas en cualquiera de las referencias citadas al comienzo de este capítulo. Cada modelo de variograma (o covariograma) teórico seleccionado para representar a su par experimental debe ser sometido a un escrutinio estadístico con el fin de estimar su pertinencia en la representación de los datos observados. En la práctica, se seleccionan varios modelos (algunos modelos pueden ser construidos sumando dos o más modelos básicos) y entre ellos se escoge el que tiene la mejor aptitud para representar los datos de campo. Este proceso de escogencia del “mejor” modelo (para el set disponible de datos observados) generalmente se lleva a cabo mediante un método denominado validación cruzada (cross-validation). Este método de escogencia del modelo teórico de variograma más adecuado es descrito en varios textos, entre ellos Oliver y Webster (2015).
Algunos modelos de variogramas teóricos que han sido ajustados con éxito a datos de niveles freáticos son: el Esférico (Ahmadi y Sedghamiz, 2008; Kambhammettu, Allena y King (2011), Penta-esférico (Nikroo, Kompani-Zare, Sepaskhah y Fallah Shamsi, 2010),
25 Cuadrático racional (Gundogdu y Guney, 2007), y Gaussiano (Boezio, Costa y Koppe, 2006). También han sido utilizados los modelos Estable, Bessel, Circular y Mathern. Las ecuaciones que definen cada uno de los modelos de variograma utilizados en el presente trabajo pueden ser consultados en muchos textos; por ejemplo, en el capítulo 6 de Le y Zidek (2006).
Paso 2: Interpolación: Una vez seleccionado el variograma teórico que mejor se ajuste al variograma experimental, se procede a interpolar la variable de interés con ayuda de la herramienta kriging seleccionada para este fin.
El miembro más popular de esta familia de interpoladores es el Kriging Ordinario (OK). Este interpolador es relativamente versátil, y para su uso sólo es necesario conocer el variograma teórico y los datos a interpolar. Es una técnica univariada; es decir, que sólo tiene en cuenta la variable principal, en este caso, el nivel freático. Aunque en principio este miembro requiere que la variable sea estacionaria en todo el dominio (ausencia de tendencias regionales en los datos), en realidad la presencia de cualquier tendencia puede ser manejada interpolando en vecindarios muy locales; es decir, asumiendo que la estacionariedad es local (Journel y Rossi, 1989). La técnica OK es uno de los métodos utilizados en el presente trabajo.
Un método no estacionario es el Kriging Universal (UK). Este método fue propuesto por Matheron (1969). Su característica principal es definir la tendencia de los datos en función de sus coordenadas. La técnica UK estima, para cada vecindario de búsqueda, una función determinística (polinomio) que representa la tendencia de los datos en dicho vecindario. Luego, sustrae los valores del polinomio de los datos originales. Se asume que los valores residuales (errores en la regresión polinomial) son aleatorios con una media conocida cuyo valor es cero (0), por ser Kriging un método de interpolación no sesgado. Posteriormente, el método UK aplica Kriging Simple (SK) a los valores residuales. Kriging Universal también es utilizado en el presente estudio.
El método Kriging con Deriva Externa (KED) define la tendencia de los datos a través de una variable auxiliar, en vez de utilizar las coordenadas de las observaciones
26 (Wackernagel 2003). Un requisito exigido por este método es que la variable auxiliar debe presentar una fuerte correlación con la variable de interés. Además, la variable auxiliar debe contar con abundantes datos, y debe haber sido estimada en todos los puntos donde existen datos de la variable principal. En esta tesis, la variable auxiliar utilizada con este método es la cota de la superficie del terreno, la cual se ha extraído de un Modelo de Elevación Digital (DEM).
El método co-Kriging (CK) es, al igual que el método KED, una técnica multivariada y utiliza variables auxiliares para mejorar la interpolación de la variable primaria (Wackernagel 2003). La idea general es que dos o más variables pueden estar correlacionadas entre sí y, por tanto, una variable puede ser usada para predecir otra. A diferencia del KED, el método CK puede ser utilizado con variables auxiliares no exhaustivamente medidas. Con esta técnica, las variables auxiliares utilizadas han sido la conductividad eléctrica del agua subterránea (CE) y la cota.
La escogencia del método de interpolación espacial apropiado para el conjunto de datos observados es un paso crítico y nada fácil. El rendimiento de cada método depende de muchos factores. No existe una respuesta sencilla a la escogencia del método apropiado porque cada herramienta es “la mejor” sólo para situaciones específicas (Isaaks y Srivastava, 1989). Varios factores deben ser considerados al momento de la escogencia de la herramienta. La selección debe estar basada en los supuestos que exige cada método, la naturaleza y estructura espacial de los datos que conforman la variable principal, y el tamaño, distribución y disponibilidad de los datos de la variable secundaria (si se ha de utilizar alguna). Aspectos como la presencia o ausencia de tendencias generales en los datos, anisotropía, tipo de distribución de los datos, y distribución de los puntos de observación deben ser considerados (Li y Heap, 2014). En el capítulo 3 se exponen los criterios utilizados para la escogencia final de las herramientas evaluadas en la presente tesis.
27
2.2. Trabajos previos La teoría general de kriging (Matheron 1962, 1963) fue desarrollada por el matemático y geólogo francés Georges Matheron (1930 – 2000) quien trabajó en la escuela de Minas de Paris en Fontainebleau. Su trabajo traducido al inglés (Matheron, 1971) puede ser consultado
en:
http://cg.ensmp.fr/bibliotheque/public/MATHERON_Ouvrage_00167.pdf
Autores como Delhomme (1978) reconocen contribuciones hechas por otros científicos como Gandin (1965), por haber advertido la necesidad de evaluar el tipo de variabilidad espacial al momento de interpolar variables ambientales. Aunque los primeros trabajos de interpolación geoestadística estuvieron enfocados en la industria minera, muy pronto aparecieron otros campos de aplicación como la hidrogeología. Uno de los primeros estudios de caso publicados es el del acuífero costero de Huveaune en Francia (Beshes, Delhomme y Marsily, 1975). En dicho estudio se delineó el mapa piezométrico a partir de los datos de nivel freático obtenidos de 40 pozos (Delhomme, 1978).
Todos los dominios de la hidrogeología han sido abordados con herramientas geoestadísticas y probablemente todas las variantes de kriging han sido empleadas. Los enfoques han variado desde la estimación de atributos hasta la construcción de modelos predictivos. Por ejemplo, la transmisividad es una de las propiedades fundamentales de los acuíferos. Mapas sobre la variación de esta propiedad han sido obtenidos con herramientas como kriging ordinario (Lin, Tan y Rouhani, 2001; en un acuífero de Taiwan), co-kriging (Ahmed y de Marsily, 1989; usando el nivel piezométrico como variable secundaria), y kriging simple (Painter, Woodbury y Jiang, 2007; en este estudio también utilizaron co-kriging).
La evaluación de la calidad del agua subterránea también ha sido objeto de las herramientas geoestadísticas. Hussain et al. (2014) estudiaron la distribución de los sólidos disueltos totales en un acuífero de Paquistán, empleando kriging ordinario y kriging combinado con estadística Bayesiana. Nas y Berktay (2010) también utilizaron kriging ordinario para estimar la variación de algunas especies iónicas como cloruros y
28 sulfatos en un acuífero urbano en Turquía. Un uso muy extendido de la geoestadística es la generación de mapas de probabilidad de que un contaminante sobrepase una concentración determinada en el agua subterránea. Piccini, Marchetti, Farina y Francaviglia (2012) presentan un estudio de caso típico en la región de Abruzzo (centro de Italia) en donde con ayuda de Kriging Indicador determinaron las zonas de un acuífero aluvial en donde hay una alta probabilidad de que la concentración de nitratos sobrepase los 50 mg∙L-1. De manera similar, Liu, Jang y Liao (2004) evaluaron la posibilidad de que la concentración de arsénico en el agua subterránea sobrepasara el límite máximo permitido para agua de consumo humano, en la región de Yun-Lin (Taiwán). En esta oportunidad, se utilizó Kriging Indicador en un dominio tridimensional.
La geoestadística también ofrece herramientas para optimizar el diseño de redes de monitoreo, a partir de los mapas de distribución de errores en la interpolación de algún parámetro de interés. Generalmente, las zonas que presentan mayores incertidumbres en la interpolación son aquellas que tienen una menor densidad de puntos de observación. Por ende, esas zonas deberían recibir una mayor atención durante los programas de optimización de las redes de monitoreo. Sophocleous (1983) utilizó Kriging Universal para recomendar acciones de optimización en el programa de seguimiento de aguas subterráneas en el estado de Kansas, Estados Unidos. Yang, Cao, Liu y Yang (2008) llevaron a cabo un estudio similar utilizando Kriging Ordinario en la cuenca de Chaiwopu, China. Este estudio permitió recomendar la densidad óptima de pozos a construir.
El objeto principal de esta tesis tiene que ver con la interpolación de los niveles freáticos, particularmente con definir la configuración de la superficie freática o tabla de agua. Algunos autores como Varouchakis y Hristopulos (2012) han comparado el rendimiento de métodos determinísticos contra métodos estocásticos en la interpolación de los niveles piezométricos. Ellos concluyeron que, para su estudio de caso, los métodos Kriging Ordinario, Kriging Universal y Kriging con triangulación Delaunay muestran mejores resultados que los métodos de ponderación inversa de la distancia, y curvatura mínima.
29 Es usual que las superficies freáticas presenten alguna tendencia ya que el agua subterránea fluye desde niveles piezométricos altos a bajos. Por ello, autores como Kambhammettu et al. (2011) y Gundogdu y Guney (2007) utilizan Kriging Universal para interpolar los niveles freáticos.
Aboufirassi y Mariño (1983) utilizaron Kriging Universal para interpolar la tabla de agua del acuífero Souss en Marruecos, el cual exhibe una clara tendencia en sentido noreste a suroeste. Para la interpolación utilizaron los variogramas teóricos esférico y gaussiano, con resultados similares. Ambos autores compararon kriging con el método de análisis de tendencia de superficies, concluyendo que Kriging provee un mejor rendimiento.
Pucci y Murashige (1987) también utilizaron Kriging Universal para estimar la superficie freática de un acuífero en la parte central de New Jersey (Estados Unidos). Inicialmente utilizaron un set de datos compuesto por 171 valores. Los primeros resultados indicaron las zonas donde era necesario aumentar la densidad de muestreo; es decir, aquellas que presentaron las mayores incertidumbres en la interpolación. Después de efectuar una campaña de muestreo complementaria el set de datos fue incrementado a 298 puntos. Al interpolar esta cantidad aumentada de datos, se obtuvo menores incertidumbres. Rouhani (1986) también destacó la utilidad de Kriging como herramienta para optimizar el diseño del muestreo.
El uso de variables auxiliares (a veces denominado en la literatura anglosajona como “soft data”) para la estimación de los niveles freáticos también es muy extendido. La información topográfica, a través de modelos digitales de terreno, es por mucho la variable secundaria más empleada (ver por ejemplo Delbari 2013; y Boezio et al. 2006). Las técnicas más utilizadas cuando se incorporan variables auxiliares son co-Kriging y Kriging con Deriva Externa. Otras variables auxiliares como la lluvia (Moukana, Asaue y Koike, 2013) y rasgos geográficos (Varouchakis y Hristopulos, 2013) han sido exploradas para mejorar la interpolación de los niveles freáticos.
Guekie simo et al. (2016) presentan un estudio de caso típico desarrollado en el acuífero de Bordeaux al suroeste de Francia. El área de estudio fue de sólo 25.6 kilómetros
30 cuadrados. Estos autores compararon el rendimiento de cuatro métodos de interpolación: kriging ordinario, co-Kriging, co-kriging colocado y Kriging con deriva externa. La topografía de la zona de estudio fue utilizada como variable auxiliar para los tres métodos multivariados. Los autores concluyeron que kriging con deriva externa fue el método que mostró estimaciones de la tabla de agua con menores incertidumbres.
La revisión bibliográfica realizada hasta el momento no ha encontrado reportes sobre la utilización de la conductividad eléctrica (CE) como variable auxiliar para optimizar la interpolación de los niveles freáticos. Tampoco ha sido posible encontrar estudios de caso en Colombia donde se haya utilizado técnicas geoestadísticas para caracterizar la tabla de agua.
31
3. METODOLOGÍA
En este capítulo se presenta con detalle las principales actividades programadas para alcanzar los objetivos propuestos en la presente tesis. En la primera parte se describen los principales rasgos de las dos áreas de estudio. Posteriormente, se abordan las actividades claves requeridas para interpolar el nivel freático (NF) en los dos acuíferos de interés.
3.1. Áreas de estudio Las dos áreas de estudio están localizadas en el departamento de Caldas (Colombia). La primera de ellas es el municipio de La Dorada, ubicado en el extremo este del departamento de Caldas, entre las coordenadas (WGS-84) longitud -74° 38’ y -74° 50’ y latitud +5° 17’ y +5° 48’. Tiene un área de 570 km2, la altitud media es 176 msnm, y la precipitación y temperaturas medias anuales son 2060.6 mm y 27.6 °C, respectivamente. La segunda área corresponde a la cuenca hidrográfica de la quebrada Carminales, ubicada en el municipio de Palestina, entre las coordenadas (WGS-84) longitud -75° 38’ y -75° 42’ y latitud +5° 2’ y +5° 7’. Tiene un área de 32 km 2, la altitud media es 1020 msnm, y la precipitación y temperaturas medias anuales son 2316.6 mm y 19.7 °C, respectivamente (datos meteorológicos tomados de la página de IDEAM http://www.pronosticosyalertas.gov.co/mapas-graficos-tiempo-clima/indicadoresclimatologicos, descargados en abril 15, 2018. La figura 1 muestra la ubicación de las dos áreas de estudio.
Los dos acuíferos seleccionados en la presente tesis de maestría están en área de jurisdicción de la Corporación Autónoma Regional de Caldas (CORPOCALDAS). Esta entidad es la autoridad ambiental regional responsable de la administración de los
32 recursos renovables naturales, entre ellos el agua subterránea. Desde mediados de la primera década del presente siglo, CORPOCALDAS ha venido recolectando información sobre el funcionamiento de los acuíferos tanto en La Dorada como en la quebrada Carminales. En ambas regiones las aguas subterráneas son una fuente hídrica clave para las comunidades allí asentadas y para las actividades económicas que allí se desarrollan, entre ellas agricultura y turismo (P.A. Vásquez, comunicación personal, febrero 8, 2018).
Figura 1. Localización de las dos áreas de estudio.
Para la presente tesis, se han seleccionado estas dos zonas de estudio por presentar entre sí características muy disímiles, lo que permite comparar las técnicas de interpolación bajo diferentes contextos. La tabla 1 resume los principales rasgos de las dos áreas de interés.
3.2. Aspectos metodológicos En la descripción del marco metodológico, las actividades se han agrupado en cinco fases: 1) preparación de los datos; 2) exploración de los datos; 3) análisis estructural
33 (variogramas); 4) interpolación (mapeo); y 5) comparación de resultados, validación mapas, discusión y conclusiones. La figura 2 muestra el flujo de trabajo adoptado en la presente tesis, para las últimas cuatro fases.
Tabla 1. Principales rasgos de las dos áreas de estudio. Aspecto
Zona 1: La Dorada
Zona 2: Q. Carminales
Área (km2)
570
32
Cota_MAX - Cota_MIN (m)
250
650
Geología
Rocas sedimentarias detríticas (Feininger et al., 1970)
Porosidad
Primaria
Límites del área de estudio
Geográfico y administrativo
Geográfico
Tipo acuífero
Libre
Libre
Rocas volcánicas y volcanosedimentarias (Estrada, Viana y González, 2001) Secundaria y en menor medida primaria
3.2.1. Procedencia y preparación de los datos Los datos originales para la Zona 1 (La Dorada) fueron recolectados por el Grupo de Investigación en Agua y Saneamiento (GIAS) de la Universidad Tecnológica de Pereira (UTP) para CORPOCALDAS, con el objetivo de disponer de datos suficientes para interpolar la tabla de agua del acuífero somero en el municipio de La Dorada. La base original de datos está compuesta por 193 registros con datos de nivel de agua obtenidos de 121 aljibes, 26 pozos (25 de producción y 1 de observación), y 46 manantiales. Las mediciones de nivel de agua fueron realizadas entre el 5 de febrero y el 2 de marzo de 2018. El trabajo de campo también incluyó la recolección de otras variables como pH, temperatura y CE, esta última será utilizada como variable auxiliar para el coKriging (CK) utilizado en la presente tesis.
Los datos de la Zona 2 (Carminales) también fueron obtenidos por el grupo GIAS para CORPOCALDAS, en el marco de una actualización de inventario de puntos de agua en la región conocida como Santágueda – Kilómetro 41. De este inventario, se ha
34 seleccionado 104 registros con datos de nivel de agua, tomados en 3 pozos y 101 aljibes. También se ha tenido en cuenta los datos de conductividad eléctrica del agua. Estos datos fueron recolectados entre el 15 de marzo y 26 de julio de 2017.
El dato de nivel freático medido en campo en las dos áreas de interés en realidad corresponde a la profundidad del nivel de agua respecto a la altitud de la boca del aljibe o pozo (A en la figura 3). Con el fin de representar todas las estimaciones del nivel del agua respecto a un plano referencia en común (nivel medio del mar), es necesario estimar la altitud del punto desde el cual se midió la profundidad del nivel del agua. En campo, no fue posible medir la cota de cada punto (B en la figura 3) con equipos de precisión altimétrica. Por tanto, esta variable (cota del punto de observación) fue estimada con la herramienta “Extract Values To points” incluida en la caja de herramientas “Spatial Analyst” de la aplicación ArcMap (versión 10.7.0) de ARCGIS, a partir de un DEM suministrado por el proyecto ALOS-PALSAR2.
El proyecto ALOS2 (Advanced Land Observing Satellite-2) es conducido por la Agencia Aeroespacial del Japón (JAXA) y es actualmente una de las mejores fuentes de modelos digitales de elevación (DEM), con una resolución nativa de 30 y 12.5 metros. El proyecto utiliza tres tipos de sensores, siendo uno de ellos el radar de apertura sintética PALSAR (Phased Array Type L-band Synthetic Aperture Radar). La descarga de los DEM de ALOS PALSAR se lleva a cabo a través del portal Vertex (Alaska Satellite Facility’s data portal) de la NASA (https://vertex.daac.asf.alaska.edu/). La descarga de archivos DEM es gratuita. La topografía utilizada como variable auxiliar ha sido obtenida del mismo DEM.
La selección del DEM y la grilla de interpolación es un paso crítico en el presente trabajo. Para el caso de La Dorada, se tomó la decisión de utilizar un DEM con una resolución de 30 m x 30 m ya que, debido a la extensión de esta área de estudio, una resolución de 12.5 m x 12.5 m hubiese requerido una grilla de interpolación con más de tres millones de puntos, lo cual dificulta los cálculos en la plataforma R. Con una resolución de 30 m x 30 m, la grilla para la interpolación en La Dorada está conformada por sólo 593341 puntos. Para el caso de la quebrada Carminales, no hubo inconveniente alguno en utilizar el DEM con mejor resolución (12.5 m x 12.5 m).
35
Figura 2. Plan de trabajo. Ăšltimas cuatro fases.
36 La validación de los resultados en la presente tesis se hace a la luz del conocimiento hidrogeológico de las dos áreas de estudio. En particular, se evalúa si las zonas de descarga de aguas subterráneas sugeridas por los modelos interpolados coinciden con la ubicación de humedales y manantiales. Para ello, es necesario proceder con álgebra de mapas como se mencionará en la fase de evaluación y discusión. Con el fin de poder ejecutar estos cálculos, ha sido esencial sincronizar la grilla de interpolación con la ubicación de las celdas del DEM. Si los puntos de la grilla no coinciden con los centroides de las celdas del DEM, se podría obtener resultados no deseados al momento de restar la superficie freática de la superficie topográfica. Por ende, para asegurar una correcta correspondencia entre el DEM y la grilla de interpolación se ha procedido de la siguiente manera: •
Obtención del DEM: del proyecto ALOS-PALSAR2, resolución 12.5 x 12.5, portal search.asf.alaska.edu. Para La Dorada, se descargaron los DEM de alta resolución de las siguientes escenas: © JAXA/METI ALPSRP191540090 y ALPSRP191540100, año: 2009, obtenido a través de ASF DAAC, el 26 de septiembre de 2018. Para la cuenca Carminales, se utilizó el DEM de alta resolución de la escena © JAXA/METI ALPSRP270310080, año 2011, obtenido a través de ASF DAAC, el 26 de septiembre de 2018.
•
Reproyección de los DEM: Los DEM del proyecto ALOS-PALSAR tienen proyección WGS_1984_UTM_Zone_18N. Con ayuda de la herramienta “Project Raster” de ArcMAP (versión 10.7) se cambió la proyección a MAGNA_Colombia_Bogota. Para el caso de La Dorada, la resolución fue cambiada a 30 m x 30 m. La técnica de re-muestreo utilizada fue: BILINEAR. Este método calcula el valor de cada píxel a partir del promedio (ponderado por la distancia) de los valores de las cuatro celdas que rodean al píxel de interés.
•
Obtención tabla X, Y, Z: Con ayuda de la herramienta “Extraction” → ”Sample” de ArcMAP (versión 10.7), se obtuvo para cada DEM la tabla con los valores de los centroides de cada celda (X y Y) y el valor correspondiente de la elevación (en msnm). La técnica de re-muestreo utilizada fue: BILINEAR. Esta técnica es útil para los datos continuos aunque suaviza un poco los datos, pero a diferencia del método CÚBICO, no genera en el ráster de salida valores que se encuentren fuera
37 del rango del ráster de entrada (tomado de la ayuda en línea ArcGIS Desktop https://desktop.arcgis.com/es/arcmap/10.7/tools/environments/resamplingmethod.htm). •
Obtención shapefile de puntos: Con ayuda de ArcMAP (versión 10.7) se generó un shapefile para cada una de las zonas de estudio a partir de las dos tablas generadas en el punto anterior. Utilizando la herramienta “Selection” → “Selecion by Location” se descartaron los nodos que no están contenidos en el shapefile que define los límites de cada una de las dos áreas de estudio. De esta forma se preparó la grilla para la interpolación de las dos áreas de estudio.
La altura del nivel freático respecto al nivel medio del mar (C en la figura 3) es la variable que se desea interpolar. Los datos de nivel freático recolectados en La Dorada fueron obtenidos de pozos, aljibes y manantiales.
Todos los puntos de observación están georreferenciados (MAGNA-SIRGAS). En números, la diferencia entre MAGNA-SIRGAS y WGS84 es muy pequeña. A efectos de calcular los variogramas y realizar otras operaciones matemáticas, es necesario expresar la localización de los puntos de observación en términos de coordenadas planas. Por tal motivo, los puntos tanto de La Dorada como de la cuenca Carminales fueron proyectados al sistema MAGNA_Colombia_Bogotá (proyección Transverse Mercator) que tiene como meridiano central -74.07750792 y como latitud de origen 4.59620042. El cambio de coordenadas fue realizado con ayuda de la herramienta “Project” de la caja de herramientas “Projections and Transformations” de la aplicación ArcMap (versión 10.7.0) de ESRI.
Para La Dorada se prepararon cinco versiones del set de datos. Tres de ellas para aplicar los métodos kriging ordinario (OK), kriging universal (UK) y kriging con deriva externa (KED): la primera versión contiene todos los datos (191 registros, dos registros fueron excluidos, ver explicación en la página 50); la segunda versión toma en consideración únicamente los datos estáticos (es decir, mediciones no afectadas por la explotación de algún pozo o aljibe), para un total de 146 registros; la tercera versión excluye todos los manantiales, lo cual da un total de 102 registros. La cuarta y quinta versiones fueron
38 preparadas para aplicar co-kriging (CK): en la cuarta versión, se preparó un subconjunto con 130 registros que contiene datos tanto de nivel freático (NF) como de conductividad eléctrica (CE). La quinta versión es un set de datos de 175 registros con información de conductividad eléctrica y cota, para simular el caso en el que la variable secundaria tiene una densidad de muestreo mayor que la variable de interés.
Figura 3. Variable para interpolar. Nivel freático respecto al nivel medio del mar (C).
Para el caso de la cuenca Carminales, el nivel de detalle de la información recolectada en campo no permitió discriminar la lectura entre niveles estáticos o dinámicos (estos últimos son los afectados por la extracción de agua del pozo o aljibe). Además, las mediciones únicamente se hicieron en pozos y aljibes, no hay datos de manantiales. Para este estudio de caso, se preparó dos versiones de datos para aplicar las herramientas OK, UK y KED: la primera contiene 102 registros y se considera como el set completo. La segunda versión sólo contiene 88 registros, como resultado de haber excluido catorce puntos de observación que están ubicados cerca pero fuera de la cuenca de la quebrada Carminales. Para aplicar el método CK, se preparó otras dos versiones de datos: un subconjunto con información de las variables primaria y secundaria conformada por 80 registros, y otro set de datos con 102 registros para simular el caso en el que la variable secundaria tiene una densidad de muestreo mayor que la variable principal. El Anexo A contiene la información de todos los puntos considerados en el presente trabajo.
39 De otro lado, con ayuda de representantes de las comunidades asentadas en las dos áreas de interés se identificaron puntos que corresponden a humedales, lagunas, manantiales y tramos de cauces en donde hay flujo base en época de estiaje. Doce de estos puntos están ubicados en la zona de La Dorada y cuatro en la cuenca Carminales. Estos puntos no fueron incluidos en el ejercicio de interpolación, pero sí han sido utilizados para verificar la consistencia de los resultados obtenidos. En todos los mapas, estos puntos están identificados como “puntos auxiliares”.
Las nueve versiones de datos previamente mencionadas fueron preparadas en formato texto (delimitado por tabulaciones). Para la manipulación y procesamiento de los datos se utilizaron las siguientes aplicaciones: Excel, versión Office 365 de Microsoft; ArcMap versión 10.7.0 de ESRI; R versión 3.5.1 de R Foundation for Spatial Computing, y RStudio versión 1.2.1335 de RStudio Inc. Para cada zona de estudio se preparó un archivo shapefile tipo polígono que define el área de trabajo. Todos los cálculos fueron confinados al área definida por ambos archivos.
El ambiente R ofrece varios métodos para importar y exportar datos. Algunos de ellos han sido utilizados en esta tesis. El Anexo B contiene los guiones (“scripts”) en lenguaje R requeridos para llevar a cabo todos los cálculos.
3.2.2. Exploración de los datos Antes de evaluar las posibles relaciones estructurales entre los datos, es necesario evaluar dichos datos a través de herramientas estadísticas y gráficas, con el fin de obtener un mejor conocimiento sobre ellos. La exploración de los datos se debe enfocar en la detección de errores que puedan afectar drásticamente la interpolación. También se debe identificar características como presencia de tendencias regionales en los valores, o posible existencia de más de una población estadística dentro del set de datos a evaluar.
Para la exploración de datos, se ha aprovechado las bondades que ofrece la caja de herramientas del paquete “Geostatistical Analyst” de ArcMap, pero también se han utilizado varios paquetes que brinda R, como “gstat”, así como las herramientas a
40 disposición en Microsoft Excel. Se han construido histogramas con el fin de estimar la distribución estadística de los datos. También se ha evaluado si hay correlaciones lineales entre la variable principal (NF) y las variables auxiliares (cota y CE). Datos que aparentemente hacen parte de poblaciones estadísticas ajenas a la de interés han sido removidos antes de iniciar el análisis estructural de los datos (ver páginas 50 y 88).
3.2.3. Análisis estructural de los datos El propósito del análisis estructural de los datos, desde el punto de vista geoestadístico, es describir y modelar la manera en que una variable regionalizada está espacialmente estructurada. Para ello, la geoestadística pone al servicio varias herramientas, siendo el variograma la más reconocida (Petitgas, Woillez, Rivoirard, Renanrd y Bez, 2017). El variograma mide la variabilidad media entre dos puntos en función del vector de distancia entre ellos. La figura 4 muestra dos variogramas hipotéticos típicos, uno experimental (tendencia de los puntos negros) y uno teórico (curva azul, variograma ajustado a los datos experimentales). Para el cálculo de los variogramas experimentales y teóricos, se han utilizado los paquetes de R: “gstat” y “sp”. El Anexo B presenta los scripts elaborados para llevar a cabo los cálculos en la plataforma R.
En el presente trabajo, se han estimado variogramas experimentales isotrópicos y anisotrópicos. En cada ejercicio de estimación del variograma, se han variado los parámetros ancho y número de bandas (“lags”). Estos dos parámetros, sumados al tamaño de la muestra, tienen efectos notables en la configuración del variograma experimental. Generalmente, si la muestra tiene menos que 50 datos, los variogramas experimentales tienden a ser erráticos y no muestran en forma clara la estructura espacial de la variable regionalizada de interés (Webster y Oliver, 2007). En el presente trabajo, todos los sets de datos tienen más de 50 datos.
El número de pares de muestras dentro de cada clase (o lag) es un factor importante para considerar al momento de modelar el variograma (Li y Heap, 2008). Burrough y McDonnell (1998) sugieren que dentro de cada clase (lag), el número mínimo de pares debe estar en el rango 50 – 100, con el fin de obtener variogramas estables. Si se reduce mucho el ancho de cada banda, el número de pares de observaciones cuyas distancias
41 queden dentro de cada clase posiblemente será muy bajo. Si el ancho de las bandas es muy grande, posiblemente se tendrá como producto un variograma con poco detalle. Por lo anterior, la selección del ancho de banda debe considerar ambos aspectos. Estas sugerencias han sido tenidas en cuenta en la construcción de todos los variogramas experimentales.
Figura 4. Variograma típico
Otra regla de oro indica que el producto entre el número de bandas o clases y el ancho de ellas no debe superar la mitad de la distancia máxima obtenida entre un par de puntos en el dominio de estudio (Oliver, 2010). En el presente trabajo, se ha utilizado como máxima ventana de corte para los variogramas experimentales un tercio de la mayor distancia posible en el dominio de estudio, en cumplimiento de la regla de oro arriba mencionada. Para el caso de La Dorada, la máxima distancia observada entre un par de puntos es 44500 metros; es decir, que la ventana de corte es aproximadamente 18000 metros. Para la cuenca Carminales, el eje principal de la cuenca tiene una longitud aproximada de diez kilómetros. Aquí, se ha utilizado una ventana máxima de seis kilómetros, aunque para la mayoría de variogramas la ventana de corte estuvo por debajo de cuatro kilómetros.
42 El siguiente paso es ajustar un modelo teórico (curva o superficie) que mejor describa la tendencia general del variograma experimental, mientras se ignora las fluctuaciones erráticas entre punto y punto. Las funciones seleccionadas (curvas en el caso los dominios bidimensionales) deben garantizar que las varianzas estimadas de las combinaciones de valores sean todas positivas. Funciones simples que cumplan con este requerimiento ya han sido desarrolladas y han sido ampliamente descritas por diversos autores (ver por ejemplo Oliver y Webster, 2015). Kitanidis (1997, p.85) recomienda seguir los siguientes dos principios en la selección del mejor variograma teórico: •
Consistencia con las observaciones: El variograma debe estar en consonancia con los datos, particularmente si el set de datos es grande.
•
Consistencia con otra información: Algunos rasgos del variograma no pueden ser totalmente revelados por el conjunto de datos a disposición y, por tanto, es necesario recurrir a información complementaria. De esta forma, la selección del mejor variograma también depende del juicio del investigador.
En el presente trabajo, se han considerado únicamente modelos cuya estructura define la presencia de un “rango” y un “sill”; es decir, modelos que establecen una distancia a partir de la cual se asume que no hay correlación espacial entre datos (rango), y una varianza total máxima (sill). En la literatura anglosajona, las funciones que definen este tipo de modelos se denominan “bounded functions”. Una primera mirada a los variogramas experimentales obtenidos en las dos áreas de estudio sugiere la existencia de un “sill” y un “rango”. Por ende, modelos como el lineal y el potencial (“non-bounded functions”) no fueron considerados en este estudio.
El proceso de selección del mejor modelo de variograma depende en parte de la técnica de kriging a utilizar en la interpolación. Por ejemplo, en OK se utiliza directamente los valores de nivel freático en la elaboración del variograma experimental, pero en UK o en KED se construye el variograma a partir de los valores residuales obtenidos después de haber sustraído las tendencias en el nivel freático definidas por las coordenadas (para el caso de UK) o por la variable auxiliar (caso KED). En el caso de CK, se utilizaron como covariables la CE y la Cota. Debido a que no todos los registros con medición de nivel
43 freático cuentan con datos de CE, fue necesario definir versiones adicionales de conjunto de datos para cada una de las dos áreas de estudio con el fin de aplicar CK.
La figura 5 simboliza los 107 ejercicios de interpolación diseñados y realizados en la presente tesis. Las etiquetas de cada rectángulo identifican cada ejercicio. En cada etiqueta se informa sobre el conjunto de datos utilizado (por ejemplo, 191 registros), la herramienta de interpolación empleada (por ejemplo, OK), y si el variograma ajustado fue omnidireccional (ISO) o direccional (ANI). Los cuatro rectángulos coloreados indican el apartado del presente documento donde se abordan diferentes ejercicios.
Para el caso de los variogramas omnidireccionales, en los tres primeros ejercicios se hicieron ensayos con varios modelos (algunos combinando más de un modelo), tratando de hallar la mejor opción para un mismo variograma experimental. En el cuarto intento, se modificó el variograma experimental (variando el ancho y número de clases) y de nuevo se procedió a seleccionar el modelo teórico que mejor se ajustara al nuevo variograma. Para el caso de los variogramas direccionales, en los cuatro intentos se utilizó el mismo modelo teórico identificado para sus contrapartes omnidireccionales, pero esta vez se calcularon variogramas experimentales en cuatro direcciones: 0°, 45°, 90° y 135° (en la dirección de las manecillas del reloj) con una tolerancia de ángulo de ±22.5°. Para el ajuste del modelo teórico, se utilizó el parámetro anis de la función vgm del paquete gstat de R. El parámetro anis permite definir la relación entre los ejes de mínima y máxima continuidad de los datos (mínima continuidad/mayor continuidad). En cada intento, se generaron modelos modificando este parámetro entre 0.1 y 0.9 (con incrementos de 0.1) y al final se escogió aquel modelo con mejor ajuste.
76 variogramas teóricos fueron ajustados para los datos de La Dorada y 31 para la cuenca Carminales. Los ejercicios fueron agrupados como se indica con los cuadros anaranjados de la figura 5. De cada grupo se escogió el mejor modelo, de tal forma que 17 modelos fueron finalmente escogidos para la fase de interpolación. La selección del mejor modelo de variograma en cada grupo se llevó a cabo con validación cruzada (“cross-validation”), teniendo en cuenta: 1) el cálculo de los errores ME, MAE, MSE2, RMSE, ASE, RMSSE, D (ver numeral 3.2.5); 2) la ecuación de regresión entre los valores
44 ajustados y observados (R2), y 3) el comportamiento (tendencia) de los errores calculados. Para las técnicas OK, UK y KED, la validación cruzada se ejecutó con la función krige.cv del paquete gstat de R. Para la técnica CK, la validación cruzada se estimó con la función gstat.cv del paquete gstat de R.
Figura 5. Esquema, ejercicios para seleccionar los mejores modelos de variograma
45 Los modelos de variograma obtenidos en esta fase del trabajo tambiĂŠn han sido analizados a la luz de lo que ellos pueden decir acerca del comportamiento espacial del nivel freĂĄtico. AquĂ se ha tenido en cuenta la varianza estructural; es decir, la varianza debida a la dependencia espacial de los datos, explicada por el modelo de variograma. SegĂşn HernĂĄndez-Stefanoni y Ponce-HernĂĄndez (2006), la varianza estructural es calculada conforme a la ecuaciĂłn (4): đ?œŽ 2 − đ??ś0 đ?‘†đ?‘‰ = ∙ 100 đ?œŽ2
(4)
, donde SV es la varianza estructural (expresada en porcentaje), ď ł2 es la varianza total, y C0 es el efecto nugget.
En el presente estudio, la CE no cumple con algunas propiedades que deberĂan tener las variables auxiliares para optimizar la interpolaciĂłn del NF. Por ejemplo, no se encuentra relaciĂłn alguna entre NF y CE. AdemĂĄs, la densidad de muestreo de CE no es mayor que la de la variable principal. A pesar de lo anterior, se ha procedido con los cĂĄlculos de cokriging con el fin de observar si es posible obtener una mejora en la interpolaciĂłn fruto del azar.
Para La Dorada se cuenta con 175 registros que contienen a la vez datos de NF como de CE. Con el propĂłsito de simular un bajo muestreo de la variable de interĂŠs (NF) respecto a la variable auxiliar (CE), el conjunto de 175 registros se ha dividido en dos: un primer grupo compuesto por 130 registros en el que el nivel freĂĄtico fue tomado en un estado de reposo (nivel estĂĄtico), anĂĄlogo al set de 146 registros mencionado con anterioridad. El set de 130 registros ha sido utilizado como fuente de datos para la variable principal. El set completo (175 registros) ha sido utilizado como fuente de datos para la variable auxiliar. Para el caso de la cuenca Carminales se procediĂł en forma similar, definiendo un subconjunto de 80 datos con datos de NF y uno de 102 con los datos de CE.
46
3.2.4. Interpolación de los niéveles freáticos El nivel freático es una variable continua que generalmente muestra alguna tendencia en el dominio de estudio ya que el agua subterránea requiere de algún gradiente para moverse. En otras palabras, el nivel freático se comporta usualmente como una variable regionalizada no estacionaria. Por consiguiente, para su interpolación se usa con frecuencia métodos geoestadísticos que abordan el problema de no estacionariedad. A continuación, se mencionan algunos aspectos generales tenidos en cuenta en la presente tesis para la interpolación del nivel freático: •
Los valores para interpolar son puntuales. Es decir, se asume que el soporte de muestreo de los valores a estimar es el mismo que el de los datos. En realidad, en términos de la medición de niveles freáticos, es difícil conocer con exactitud el soporte de muestreo de estos datos, ya que muchas veces los niveles que se miden a boca de pozo son un promedio de niveles piezométricos de varias capas acuíferas. El único caso en el que se podría tener plena confianza con el soporte de muestreo de los niveles sería si todos los datos procedieran de una red de observación compuesta por piezómetros de filtro corto, todos captando aguas de una misma capa acuífera. Este escenario es una utopía en la mayoría de las áreas de estudio. El hecho de interpolar niveles que proceden de soportes de muestreo diferentes puede ser fuente de fluctuaciones erráticas (efecto “Nugget”) en los semivariogramas.
•
El vecindario de interpolación fue definido ajustando el número máximo de puntos a considerar (parámetro nmax de la función krige). Por cada mapa se han construido tres versiones, desde un vecindario global (nmax = todos los puntos) hasta un vecindario muy local (nmax = 5). La tercera versión corresponde a un escenario intermedio (nmax = 15).
•
Para modelar los variogramas, se dio más importancia a la calidad del ajuste para las primeras bandas (clases) que para las últimas. Esto se debe a que los factores de ponderación para distancias cortas (representadas en las primeras bandas) son mayores que para grandes distancias (representadas en las últimas bandas).
47
3.2.5. EvaluaciĂłn de los mapas, discusiĂłn y conclusiones Con el auge de los mĂŠtodos de interpolaciĂłn espacial, tambiĂŠn hay un interĂŠs cada vez mayor en estimar la exactitud y precisiĂłn de los mapas generados (Li y Heap, 2008). Como sucede con cualquier tĂŠcnica de modelaciĂłn estadĂstica, los mĂŠtodos de interpolaciĂłn espacial tambiĂŠn producen errores asociados con la estimaciĂłn. Las estadĂsticas de las diferencias (valores absolutos o al cuadrado) entre los valores medidos y estimados en los puntos de observaciĂłn son utilizados a menudo como indicadores del grado de inexactitud del mĂŠtodo empleado. Varias mediciones de error han sido propuestas. En la presente tesis se han utilizado las mediciones de error que corresponden a las ecuaciones 5 a 11. Estas son: •
Error Medio (ME). EcuaciĂłn 5.
•
Error absoluto medio (MAE). EcuaciĂłn 6.
•
Error raĂz cuadrada de la media (RMSE). EcuaciĂłn 7.
•
Error estandarizado medio (MSE2). EcuaciĂłn 8.
•
Error estĂĄndar promedio (ASE). EcuaciĂłn 9.
•
Error raĂz cuadrada de la media, estandarizada (RMSSE). EcuaciĂłn 10.
•
Ă?ndice de Willmott (D). EcuaciĂłn 11.
El significado de los anteriores Ăndices ha sido explicado en textos como Johnston, Ver Hoef, Krivoruchko y Lucas (2001); Oliver (2010); Oliver y Webster (2015); Li y Heap (2011, 2014); y Willmott (1981, 1982). Adicionalmente, el Coeficiente de CorrelaciĂłn de Pearson (r2) entre los valores observados y los interpolados tambiĂŠn ha sido utilizado en el presente estudio para evaluar el rendimiento de los ejercicios de interpolaciĂłn. đ?‘›
1 đ?‘€đ??¸ = ∑(đ?‘?đ?‘– − đ?‘œđ?‘– ) đ?‘›
(5)
đ?‘–=1
, donde n = nĂşmero de observaciones; p = valor estimado o interpolado; o = valor observado.
48
đ?‘›
1 đ?‘€đ??´đ??¸ = ∑|đ?‘?đ?‘– − đ?‘œđ?‘– | đ?‘›
(6)
đ?‘–=1
, donde n = nĂşmero de observaciones; p = valor estimado o interpolado; o = valor observado. |∙| denota valor absoluto.
đ?‘›
1 đ?‘…đ?‘€đ?‘†đ??¸ = [ ∑(đ?‘?đ?‘– − đ?‘œđ?‘– )2 ] đ?‘›
0.5
(7)
đ?‘–=1
đ?‘›
1 đ?‘€đ?‘†đ??¸2 = ∑(đ?‘?đ?‘ đ?‘– − đ?‘œđ?‘ đ?‘– ) đ?‘›
(8)
đ?‘–=1
, donde ps = valor interpolado estandarizado; os = valor observado estandarizado.
2 0.5
đ?‘›
đ?‘›
đ?‘–=1
đ?‘–=1
1 đ??´đ?‘†đ??¸ = [ ∑ (đ?‘?đ?‘– − (∑ đ?‘?đ?‘– ) /đ?‘›) ] đ?‘›
đ?‘›
1 đ?‘…đ?‘€đ?‘†đ?‘†đ??¸ = [ ∑(đ?‘?đ?‘ đ?‘– − đ?‘œđ?‘ đ?‘– )2 ] đ?‘›
(9)
0.5
(10)
đ?‘–=1
đ??ˇ = 1−
∑đ?‘›đ?‘–=1(đ?‘?đ?‘– − đ?‘œđ?‘– )2 ∑đ?‘›đ?‘–=1(|đ?‘?đ?‘–′ | + |đ?‘œđ?‘–′ |)
2
(11)
, donde n = nĂşmero de observaciones; pi = valor interpolado; oi = valor observado; đ?‘?đ?‘–′ = đ?‘?đ?‘– − đ?‘œĚ… y đ?‘œđ?‘–′ = đ?‘œđ?‘– − đ?‘œĚ… ; siendo đ?‘œĚ… el promedio de los valores observados.
La evaluaciĂłn de los modelos de interpolaciĂłn a travĂŠs de los ocho Ăndices descritos con anterioridad debe hacerse teniendo como marco de referencia el significado fĂsico de la variable de interĂŠs. Para el caso de la presente tesis, se ha empleado ĂĄlgebra de mapas para ver la consistencia de los resultados de interpolaciĂłn con caracterĂsticas
49 hidrogeológicas conocidas o sugeridas por otros estudios hidrogeológicos en las dos áreas de interés, como GEOSUB (2009) y Vargas (2009).
Se propone comparar dos superficies: la topográfica y la freática, esta última construida con las herramientas kriging. Si a la primera se le resta la segunda, como resultado se tendrá dos tipos de terrenos: cuando la resta es positiva, significa que la tabla de agua (o el nivel piezométrico) está por debajo de la superficie topográfica, el terreno deberá estar seco y, si la infiltración directa de la lluvia local es un mecanismo importante de recarga, entonces esta categoría identificará aquellas zonas con aptitud para recargar el acuífero somero. De otro lado, cuando la resta es negativa, la superficie freática o nivel piezométrico está por encima de la topografía del terreno y, por consiguiente, el terreno puede estar anegado o el acuífero puede estar semi-confinado; las áreas que corresponden a restas negativas representan zonas potenciales de descarga de agua subterránea y allí deberían aparecer manantiales.
Una vez las zonas potenciales de recarga y descarga han sido delimitadas, se comparan con la ubicación de manantiales y con los puntos “auxiliares” suministrados por representantes de las comunidades locales. Si todos los manantiales coinciden con las “zonas potenciales de descarga”, entonces la superficie freática estimada está en concordancia con los datos disponibles. Si varios manantiales quedan en zonas potenciales de recarga, entonces será necesario revisar el modelo utilizado. Los hallazgos encontrados en la evaluación de las superficies freáticas generadas hacen parte de la discusión y conclusiones de la presente tesis de maestría.
50
4. RESULTADOS Y DISCUSIÓN
En este capítulo se muestran y discuten los resultados obtenidos en el presente trabajo. En las primeras dos secciones se abordan los resultados alcanzados en las dos áreas de estudio por separado. En la tercera sección se hacen observaciones sobre los hallazgos encontrados en los dos acuíferos, y se discuten las bondades y limitaciones de los mejores modelos encontrados.
4.1. La Dorada A continuación, se describe el comportamiento de los datos recolectados en La Dorada (Caldas) así como los resultados obtenidos en el análisis estructural de los mismos y en la generación de las superficies freáticas a través de la aplicación de diferentes herramientas kriging.
4.1.1. Exploración de datos, La Dorada La figura 6 muestra la ubicación de todos los puntos incluidos en el set de datos de La Dorada. Los colores de los símbolos corresponden a diferentes rangos de altitud del nivel freático respecto al nivel medio del mar. Los doce puntos auxiliares ubicados por representantes de comunidades (humedales, manantiales, lagunas, tramos de cauces con flujo base) también son mostrados en el mapa. Es evidente que los puntos exhiben una tendencia regional, ya que los valores más bajos se concentran al costado este en el sector norte del área de estudio. Los niveles más bajos están cerca del río Magdalena, en concordancia con lo sugerido por estudios hidrogeológicos previos que sugieren (sin
51 demostrarlo) descarga de agua subterránea hacia este río. También es evidente que los puntos de observación están desigualmente distribuidos.
La figura 7 presenta el histograma y la gráfica de cajas y bigotes para el set de 193 registros de niveles freáticos. El conjunto de datos es ligeramente asimétrico a la derecha (coeficiente de asimetría = +0.89). Los dos valores mayores del nivel freático (272 y 260 msnm) corresponden a sendos manantiales ubicados en pequeñas colinas al sur del área de estudio, y parecen diferenciarse del resto de datos desde un punto de vista estadístico. Ambos manantiales podrían pertenecer a un pequeño acuífero colgado. Por tanto, ambos datos han sido excluidos.
La gráfica de cajas y bigotes mostrada en la figura 7 sugiere que el set de datos sigue aproximadamente una distribución normal; de hecho, la media y la mediana son similares. Sin embargo, para confirmar esta observación se ha construido una gráfica QQPlot Normal, la cual se muestra en la figura 8. En el eje de las ordenadas se muestran los datos estandarizados de nivel freático. Entre más cerca estén los datos de la recta 1 a 1 (línea roja), más cercana es la distribución de la muestra a una distribución normal teórica. Como se puede observar, en general el set de datos sigue una distribución normal y, por ende, se considera que no es necesario hacer alguna transformación de los datos antes de construir los variogramas. En la figura 8 se señalan los valores extremos (272 y 260) que claramente se alejan de la recta roja. Otros datos en los extremos también se alejan sensiblemente de la recta roja, pero se ha decidido incluirlos en el ejercicio de interpolación ya que, de acuerdo con el histograma, parecen corresponder a la misma población.
La figura 9 muestra la relación entre el nivel freático y la cota del terreno. Es evidente la existencia de una fuerte correlación lineal entre ambas variables. Este hecho es prerrequisito para utilizar la cota del terreno como variable auxiliar al momento de interpolar el nivel freático. Para el caso de los manantiales (identificados con el símbolo “diamante”), la correlación perfecta se debe simplemente al hecho de que para estos puntos se ha asumido que el nivel freático concuerda con la cota de la superficie.
52
Figura 6. Mapa ubicaciรณn puntos de observaciรณn, La Dorada (Caldas)
53 La misma exploración realizada al set completo de datos se hizo a los dos subconjuntos considerados en este trabajo para La Dorada: sólo niveles estáticos (146 registros) y sólo niveles estáticos sin manantiales (102 registros). La figura 10 muestra los histogramas respectivos. Los dos subconjuntos de datos obtenidos ostentan una mejor simetría que el set completo, lo cual se refleja en el coeficiente de asimetría, esta vez muy cercano a cero (-0.29 y 0.22). En ambos subconjuntos no han sido tenidos en cuenta los dos valores extremos 272 y 260 suprimidos en el conjunto mayor.
Figura 7. Histograma y diagrama de Cajas y Bigotes, datos de nivel freático, La Dorada (Caldas)
Figura 8. Gráfica QQPlot Normal, nivel freático, La Dorada (Caldas)
54 Los dos subconjuntos también muestran una forma cercana a la típica para una distribución normal, un poco más aplanada que la normal estándar (curtosis -0.29 y 0.08). Por ende, no ha sido necesario considerar transformación alguna de los datos originales de nivel freático. La figura 11 muestra la configuración de la red de puntos de observación para cada uno de los dos subconjuntos.
Figura 9. Nivel freático vs cota del terreno, La Dorada (Caldas)
Respecto a la conductividad eléctrica, no se observa ninguna relación lineal con el nivel freático en los datos de La Dorada. En la figura 12, a manera de ejemplo, se ha dibujado la recta de tendencia para los datos obtenidos de aljibes. La pendiente de la recta obtenida es casi cero (0), lo que indica una correlación nula. Este comportamiento viola el supuesto de que las variables auxiliares deben estar en alguna medida correlacionadas con las variables de interés. En total, se cuenta con 175 registros con información tanto de niveles freáticos como de conductividad eléctrica. A diferencia de la cota, la cantidad de datos de conductividad eléctrica puede considerarse como no exhaustiva, lo cual también dificulta la utilización de este parámetro como variable auxiliar en algunos métodos.
55
Figura 10. Histogramas para dos subconjuntos de datos de nivel freรกtico, La Dorada (Caldas)
Figura 11. Configuraciรณn red puntos de observaciรณn subconjuntos 146 y 102, NF, La Dorada (Caldas)
4.1.2. Construcciรณn y selecciรณn de variogramas, La Dorada Este numeral estรก dividido en dos apartados: por un lado, se muestran los resultados en el proceso de selecciรณn de los mejores variogramas teรณricos que serรกn utilizados en la generaciรณn de los mapas de NF con las herramientas OK, UK y KED. En la segunda parte se muestra el proceso de selecciรณn de los mejores variogramas para la aplicaciรณn del mรฉtodo de co-kriging CK.
56
Figura 12. Nivel freático vs conductividad eléctrica, La Dorada (Caldas)
Selección de los variogramas para la aplicación de OK, UK y KED, La Dorada Con el fin de facilitar el análisis y selección de los mejores modelos de variogramas, se han tomado en consideración dos aspectos: 1) el ajuste visual del variograma teórico a los datos disponibles, y 2) la magnitud y comportamiento de los errores obtenidos al aplicar validación cruzada usando cada modelo de variograma con los respectivos datos.
Las tablas 2, 3 y 4 muestran los modelos de variogramas ajustados para los conjuntos de datos de 191, 146 y 102 registros, respectivamente. Las opciones marcadas con código XXX-XX-ISO-X corresponden a variogramas omnidireccionales, mientras que las opciones con código XXX-XX-ANI-X pertenecen a variogramas direccionales. Los datos que aparecen en las columnas 3 a 8 son las varianzas y rangos, y están ordenados según como se describe cada modelo en la segunda columna. Obsérvese que, por definición, el rango del “Nugget” es cero (0). Los datos de la novena columna (Dir. = dirección) son ángulos, contados a partir del norte (cero) y aumentando según el movimiento de las manecillas del reloj. El ángulo indica la dirección con la mayor continuidad espacial de los datos; es decir, aquella dirección donde la tasa de cambio de los datos es menor. La décima columna indica la relación entre las direcciones de mínima continuidad (numerador) y máxima continuidad (denominador) de los datos. Esta relación varía entre cero y uno, y a medida que se hace menor, más anisotrópico es el medio. Es decir,
57 una tasa de anisotropía de 1.0 indica que el medio se considera isotrópico. SV representa la varianza estructural definida como la relación entre la varianza parcial dividida por la varianza total (varianza parcial + Efecto Nugget). A medida que los variogramas explican en mayor proporción las varianzas observadas, este indicador se hace mayor. La última columna corresponde al índice Kappa (uno de los parámetros del modelo “Matheron”). Los modelos seleccionados están resaltados en verde. En letras rojas se indican aquellas opciones en donde se detectó algún problema numérico durante el ajuste automático del variograma teórico, como no convergencia después de 200 iteraciones o existencia de modelos singulares. No todos los modelos fueron ajustados en forma automática.
La figura 13 muestra a manera de ejemplo cuatro variogramas experimentales omnidireccionales y sus respetivos variogramas teóricos. Estos variogramas han sido construidos con el set de 191 datos. El primer variograma está construido a partir de los valores originales de nivel freático (método OK). En general el NF muestra una clara estructura espacial lo cual ha facilitado el ajuste de los variogramas teóricos. Variogramas experimentales más erráticos se han observado cuando éstos son construidos a partir de datos residuales, como sucede con las técnicas UK (gráficas b y d de la figura 13) y KED (gráfica c de la figura 13). En el caso de KED, en la mayoría de variogramas experimentales se observó un importante efecto Nugget. De hecho, algunos variogramas experimentales parecen representar únicamente un efecto Nugget; es decir, no exhiben ninguna relación estructural clara, lo cual ha dificultado en gran medida el ajuste de los variogramas teóricos.
Las gráficas b y d de la figura 13 muestran otro hecho relevante en el proceso de selección de los mejores variogramas: ambas gráficas muestran dos modelos que tratan de ajustarse a un mismo variograma experimental. El primero (b) está compuesto por los modelos Nugget y Matheron, y exhibe un apreciable efecto Nugget (SV = 0.59). El segundo (d) está compuesto por los modelos Gaussiano, Nugget y Esférico y, a diferencia del anterior, el efecto Nugget es insignificante (SV 1.0). Los factores de ponderación que kriging asigna a los valores observados durante el proceso de interpolación pueden variar de manera significativa dependiendo del modelo de variograma teórico asignado. Por consiguiente, la selección del variograma teórico es fundamental en la generación
58 de las superficies interpoladas. Aquellos modelos que experimentaron dificultades durante su ajuste automático, como falta de convergencia después de 200 iteraciones, o presencia de valores singulares, fueron descartados al momento de elegir los mejores variogramas teóricos.
La figura 14 muestra la generación de variogramas experimentales (y sus respetivos modelos ajustados) para el set de 146 registros, usando un modelo de variograma tipo Nugget + Bessel, en cuatro direcciones (0°, 45°, 90° y 135°), con una tolerancia de ±22.5° para cada dirección. El agua subterránea se mueve gracias a la existencia de gradientes piezométricos. Por tanto, el nivel freático se caracteriza por ostentar tendencias regionales, así como una anisotropía importante. La mayor continuidad en los valores del nivel freático corresponde a la configuración de las curvas equipotenciales; es decir, aquellas curvas que unen puntos con igual valor en el nivel freático. El agua subterránea fluye de manera perpendicular a dichas curvas y esa es justamente la dirección de mayor tasa de cambio en el nivel.
Figura 13. Variogramas experimentales y teóricos omnidireccionales (las etiquetas de los puntos indican cantidad de pares de puntos en cada banda)
59 La figura 6 ofrece una idea general sobre el movimiento regional del agua subterránea en La Dorada. Los menores valores del nivel freático están ubicados en la zona nororiental, mientras que los mayores valores están al suroeste. Por consiguiente, se podría argumentar que a una escala regional la dirección (y sentido) de flujo es suroeste → noreste. Esta dirección corresponde a un ángulo de 45° tomando el norte como punto de partida y aumentando los grados en el sentido de las manecillas del reloj. En este orden de ideas, 45° sería la dirección de menor continuidad en los datos, mientras que 135° (45° + 90°) sería la dirección de máxima continuidad en los valores del nivel freático. Para La Dorada, se ha optado por escoger como ejes de máxima y mínima continuidad 135° y 45°, respectivamente, aunque por supuesto, dichos ejes podrían cambiar drásticamente de dirección a una escala muy local.
Un parámetro que debe ser ajustado cuando se está construyendo variogramas teóricos direccionales es la relación entre las direcciones de menor y mayor continuidad (Ani, antepenúltima columna de las tablas 2 a 4). En gstat, esta relación se define ajustando el parámetro anis dentro de la función vgm. El cambio de valor en el parámetro anis afecta el ajuste de los variogramas en todas las direcciones excepto aquella definida como la de mayor continuidad (135° para el caso de La Dorada). La figura 15 muestra un ejemplo, usando un modelo Gaussiano + Esférico, en el que el parámetro anis se ha modificado desde 0.1 hasta 0.7 (en incrementos de 0.1). La gráfica (g) corresponde a la opción con mejor ajuste visual, y tiene un valor anis de 0.6. En la mayoría de los casos, el mejor ajuste se obtuvo en el rango 0.7 a 0.9 del parámetro anis.
Como se mencionó en el numeral 3.2.3, en la selección de los mejores variogramas se tuvo en cuenta el cálculo de varios índices de error obtenidos con el procedimiento de validación cruzada. En esta fase del trabajo, los errores calculados sólo han sido utilizados como guía para la selección de los mejores variogramas. En la fase de evaluación de las superficies interpoladas se ha hecho un análisis más minucioso a los errores obtenidos.
60
Figura 14. Variogramas experimentales y teóricos direccionales
Los datos utilizados para el cálculo de los ocho índices de error han sido obtenidos con la función krige.cv del paquete gstat de R. En este contexto, el error es la diferencia entre el valor observado y el estimado. El paquete gstat de R calcula el error como (valor observado MENOS valor interpolado). Aunque esta forma de cálculo es compartida por algunos autores como Kerry y Oliver (2007), la mayoría opta por la fórmula (valor interpolado MENOS valor observado). En este trabajo se ha adoptado la segunda opción, con el fin de estar acorde con las ecuaciones 5 a 11 del presente reporte. Por supuesto, cuando el error está elevado al cuadrado no importa quien ocupe el sitio del sustraendo.
De los nueve modelos teóricos escogidos, sólo uno es direccional y ocho incluyen un efecto Nugget. Los modelos Circular y Matheron fueron seleccionados tres veces, el Bessel dos veces y el Esférico una vez. El rango de los modelos seleccionados varió entre 130 m (opción 146-KED-ISO-4) y 16000 m (opción 191-OK-ISO-1). Las varianzas totales de los modelos escogidos estuvieron en los rangos 320 – 687, 133 – 251, y 15 – 22, para OK, UK y KED, respectivamente.
61
Tabla 2. Variogramas generados en la fase de análisis estructural de La Dorada. Set 191 datos. Opción
Modelo
psill
rango
psill
rango
191-OK-ISO-1
Nug+Cir
66
0
371
16002
0.85
191-OK-ISO-2
Nug+Mat
83
0
429
5930
0.84
191-OK-ISO-3
Gau+Nug+Sph
300
7000
1
0
191-OK-ISO-4
Nug+Cir
18
0
145
950
191-OK-ANI-1
Nug+Cir
63
0
366
1907
135
0.7
0.85
191-OK-ANI-2
Nug+Mat
77
0
409
6108
135
0.8
0.84
191-OK-ANI-3
Gau+Nug+Sph
339
0
0
135
0.8
1.00
191-OK-ANI-4
Nug+Cir
26
0
125
1886
135
0.9
0.83
Opción
Modelo
psill
rango
psill
rango
Dir.
Ani.
SV
191-UK-ISO-1
Nug+Cir
76
0
141
10769
0.65
191-UK-ISO-2
Nug+Mat
87
0
127
1274
0.59
191-UK-ISO-3
Gau+Nug+Sph
170
8000
1
0
191-UK-ISO-4
Nug+Exp
3
0
126
559
191-UK-ANI-1
Nug+Cir
76
0
100
3000
135
0.9
0.57
191-UK-ANI-2
Nug+Mat
10
0
160
800
135
0.9
0.94
191-UK-ANI-3
Gau+Nug+Sph
60
1800
1
0
135
0.9
0.99
191-UK-ANI-4
Nug+Exp
3
0
150
500
135
0.9
0.98
Opción
Modelo
psill
rango
psill
rango
Dir.
Ani.
SV
191-KED-ISO-1
Nug+Gau
17
0
6
2463
191-KED-ISO-2
Mat
21
1203
191-KED-ISO-3
Nug+Sph
16
0
191-KED-ISO-4
Bes
21
148
191-KED-ANI-1
Nug+Gau
6
0
17
1200
135
0.4
0.74
191-KED-ANI-2
Nug+Mat
1
0
22
700
135
0.5
0.96
191-KED-ANI-3
Nug+Sph
1
0
21
2100
135
0.5
0.95
191-KED-ANI-4
Bes
21
50
135
0.9
1.00
1036 9
psill
90
rango
Dir.
Ani.
800
SV
K
1.1
1.00 0.89
114
psill
85
1353
rango
800
1.1
K
1.00 0.98
110
psill
800
rango
0.5
K
0.26 1.00
6
5427
0.28 1.00
0.7
NOTAS: Modelos: “Nug” = Nugget; “Cir” = Circular; “Mat” = Matheron; “Gau” = Gaussiano; “Sph” = Esférico; “Bes” = Bessel; “Exp” = Exponencial. Dir = dirección máxima continuidad variograma. Ani: eje menor/eje mayor anisotropía. SV = varianza estructural. K = índice Kappa.
62
Tabla 3. Variogramas generados en la fase de análisis estructural de La Dorada. Set 146 datos. Opción
Modelo
psill
rango
psill
rango
psill
146-OK-ISO-1
Nug+Cir
70
0
416
17766
0.86
146-OK-ISO-2
Nug+Mat
84
0
497
7108
0.86
146-OK-ISO-3
Gau+Sph
405
10937
127
1254
1.00
146-OK-ISO-4
Nug+Bes
96
0
592
9176
0.86
146-OK-ANI-1
Nug+Cir
69
0
407
18063
135
0.9
0.86
146-OK-ANI-2
Nug+Mat
83
0
484
7233
135
0.9
0.85
146-OK-ANI-3
Gau+Sph
418
12083
131
1377
135
0.9
1.00
146-OK-ANI-4
Nug+Bes
98
0
619
10999
135
0.8
0.86
Opción
Modelo
psill
rango
psill
rango
Dir.
Ani.
SV
146-UK-ISO-1
Nug+Cir
86
0
143
11697
0.63
146-UK-ISO-2
Nug+Mat
93
0
158
4607
0.63
146-UK-ISO-3
Gau+Nug+Sph
150
6100
1
0
146-UK-ISO-4
Nug+Exp
62
0
177
5434
146-UK-ANI-1
Nug+Cir
88
0
141
13504
135
0.8
0.62
146-UK-ANI-2
Nug+Mat
50
0
180
2500
135
0.9
0.78
146-UK-ANI-3
Gau+Nug+Sph
120
2800
1
0
135
0.9
1.00
146-UK-ANI-4
Nug+Exp
50
0
150
1900
135
0.4
0.75
Opción
Modelo
psill
rango
psill
rango
Dir.
Ani.
SV
146-KED-ISO-1
Nug+Cir
18
0
343
5171
146-KED-ISO-2
Mat
21
997
146-KED-ISO-3
Nug+Sph
18
0
146-KED-ISO-4
Bes
22
130
146-KED-ANI-1
Cir
19
420
135
0.9
1.00
146-KED-ANI-2
Mat
21
824
135
0.9
1.00
146-KED-ANI-3
Nug+Sph
1
0
135
0.9
0.95
146-KED-ANI-4
Bes
22
131
135
0.9
1.00
psill
100
rango
rango
Dir.
Ani.
1000
SV
1.00
1.00
K
1.00
1.00 0.74
100
psill
1000
rango
0.40
K
0.95 1.00
4
K
5414
0.10
0.17 1.00
20
3000
0.10
NOTAS: Modelos: “Nug” = Nugget; “Cir” = Circular; “Mat” = Matheron; “Gau” = Gaussiano; “Sph” = Esférico; “Bes” = Bessel; “Exp” = Exponencial. Dir = dirección máxima continuidad variograma. Ani: eje menor/eje mayor anisotropía. SV = varianza estructural. K = índice Kappa.
63 Tabla 4. Variogramas generados en la fase de análisis estructural de La Dorada. Set 102 datos. Opción
Modelo
psill
rango
psill
rango
102-OK-ISO-1
Nug+Cir
30
0
283
18164
0.90
102-OK-ISO-2
Nug+Mat
46
0
275
2161
0.86
102-OK-ISO-3
Gau+Sph
295
11532
67
1620
1.00
102-OK-ISO-4
Nug+Exp
16
0
607
23967
0.97
102-OK-ANI-1
Nug+Cir
32
0
303
24279
135
0.7
0.90
102-OK-ANI-2
Nug+Mat
47
0
277
2716
135
0.7
0.85
102-OK-ANI-3
Gau+Sph
293
15671
66
2140
135
0.6
1.00
102-OK-ANI-4
Nug+Exp
16
0
524
22607
135
0.8
0.97
Opción
Modelo
psill
rango
psill
rango
Dir.
Ani.
SV
102-UK-ISO-1
Nug+Gau
37
0
103
7333
0.74
102-UK-ISO-2
Nug+Mat
31
0
289
22014
0.90
102-UK-ISO-3
Gau+Nug+Sph
93
7086
10
0
102-UK-ISO-4
Nug+Cir
28
0
106
13176
102-UK-ANI-1
Nug+Gau
37
0
104
7843
135
0.9
0.74
102-UK-ANI-2
Nug+Mat
32
0
306
24924
135
0.9
0.91
102-UK-ANI-3
Gau+Nug+Sph
85
6000
1
0
135
0.9
0.99
102-UK-ANI-4
Nug+Cir
27
0
106
15707
135
0.7
0.80
Opción
Modelo
psill
rango
psill
rango
Dir.
Ani.
SV
102-KED-ISO-1
Bes
17
194
1.00
102-KED-ISO-2
Mat
15
8042
1.00
102-KED-ISO-3
Nug+Sph
6
0
102-KED-ISO-4
Exp
15
227
102-KED-ANI-1
Bes
17
224
135
0.9
1.00
102-KED-ANI-2
Mat
16
704
135
0.4
1.00
102-KED-ANI-3
Sph
17
1230
135
0.5
1.00
102-KED-ANI-4
Exp
15
290
135
0.9
1.00
7
psill
psill
34
rango
rango
Dir.
Ani.
1596
SV
K
5.0
5.0
K
0.60
0.93 0.79
35
psill
1000
rango
981
0.60
K
0.07
0.55 1.00
0.50
NOTAS: Modelos: “Nug” = Nugget; “Cir” = Circular; “Mat” = Matheron; “Gau” = Gaussiano; “Sph” = Esférico; “Bes” = Bessel; “Exp” = Exponencial. Dir = dirección máxima continuidad variograma. Ani: eje menor/eje mayor anisotropía. SV = varianza estructural. K = índice Kappa.
64
Figura 15. Ajuste parámetro “anis”, selección de variogramas direccionales
65 Selección de los variogramas para la aplicación de CK La cota topográfica y la conductividad eléctrica, por separado, han sido usadas como variables auxiliares en la aplicación de co-kriging (CK). Existen muchas variantes de CK. En el presente trabajo sólo se ha utilizado co-kriging Ordinario. La figura 16 muestra los variogramas experimentales (puntos negros) tanto para el NF (a) como para la Cota (c), así como para el co-variograma (b) entre ambas variables. La tabla 8 muestra los valores de los parámetros de los variogramas directos (NF y Cota) obtenidos en forma independiente. Es fácil advertir la similitud entre ambos, lo cual es prerrequisito para el co-kriging. Estos variogramas fueron obtenidos utilizando las opciones por defecto de la función fit.variogram. Se ha seleccionado un modelo tipo Gaussiano, incluyendo un efecto Nugget. Para fijar el modelo lineal de co-regionalización, se ha seguido el enfoque propuesto por Rossiter (2018) en el que el modelo ajustado para la variable principal (en este caso el NF) es utilizado como punto de partida para la generación del modelo final de co-variograma. Esto se lleva a cabo dando al parámetro fill.all de la función gstat el valor TRUE. La razón de esta decisión es asegurar que los tres variogramas tendrán la misma estructura y un único rango. El variograma teórico finalmente seleccionado también es mostrado en la figura 16 (curva azul). Nótese que se ha otorgado mayor relevancia al ajuste del variograma a las tres primeras clases las cuales son las que ostentan un mayor peso de ponderación al momento de la interpolación.
Respecto al uso de la conductividad eléctrica como variable auxiliar, fue necesario aplicar una transformación logarítmica a los datos originales ya que éstos presentan un fuerte sesgo positivo (ver figura 17). El mejor ajuste obtenido para el logaritmo de la conductividad eléctrica fue un modelo Circular con efecto Nugget (ver última fila de la tabla 8). En un intento por no violar la condición de semejanza entre las estructuras espaciales de las variables principal y auxiliar, se forzó el ajuste del variograma del NF a un modelo Circular con un rango de 7871 (ver tabla 8).
66 Tabla 5. Selección variogramas. Cálculo de indicadores de error, datos de La Dorada. Set 191 datos. Opción
ME
MAE
MSE2
RMSE
ASE
RMSSE
D
Ecuación regresión
191-OK-ISO-1
-0.019
7.270
0.001
10.518
15.838
1.027
0.903
y = 0.69x + 55.66; R2 = 0.69
191-OK-ISO-2
0.021
7.510
0.000
10.575
15.681
1.022
0.901
y = 0.68x + 57.16; R2 = 0.69
191-OK-ISO-3
0.014
7.446
0.007
10.854
16.560
1.396
0.901
y = 0.72x + 51.58; R2 = 0.68
191-OK-ISO-4
-0.300
8.240
0.015
11.985
14.265
1.218
0.859
y = 0.58x + 76.02; R2 = 0.61
191-OK-ANI-1
-0.005
7.345
0.001
10.587
15.819
1.049
0.902
y = 0.69x + 56.16; R2 = 0.69
191-OK-ANI-2
0.021
7.517
0.000
10.610
15.709
1.052
0.901
y = 0.69x + 57.13; R2 = 0.69
191-OK-ANI-3
0.031
7.778
0.006
11.545
16.826
1.586
0.888
y = 0.71x + 53.20; R2 = 0.64
191-OK-ANI-4
-0.337
8.801
0.016
12.589
13.596
1.290
0.836
y = 0.54x + 84.44; R2 = 0.56
Opción
ME
MAE
MSE2
RMSE
ASE
RMSSE
D
Ecuación regresión
191-UK-ISO-1
0.031
7.335
-0.001
10.356
16.026
1.018
0.907
y = 0.71x + 53.27; R2 = 0.70
191-UK-ISO-2
0.045
7.758
-0.002
10.648
15.899
1.049
0.901
y = 0.69x + 55.80; R2 = 0.69
191-UK-ISO-3
0.083
7.346
0.003
10.623
16.807
1.432
0.907
y = 0.73x + 48.20; R2 = 0.69
191-UK-ISO-4
0.121
7.574
-0.003
11.104
16.131
1.293
0.893
y = 0.69x + 56.34; R2 = 0.66
191-UK-ANI-1
0.016
7.213
-0.001
10.430
15.770
0.927
0.905
y = 0.69x + 55.70; R2 = 0.70
191-UK-ANI-2
0.097
7.493
-0.003
10.976
16.398
1.132
0.898
y = 0.70x + 53.50; R2 = 0.67
191-UK-ANI-3
0.107
7.354
0.001
10.753
16.412
1.221
0.902
y = 0.71x + 52.16; R2 = 0.68
191-UK-ANI-4
0.128
7.609
-0.003
11.150
15.895
1.137
0.891
y = 0.68x + 58.49; R2 = 0.66
Opción
ME
MAE
MSE2
RMSE
ASE
RMSSE
D
Ecuación regresión
191-KED-ISO-1
0.008
3.399
-0.001
4.303
18.525
0.975
0.987
y = 0.95x + 9.49; R2 = 0.95
191-KED-ISO-2
-0.021
3.108
0.003
4.060
18.524
0.928
0.988
y = 0.95x + 9.02; R2 = 0.95
191-KED-ISO-3
0.005
3.349
0.000
4.254
18.526
0.962
0.987
y = 0.95x + 9.38; R2 = 0.95
191-KED-ISO-4
-0.068
2.799
0.029
3.947
18.657
1.310
0.989
y = 0.96x + 7.60; R2 = 0.96
191-KED-ANI-1
-0.030
2.928
0.003
3.936
18.644
1.083
0.989
y = 0.96x + 7.66; R2 = 0.96
191-KED-ANI-2
-0.057
2.684
0.015
3.848
18.683
1.328
0.989
y = 0.96x + 7.15; R2 = 0.96
191-KED-ANI-3
-0.063
2.726
0.015
3.846
18.692
1.337
0.990
y = 0.96x + 7.07; R2 = 0.96
191-KED-ANI-4
-0.065
3.210
0.012
4.234
18.570
0.982
0.987
y = 0.95x + 9.00; R2 = 0.95
NOTAS: ME, MAE, MSE2, RMSE, ASE, RMSSE y D: ver ecuaciones 5 a 11, páginas 48 a 51.
67 Tabla 6. Selección variogramas. Cálculo de indicadores de error, datos de La Dorada. Set 146 datos. Opción
ME
MAE
MSE2
RMSE
ASE
RMSSE
D
Ecuación regresión
146-OK-ISO-1
0.037
7.350
-0.001
10.787
16.016
0.999
0.903
y = 0.68x + 57.96; R2 = 0.70
146-OK-ISO-2
0.029
7.657
-0.001
10.905
16.006
1.020
0.901
y = 0.68x + 58.65; R2 = 0.69
146-OK-ISO-3
0.160
7.725
-0.008
11.494
17.104
1.438
0.895
y = 0.71x + 53.02; R2 = 0.66
146-OK-ISO-4
0.028
7.740
-0.001
10.969
15.889
0.989
0.899
y = 0.67x + 59.88; R2 = 0.69
146-OK-ANI-1
0.039
7.377
-0.001
10.819
16.033
1.007
0.902
y = 0.68x + 57.99; R2 = 0.70
146-OK-ANI-2
0.031
7.688
-0.001
10.946
16.006
1.028
0.900
y = 0.68x + 58.86; R2 = 0.69
146-OK-ANI-3
0.157
7.754
-0.008
11.527
17.077
1.449
0.894
y = 0.71x + 53.42; R2 = 0.66
146-OK-ANI-4
0.033
7.838
-0.001
11.086
15.825
0.993
0.896
y = 0.67x + 60.97; R2 = 0.68
Opción
ME
MAE
MSE2
RMSE
ASE
RMSSE
D
Ecuación regresión
146-UK-ISO-1
-3.832
7.560
-0.002
10.721
16.267
0.991
0.905
y = 0.69x + 55.69; R2 = 0.70
146-UK-ISO-2
0.057
7.685
-0.002
10.841
16.190
0.998
0.903
y = 0.69x + 56.88; R2 = 0.69
146-UK-ISO-3
0.335
7.500
-0.017
11.166
17.547
1.398
0.904
y = 0.74x + 47.41; R2 = 0.68
146-UK-ISO-4
0.091
7.300
-0.004
10.577
16.546
1.028
0.909
y = 0.71x + 52.74; R2 = 0.71
146-UK-ANI-1
0.049
7.641
-0.002
10.819
16.190
0.994
0.903
y = 0.69x + 56.79; R2 = 0.70
146-UK-ANI-2
0.125
7.277
-0.005
10.709
16.633
0.922
0.908
y = 0.71x + 52.69; R2 = 0.70
146-UK-ANI-3
0.292
7.528
-0.014
11.246
17.492
1.335
0.902
y = 0.73x + 48.34; R2 = 0.68
146-UK-ANI-4
0.109
7.333
-0.004
10.893
16.349
0.919
0.903
y = 0.69x + 55.87; R2 = 0.69
Opción
ME
MAE
MSE2
RMSE
ASE
RMSSE
D
Ecuación regresión
146-KED-ISO-1
0.011
3.376
-0.001
4.184
19.090
0.928
0.988
y = 0.95x + 8.90; R2 = 0.95
146-KED-ISO-2
-0.012
3.044
0.002
3.929
19.115
0.906
0.990
y = 0.96x + 8.20; R2 = 0.96
146-KED-ISO-3
0.010
3.371
-0.001
4.179
19.090
0.927
0.988
y = 0.95x + 8.89; R2 = 0.95
146-KED-ISO-4
0.000
2.833
0.000
3.874
19.245
1.208
0.990
y = 0.96x + 6.91; R2 = 0.96
146-KED-ANI-1
0.006
2.875
0.001
3.936
19.177
1.140
0.990
y = 0.96x + 7.64; R2 = 0.96
146-KED-ANI-2
-0.008
3.092
0.001
3.989
19.104
0.918
0.989
y = 0.95x + 8.41; R2 = 0.96
146-KED-ANI-3
-0.023
2.518
0.013
3.509
19.389
1.481
0.992
y = 0.97x + 4.97; R2 = 0.97
146-KED-ANI-4
-0.001
2.855
0.000
3.893
19.256
1.205
0.990
y = 0.96x + 6.84; R2 = 0.96
NOTAS: ME, MAE, MSE2, RMSE, ASE, RMSSE y D: ver ecuaciones 5 a 11, páginas 48 a 51.
68 Tabla 7. Selección variogramas. Cálculo de indicadores de error, datos de La Dorada. Set 102 datos. Opción
ME
MAE
MSE2
RMSE
ASE
RMSSE
D
Ecuación regresión
102-OK-ISO-1
-0.077
5.485
0.004
6.661
15.344
0.890
0.956
y = 0.83x + 30.32; R2 = 0.85
102-OK-ISO-2
0.030
5.383
-0.003
6.843
15.210
0.905
0.953
y = 0.82x + 32.22; R2 = 0.84
102-OK-ISO-3
-0.078
5.617
0.002
6.720
16.221
1.745
0.958
y = 0.88x + 22.07; R2 = 0.85
102-OK-ISO-4
-0.107
5.618
0.006
6.668
15.833
1.045
0.957
y = 0.86x + 25.70; R2 = 0.85
102-OK-ANI-1
-0.065
5.473
0.003
6.651
15.274
0.878
0.956
y = 0.83x + 30.92; R2 = 0.85
102-OK-ANI-2
0.034
5.386
-0.003
6.889
15.173
0.902
0.953
y = 0.82x + 32.75; R2 = 0.84
102-OK-ANI-3
-0.043
5.644
-0.006
6.781
16.126
1.859
0.957
y = 0.87x + 23.24; R2 = 0.84
102-OK-ANI-4
-0.096
5.642
0.006
6.663
15.825
1.055
0.958
y = 0.86x + 25.74; R2 = 0.85
Opción
ME
MAE
MSE2
RMSE
ASE
RMSSE
D
Ecuación regresión
102-UK-ISO-1
0.092
5.315
-0.007
6.744
15.669
1.004
0.956
y = 0.85x + 27.39; R2 = 0.84
102-UK-ISO-2
0.054
5.338
-0.004
6.681
15.620
0.990
0.957
y = 0.84x + 27.64; R2 = 0.85
102-UK-ISO-3
-0.034
5.562
0.003
6.640
16.178
1.158
0.959
y = 0.88x + 22.13; R2 = 0.85
102-UK-ISO-4
0.037
5.330
-0.003
6.568
15.747
0.990
0.959
y = 0.85x + 25.99; R2 = 0.85
102-UK-ANI-1
0.092
5.305
-0.007
6.745
15.660
1.002
0.956
y = 0.84x + 27.49; R2 = 0.84
102-UK-ANI-2
0.059
5.331
-0.004
6.684
15.600
0.988
0.957
y = 0.84x + 27.85; R2 = 0.85
102-UK-ANI-3
-0.059
5.595
0.005
6.711
16.390
1.593
0.958
y = 0.89x + 20.33; R2 = 0.85
102-UK-ANI-4
0.042
5.383
-0.003
6.604
15.714
1.006
0.958
y = 0.85x + 26.44; R2 = 0.85
Opción
ME
MAE
MSE2
RMSE
ASE
RMSSE
D
Ecuación regresión
102-KED-ISO-1
0.000
2.517
-0.001
3.408
17.135
1.772
0.990
y = 0.99x + 2.36; R2 = 0.96
102-KED-ISO-2
-0.013
2.513
0.002
3.345
16.675
0.971
0.990
y = 0.96x + 7.01; R2 = 0.96
102-KED-ISO-3
-0.001
2.506
0.000
3.390
16.656
1.003
0.990
y = 0.96x + 7.28; R2 = 0.96
102-KED-ISO-4
-0.033
2.507
0.008
3.388
16.802
1.121
0.990
y = 0.97x + 5.81; R2 = 0.96
102-KED-ANI-1
0.011
2.509
-0.003
3.412
17.195
1.910
0.990
y = 0.99x + 1.73; R2 = 0.96
102-KED-ANI-2
0.015
2.425
-0.002
3.279
16.897
1.396
0.991
y = 0.97x + 4.57; R2 = 0.96
102-KED-ANI-3
0.004
2.450
-0.001
3.337
16.942
1.476
0.990
y = 0.98x + 4.22; R2 = 0.96
102-KED-ANI-4
-0.025
2.472
0.007
3.350
16.830
1.155
0.990
y = 0.97x + 5.44; R2 = 0.96
NOTAS: ME, MAE, MSE2, RMSE, ASE, RMSSE y D: ver ecuaciones 5 a 11, páginas 48 a 51.
69
Figura 16. Variogramas, aplicación co-Kriging con Cota como variable auxiliar
Figura 17. Histogramas de la conductividad eléctrica del agua subterránea, La Dorada
Tabla 8. Modelos de variograma generados, aplicación CK, La Dorada Opción
Modelo
psill
rango
psill
rango
sv
Observación
130-OK-ISO-1
Nug+Gau
54
0
174
2729
0.76
NF
130-CK-ISO-Cota
Nug+Gau
45
0
146
2820
0.77
Cota
130-OK-ISO-2
Nug+Cir
40
0
200
7871
0.83
NF
130-CK-ISO-CE
Nug+Cir
0.0394
0
0.0617
7871
0.61
CE
NOTAS: Modelos: “Nug” = Nugget; “Cir” = Circular; “Gau” = Gaussiano. SV = varianza estructural.
70 Para el ajuste del modelo lineal de co-regionalización, se siguió el mismo procedimiento aplicado al caso de la cota topográfica. Sin embargo, en esta ocasión los resultados no fueron satisfactorios. La figura 18 presenta los dos variogramas y el co-variograma respectivo. Al utilizar valores transformados (logaritmo) para la conductividad, se pensó que parte del problema podría residir en la diferencia de magnitud entre las variables principal y auxiliar. Entonces, se optó por repetir el ejercicio, pero utilizando datos de NF transformados mediante logaritmo con base diez. Los resultados (no mostrados aquí) tampoco fueron satisfactorios. El co-variograma es totalmente errático, a consecuencia de la falta de correlación entre el NF y la CE. A pesar de estos resultados, se hizo un intento por generar una superficie interpolada, como se mostrará en la siguiente sección de este capítulo.
Figura 18. Variogramas, aplicación co-Kriging con CE como variable auxiliar
4.1.3. Generación de mapas, La Dorada Superficies interpoladas con las herramientas OK, UK y KED, La Dorada La figura 19 muestra algunos sitios de interés para facilitar la comparación de los modelos obtenidos para La Dorada. La tabla 9 muestra los errores calculados para cada
71 una de las 27 superficies interpoladas. Los errores han sido estimados a partir de la validación cruzada ejecutada con la función krige.cv del paquete gstat de R. En esta oportunidad, el parámetro nmax que determina el número de puntos de observación para tener en cuenta en la interpolación, fue ajustado acorde con la superficie que se deseaba construir. A continuación, se menciona algunos rasgos observados durante la construcción de las superficies interpoladas.
Para un mismo set de datos, la magnitud de los errores ME, MAE y MSE2 tiende a aumentar a medida que se restringe el vecindario de búsqueda de los datos a utilizar en la interpolación; es decir, las superficies que fueron construidas ajustando el parámetro nmax a 5 son las que exhiben los mayores errores. Esta tendencia se observó en las tres técnicas de interpolación utilizadas. Las opciones donde se utilizó un nmax = 5 para la técnica UK son las que presentan los peores errores, especialmente cuando se utilizaron los conjuntos de 191 y 146 registros. La técnica KED es la que exhibe las menores magnitudes para los errores ME y MAE. El rendimiento de las otras dos técnicas es similar entre sí. Por ejemplo, el promedio del error absoluto (MAE) para las nueve superficies creadas con KED es de 3.05 metros. Para OK y UK el promedio fue de 7.01 m y 8.56 m, respectivamente. En general, todos los valores del error MSE2 son cercanos a cero, que es lo que se espera dada la naturaleza de los interpoladores de la familia kriging.
El índice RMSE es claramente menor cuando se utiliza KED, y mayor cuando la superficie es generada con la herramienta UK. De otro lado, el índice ASE fue muy grande en todos los resultados, muy diferente al índice RMSE y siempre mayor que éste. El índice RMSSE fue, en general, ligeramente menor que uno. Este comportamiento es esperado ya que kriging tiende a suavizar las superficies interpoladas, dando lugar a resultados con una varianza ligeramente menor que la varianza de los datos reales. En algunos pocos casos este índice estuvo por encima de uno. El índice D fue en la mayoría de los casos cercano a uno; su mejor y peor rendimientos se observaron en las superficies generadas con KED y UK, respectivamente.
72
Figura 19. Sitios referencia la Dorada
La figura 20 muestra ocho gráficas de dispersión en donde se comparan los valores observados con los interpolados como resultado de la validación cruzada. Obsérvese que las gráficas están conformadas de tal forma que el valor interpolado (eje de las ordenadas) depende del valor observado (eje de las abscisas). Las ecuaciones corresponden a las rectas de tendencia indicadas en color rojo. Las rectas grises corresponden a la relación 1 a 1. Si todos los valores interpolados fueran iguales a los observados, los puntos se alienarían sobre las rectas grises.
73 Las gráficas (a), (b) y (c) muestran los resultados de interpolación con las herramientas OK, UK y KED, respectivamente, con el set de datos de 146 registros. Es evidente que en el caso de la herramienta KED, los valores observados son muy cercanos a los reales. El rendimiento que se observa en las otras dos técnicas es muy similar entre sí, y es inferior al KED. Se recuerda que el valor de R2 da una idea sobre qué tan representativo es el conjunto de valores predichos respecto a los valores reales.
Las gráficas (b), (d) y (e) corresponden a la aplicación de UK con el set de 146 registros, pero se diferencian entre sí en el número de datos tenidos en cuenta en cada interpolación. Es claro que en el caso 146-UK-ISO-2-05, en donde se tuvo en cuenta sólo cinco puntos de observación (e), los datos interpolados están más dispersos y difieren en mayor medida de los datos observados, mientras que el mejor rendimiento se detecta en el caso en el que se utilizó un vecindario compuesto por 15 puntos (caso 146UK-ISO-2-15).
Las gráficas (a), (f) y (g) presentan resultados obtenidos después de aplicar OK a los conjuntos de datos de 146, 191 y 102 registros, respectivamente. En este caso en particular, el mejor resultado se observa en el set de 102 registros (sólo niveles estáticos, sin manantiales) mientras que el peor resultado corresponde al set de 146 registros (niveles estáticos, incluyendo manantiales). Esta tendencia también se observa cuando se utiliza la herramienta UK. En el caso de KED, el mejor resultado también se observó en el conjunto de 102 registros, pero el peor correspondió al conjunto de 191 registros (niveles estáticos y dinámicos).
La última gráfica de la figura 20 corresponde a la interpolación hecha con UK, tomando en cuenta el único variograma direccional seleccionado en la etapa de análisis estructural de datos. Su rendimiento es intermedio tomando como referencia los otros siete casos mostrados en la misma figura. Nótese que el peor rendimiento de los ocho ejemplos mostrados corresponde al caso (e), con un R2 de sólo 0.28. La figura 20 también muestra una característica muy conocida en los métodos de interpolación de la familia kriging: la variabilidad en los datos interpolados tiende a ser menor que la de los datos
74 reales (kriging suaviza la tasa de cambio de los datos). Por tal motivo, todas las rectas de tendencia ostentan una pendiente menor que la recta que define la relación 1 a 1.
Tabla 9. Errores estimados en la construcción de las superficies interpoladas, métodos OK, UK y KED, La Dorada. Opción
ME
MAE
MSE2
RMSE
ASE
191-OK-ISO-1-all
-0.019
7.270
0.001
10.518
15.838
191-OK-ISO-1-15
0.094
7.373
-0.007
10.733
191-OK-ISO-1-05
-0.121
7.760
0.012
191-UK-ANI-1-all
0.016
7.213
191-UK-ANI-1-15
-0.070
191-UK-ANI-1-05
RMSS
D
Ecuación regresión
1.027
0.903
y = 0.69x + 55.66; R2 = 0.69
15.849
1.032
0.899
y = 0.69x + 56.60; R2 = 0.68
11.318
16.582
1.059
0.892
y = 0.70x + 54.09; R2 = 0.65
-0.001
10.430
15.770
0.927
0.905
y = 0.69x + 55.70; R2 = 0.70
7.253
0.007
10.438
17.250
0.902
0.912
y = 0.76x + 43.61; R2 = 0.70
-3.118
15.278
0.015
44.502
46.444
0.880
0.389
y = 0.76x + 47.22; R2 = 0.10
191-KED-ISO-3-all
0.005
3.349
0.000
4.254
18.526
0.962
0.987
y = 0.95x + 9.38; R2 = 0.95
191-KED-ISO-3-15
0.095
3.350
-0.010
4.328
18.511
0.934
0.987
y = 0.95x + 9.59; R2 = 0.95
191-KED-ISO-3-05
-0.162
3.675
0.042
5.105
19.015
0.913
0.982
y = 0.96x + 6.94; R2 = 0.93
146-OK-ISO-4-all
0.028
7.740
-0.001
10.969
15.889
0.989
0.899
y = 0.67x + 59.88; R2 = 0.69
146-OK-ISO-4-15
0.143
7.876
-0.010
11.306
15.762
1.003
0.891
y = 0.66x + 62.49; R2 = 0.67
146-OK-ISO-4-05
-0.269
7.928
0.027
11.462
16.514
0.978
0.893
y = 0.68x + 57.97; R2 = 0.66
146-UK-ISO-2-all
0.057
7.685
-0.002
10.841
16.190
0.998
0.903
y = 0.69x + 56.88; R2 = 0.69
146-UK-ISO-2-15
0.155
7.895
-0.009
10.818
17.132
0.978
0.908
y = 0.73x + 49.21; R2 = 0.70
146-UK-ISO-2-05
3.940
13.244
-0.043
27.130
31.538
0.860
0.658
y = 0.86x + 22.25; R2 = 0.28
146-KED-ISIO-4-all
0.000
2.833
0.000
3.874
19.245
1.208
0.990
y = 0.96x + 6.91; R2 = 0.96
146-KED-ISIO-4-15
0.056
3.063
-0.006
4.297
19.319
1.198
0.988
y = 0.96x + 6.99; R2 = 0.95
146-KED-ISIO-4-05
-0.422
3.344
0.067
4.871
20.023
1.123
0.985
y = 0.99x + 2.10; R2 = 0.94
102-OK-ISO-2-all
0.030
5.383
-0.003
6.843
15.210
0.905
0.953
y = 0.82x + 32.22; R2 = 0.84
102-OK-ISO-2-15
0.128
5.504
-0.013
7.118
15.232
0.931
0.950
y = 0.81x + 33.09; R2 = 0.83
102-OK-ISO-2-05
-0.034
6.206
-0.001
7.871
15.547
0.983
0.939
y = 0.81x + 33.75; R2 = 0.79
102-UK-ISO-4-all
0.037
5.330
-0.003
6.568
15.747
0.990
0.959
y = 0.85x + 25.99; R2 = 0.85
102-UK-ISO-4-15
0.069
5.381
-0.003
6.699
16.155
0.991
0.958
y = 0.87x + 22.49; R2 = 0.85
102-UK-ISO-4-05
0.102
7.769
0.029
13.549
20.807
0.927
0.860
y = 0.93x + 12.26; R2 = 0.58
102-KED-ISO-2-all
-0.013
2.513
0.002
3.345
16.675
0.971
0.990
y = 0.96x + 7.01; R2 = 0.96
102-KED-ISO-2-15
-0.102
2.553
0.021
3.480
16.636
0.960
0.989
y = 0.96x + 7.78; R2 = 0.96
102-KED-ISO-2-05
-0.083
2.726
-0.012
3.660
16.801
0.864
0.988
y = 0.96x + 6.47; R2 = 0.95
E
NOTAS: ME, MAE, MSE2, RMSE, ASE, RMSSE y D: ver ecuaciones 5 a 11, páginas 48 a 51.
75 La figura 21 presenta ocho gráficas en donde se aprecia el comportamiento de los errores de acuerdo con la magnitud de los valores observados. Estas ocho gráficas corresponden a los mismos casos presentados en la figura 20. Lo ideal es no detectar tendencia alguna en los errores. Sin embargo, en siete de los ocho casos se insinúa una tendencia: el interpolador subestima la variable regionalizada a medida que su valor real es mayor, y la sobreestima a medida que su valor real es menor. El único caso en donde este comportamiento no es observado es en la aplicación de la herramienta KED (c). Obsérvese el cambio de escala en el eje de las ordenadas en la gráfica (e) debido a un valor interpolado inusualmente bajo. Este dato no es mostrado en la gráfica (e) de la figura 20.
Las figuras 22, 23 y 24 presentan, a manera de ejemplo, los mapas generados con las herramientas de interpolación OK, UK y KED, a partir de un mismo set de datos; en este caso, el conjunto compuesto por 191 registros.
La figura 22 muestra las superficies interpoladas. Los tres mapas fueron construidos teniendo en cuenta el total de los datos observados (vecindario global). Los productos obtenidos con OK y UK son similares entre sí y exhiben una configuración típica para superficies interpoladas, con límites suavizados entre rangos de valores. En cambio, el producto obtenido con KED es prácticamente una réplica de la configuración topográfica. Como se mencionará en el numeral 4.3, la fuerte correlación entre la cota topográfica y el nivel freático (ver figura 9) fuerza a este último a adoptar una configuración casi idéntica a la topografía. Los tres mapas indican que el agua subterránea se mueve de oeste a este y de sur a norte, como ya se había insinuado en la figura 6 del presente reporte.
La figura 23 presenta las varianzas (en metros cuadrados) calculadas para cada valor interpolado. Para los tres mapas se ha aplicado la misma escala de varianzas con el fin de facilitar su comparación. Obsérvese que en el caso de KED, todas las varianzas estimadas están por debajo del valor 103.3 m2. Como era de esperarse, las menores varianzas corresponden a los sitios adyacentes a los puntos de observación. En este caso, los únicos puntos de observación señalados en los mapas son los manantiales
76 (cuadros rojos). Al parecer, con el mĂŠtodo UK se obtienen varianzas (incertidumbres) mĂĄs altas.
Figura 20. Datos observados vs valores interpolados, herramientas OK, UK y KED, La Dorada
77 La figura 24 contiene los mapas obtenidos después de restar la superficie freática de la superficie topográfica. Las zonas en negro son aquellas donde, según los resultados de la interpolación, el nivel freático queda por encima de la superficie topográfica. Por ende, en estas zonas se espera que exista descarga natural de agua subterránea.
Los mapas obtenidos con las herramientas OK y UK son similares entre sí y, de ser correctos, dan información sobre el funcionamiento del acuífero somero. Por ejemplo, ambos mapas indican que corrientes superficiales como los ríos La Miel y Purnio, y las quebradas El Tigre, La Caridad, y la parte alta de la quebrada Doña Juana (para su ubicación, ver la figura 19), funcionan como corrientes efluentes o ganadores; es decir, que son alimentados en parte por el agua subterránea. El mapa obtenido de la herramienta KED sugiere que la tabla de agua está siempre por debajo de la superficie topográfica, lo cual va en contravía de la presencia de manantiales. En el numeral 4.3 se discutirá con más detalle estos hallazgos.
Las figuras 25, 26 y 27 presentan algunos resultados que se obtienen al variar el vecindario de búsqueda al momento de interpolar el nivel freático. La figura 25 contiene las superficies freáticas interpoladas con OK, usando el set de 146 registros. En la primera de ellas se utilizó un vecindario global y es fácil advertir cómo la separación entre clases de NF está compuesta por curvas suavizadas. A medida que el vecindario de búsqueda para la interpolación se hace más local, la separación entre clases se vuelve más errática. Este comportamiento se observó para todas las herramientas de interpolación y en todos los conjuntos de datos.
La figura 26 contiene los mapas de varianza de kriging para las interpolaciones realizadas con UK usando el conjunto de 146 registros. El mapa de la derecha ha sido obtenido usando un vecindario de búsqueda de máximo cinco puntos y es el que exhibe varianzas (incertidumbres) muy grandes. Las varianzas más pequeñas corresponden al mapa de la izquierda, construido teniendo en cuenta el set completo de datos para cada interpolación. En general, esta tendencia se observó con las otras dos herramientas de interpolación y con los otros dos conjuntos de datos.
78
Figura 21. Efecto de escala para los errores, herramientas OK, UK y KED, La Dorada
La figura 27 contiene tres superficies obtenidas al restar la superficie freática de la superficie topográfica. Estas superficies han sido obtenidas después de interpolar con KED. Nótese que en el caso del uso de un vecindario global (primer mapa) no se generan píxeles con valores negativos; es decir, celdas que indican que el NF está por encima de la superficie del terreno. En los dos casos de uso de un vecindario local, sí se generan
79 píxeles con valores negativos. Infortunadamente, la configuración de las zonas conformadas por celdas con valores negativos parece no tener relación alguna con rasgos geográficos, particularmente con corrientes superficiales.
Figura 22. Superficies interpoladas con OK, UK y KED, set con 191 registros. La Dorada
Superficies interpoladas con la herramienta CK, La Dorada La tabla 10 muestra los errores calculados para cada una de las cuatro superficies generadas. Dos de ellas (130-CK-ISO-Cota y 130-CK-ISO-CE) corresponden a la aplicación de co-kriging (CK). Con el fin de evaluar si su utilización conlleva alguna mejora, también se generaron superficies con kriging ordinario (OK) y se compararon entre sí los resultados. La teoría y la utilización de OK son más fáciles de abordar que en el caso de CK, así que el empleo de esta última técnica sólo se justifica si sus resultados son mejores que los suministrados por OK.
80
Figura 23. Varianzas estimadas, interpolación con OK, UK y KED, set con 191 registros. La Dorada
Para co-Kriging sólo se han generado superficies con un vecindario global ya que, como se advirtió en el apartado anterior, los vecindarios muy locales tienden a generar una interpolación errática y errores grandes. Para evaluar estos resultados, se recuerda que la variable auxiliar “Cota” cumple con los supuestos requeridos por CK, no así la CE. Por ende, un mejor rendimiento de las superficies asistidas por la CE podría deberse al azar.
Las superficies generadas en las opciones 130-OK-ISO-1 y 130-OK-ISO-2 han sido construidas con la herramienta OK a partir del mismo set de datos compuesto por 130 registros, pero difieren entre sí en el modelo de variograma empleado para la interpolación. Por eso, los errores mostrados en la tabla 10 para estas dos opciones son disímiles entre sí.
81
Figura 24. Zonas potenciales de recarga y descarga de agua subterránea, interpolación con OK, UK y KED, set con 191 registros. La Dorada
Tabla 10. Errores estimados en la construcción de las superficies interpoladas, métodos OK y CK, La Dorada. Opción
ME
MAE
MSE2
RMSE
ASE
130-OK-ISO-1
-0.450
7.223
0.020
10.446
16.491
130-CK-ISO-Cota
-0.006
5.386
0.000
7.297
130-OK-ISO-2
-0.222
6.824
0.011
130-CK-ISO-CE
-0.117
7.333
0.004
RMSS
D
Ecuación regresión
1.081
0.913
y = 0.70x + 54.07; R2 = 0.73
18.057
0.888
0.962
y = 0.84x + 28.75; R2 = 0.87
9.730
16.959
1.062
0.927
y = 0.74x + 47.05; R2 = 0.76
10.710
14.060
0.752
0.895
y = 0.60x + 71.88; R2 = 0.74
E
NOTAS: ME, MAE, MSE2, RMSE, ASE, RMSSE y D: ver ecuaciones 5 a 11, páginas 48 a 51.
82
Figura 25. Tabla de agua interpolada, variando el vecindario de búsqueda, interpolación con OK, UK y KED, set con 146 registros. La Dorada
La figura 28 muestra las gráficas de dispersión donde se compara los valores observados con los interpolados. El mejor resultado corresponde a la opción CK con Cota (gráfica b). No sólo el R2 es mayor (0.87) sino que los datos están menos dispersos y más cercanos a la recta gris. El peor caso es para la opción CK con CE (gráfica d), en donde la pendiente de la recta de tendencia de los valores obtenidos es la más alejada de la recta gris. Sin embargo, este resultado parece no diferir mucho de la opción OK con modelo de variograma gaussiano (gráfica a).
La figura 29 muestra que, en los cuatro casos, los errores ostentan una tendencia a ser más negativos a medida que la magnitud del valor real es mayor, y más positivos en el caso contrario. Este comportamiento también se observó con la aplicación de las herramientas UK y OK como en su momento se comentó.
83
Figura 26. Varianzas de kriging, variando el vecindario de búsqueda, interpolación con OK, UK y KED, set con 146 registros. La Dorada
La figura 30 presenta las tablas de agua interpoladas. Entre sí, las superficies son similares y en forma general representan el flujo regional del agua subterránea que es de suroeste a noreste. El rasgo más llamativo es la presencia de una depresión en la tabla de agua al costado noreste del área de estudio, que daría lugar a una reversión del flujo de agua subterránea. Este rasgo se observa en las cuatro superficies interpoladas y la extensión de la zona afectada por este rasgo está indicada con la curva roja.
84
Figura 27. Zonas de descarga y recarga de agua subterránea, variando el vecindario de búsqueda, interpolación con OK, UK y KED, set con 146 registros. La Dorada
La figura 31 muestra los mapas de las varianzas. Es evidente que las incertidumbres obtenidas con CK usando la CE como variable auxiliar son muy grandes (mapa de la derecha). En los otros tres mapas las varianzas son similares. Como es de esperarse, las menores incertidumbres están en las zonas adyacentes a los puntos de observación.
La figura 32 muestra las zonas donde, de acuerdo con la interpolación de la tabla de agua, se espera que exista descarga de agua subterránea. Los cuatro mapas son muy similares entre sí. Estos mapas sugieren que algunas corrientes superficiales son efluentes, como los ríos La Miel y Purnio, y las quebradas El Tigre y Caño Grande, principalmente. Un rasgo interesante es la presencia de cuatro zonas anegadas (denominadas A, B, C y D) al costado este de La Dorada, en las riberas del río Magdalena.
85 Estas zonas aparecen en los cuatro mapas, aunque su extensión varía de un mapa a otro, y también aparecen en algunos de los mapas obtenidos con la herramienta UK mas no con KED. En campo, se conoce que parte de estas zonas son anegadas en forma cíclica por aumento en el nivel del río Magdalena lo que, podría estar en consonancia con el cambio de sentido del flujo de agua subterránea sugerido por las tablas de agua interpoladas con CK y OK.
Figura 28. Valores observados vs valores interpolados, interpolación con OK y CK, La Dorada
4.2. Carminales A continuación, se describe el comportamiento de los datos recolectados en la cuenca de la quebrada Carminales (Caldas) así como los resultados obtenidos en el análisis estructural de los mismos y en la generación de las superficies freáticas a través de la aplicación de diferentes herramientas kriging.
86
Figura 29. Valores observados vs errores, interpolaciรณn con OK y CK, La Dorada
Figura 30. Interpolaciรณn NF, aplicando CK con la cota y la CE como variables auxiliares. La Dorada
87
Figura 31. Varianzas de kriging, interpolaciรณn con OK y CK. La Dorada
Figura 32. Zonas de descarga y recarga de agua subterrรกnea, interpolaciรณn con OK y CK. La Dorada
88
4.2.1. Exploración de datos, Carminales La figura 33 muestra la ubicación de todos los puntos incluidos en el set de datos de la cuenca de la quebrada Carminales. Los colores de los símbolos corresponden a diferentes rangos de altitud del nivel freático respecto al nivel medio del mar. Los cuatro puntos auxiliares ubicados por representantes de comunidades (lagunas y tramos de la quebrada Carminales) también son mostrados en el mapa. De acuerdo con moradores de la cuenca, la quebrada Carminales es perenne; es decir, esta corriente debe ser alimentada por agua subterránea en época de estiaje.
Aunque algunos puntos quedan por fuera de la cuenca, particularmente en la parte baja, han sido incluidos en el set de datos con el propósito de mejorar la densidad de observaciones en esta parte del área de estudio.
Es fácil observar que los puntos exhiben una tendencia regional, ya que los valores más bajos se concentran al norte. El sur del área de estudio corresponde a la parte alta de la cuenca, y allí no hay puntos de observación porque esta zona es boscosa. Las actividades agrícolas y residenciales se concentran en la parte media-baja de la cuenca y es allí donde se observa una mayor concentración de aljibes y pozos. Al igual que en La Dorada, la distribución de puntos de observación dentro del área de interés es muy desigual.
El conjunto de datos original para este estudio de caso está conformado por 104 registros. La figura 34 presenta el histograma y la gráfica de cajas y bigotes para los datos de nivel freático (los cuatro puntos auxiliares no son incluidos). El conjunto de datos es muy asimétrico hacia la izquierda (coeficiente de asimetría = -2.42). La media es 1031.8 m y la desviación estándar es 37.5 metros.
La figura 35 compara la cota del punto de observación con el nivel freático respectivo. Al igual que en La Dorada, se observa una fuerte correlación entre ambas variables. El set de datos está compuesto por 101 aljibes y tres pozos. La profundidad de los aljibes varía entre 1.6 y 22 metros, con una media de 8 metros. Todos los aljibes captan el acuífero somero. De otro lado, las profundidades de los tres pozos están señaladas en la figura 35. Llama la atención que la relación entre cota y NF de los dos pozos más
89 profundos (150 y 200 metros) difiere de la tendencia general del set de datos. Es claro que ambos pozos están captando aguas de un acuífero más profundo y, por consiguiente, ambos puntos deben ser excluidos del set de datos. La situación del tercer pozo (profundidad de 90 metros) es incierta. Infortunadamente no se conoce su diseño, pero es posible que capte aguas tanto del acuífero somero como del profundo. Como su relación cota/NF concuerda con la tendencia general de los datos, se ha decidido incluir este punto en el análisis estructural de los datos. En este estudio de caso, se ha preparado dos versiones para el conjunto de datos: el primero está compuesto por los 102 registros ya referenciados. Este número de registros está al límite de lo que se considera como cantidad mínima para obtener variogramas representativos (cien datos según Oliver y Webster, 2015, p.22). Los dos puntos excluidos (los dos pozos más profundos) están señalados con flechas en la figura 33.
Figura 33. Mapa ubicación puntos de observación, Carminales (Caldas)
90 En un intento por evitar utilizar este conjunto de datos de NF tan asimétrico, los datos originales fueron transformados mediante la función logaritmo con base 10, pero el resultado no fue satisfactorio ya que el nuevo set de datos transformados ostentó un coeficiente de asimetría de -2.54 y una curtosis de 7.23, muy similares al conjunto de datos originales. El mismo resultado se obtiene si se utiliza una base diferente para los logaritmos. Por lo anterior, se decidió trabajar con los datos originales.
Un segundo conjunto de datos está compuesto únicamente por los puntos que quedan dentro de la cuenca. Es decir, los catorce puntos adyacentes a la cuenca de la quebrada Carminales han sido excluidos en esta segunda versión de set de datos (ver figura 33). Estos catorce puntos están ubicados en zonas bajas y son responsables, en gran medida de la fuerte asimetría negativa observada en la figura 34. La figura 36 presenta el histograma y gráfica de cajas y bigotes de esta segunda versión de set de datos. La distribución del conjunto de datos se asemeja más a una distribución normal, aunque es asimétrica hacia el extremo derecho (coeficiente de asimetría de +1.19 y una curtosis de 1.36). El mayor problema ahora es que el tamaño del conjunto de datos se ha reducido a sólo 88 registros. A pesar de esta limitante, se procedió a explorar posibles variogramas que representen la correlación espacial de los datos.
Figura 34. Histograma y diagrama de Cajas y Bigotes, datos de nivel freático, n = 104. Carminales
91 Respecto a la relación entre NF y CE, se observa una muy leve relación inversa en donde los aljibes ubicados en cotas más altas tienden a captar aguas subterráneas menos mineralizadas y, por tanto, con menor conductividad eléctrica que en la parte baja de la cuenca. La figura 37 muestra dicha relación.
Figura 35. Cota vs NF, Carminales (Caldas). Las etiquetas indican profundidad de los pozos
4.2.2. Construcción y selección de variogramas, Carminales En este apartado se sigue una metodología similar al numeral 4.1.2. En la primera parte se presentan los resultados del proceso de selección de los mejores variogramas teóricos que serán utilizados en la generación de los mapas de NF con las herramientas OK, UK y KED. En la segunda parte se muestra el proceso de selección de los mejores variogramas para la aplicación del método de CK.
Selección de los variogramas para la aplicación de OK, UK y KED 27 variogramas teóricos, divididos en seis grupos (ver figura 5) fueron elaborados en esta fase de la tesis. La mitad de los grupos corresponden al set de 102 datos y la otra mitad al set de 88 registros. En el análisis estructural de los datos de La Dorada se evidenció dificultades en la obtención de variogramas direccionales para el set de 102 registros. Por ende, para el estudio de caso de Carminales, sólo se hizo un intento por
92 definir variogramas direccionales en cada uno de los tres grupos que utiliza el set con más registros. En el caso del set de 88 registros, definitivamente no es posible construir variogramas direccionales confiables debido al limitado número de datos. Los variogramas experimentales y teóricos ajustados han sido obtenidos siguiendo el mismo procedimiento ejecutado para La Dorada a excepción de la utilización del método robusto de Hawkins y Cressie (1984). Este estimador toma la cuarta raíz de las diferencias al cuadrado entre pares de datos, con el fin de aminorar el efecto que valores extremos pueden causar en el variograma. Las tablas 11 y 12 presentan los modelos ajustados para los conjuntos de datos de 102 y 88 registros, respectivamente. En estas tablas el significado de cada columna es el mismo que para las tablas 2, 3 y 4 presentadas con anterioridad.
Figura 36. Histograma y diagrama de Cajas y Bigotes, datos de nivel freático, n = 88. Carminales
La figura 38 muestra a manera de ejemplo ocho variogramas que ofrecen una idea general de todos los tipos de variogramas obtenidos en esta fase de la tesis. Las dos primeras gráficas (a) y (b) corresponden a un mismo variograma experimental, pero difieren en el variograma teórico. En la primera gráfica se utilizaron todas las opciones por defecto para que el paquete gstat ajustara de manera completamente automática el variograma teórico. En algunas ocasiones, este procedimiento dio lugar a modelos sin
93 sentido, con rangos excediendo varias veces la longitud del eje mayor de la cuenca Carminales (ver tabla 11). En la gráfica (b) únicamente se dio importancia al ajuste en las primeras cuatro clases del variograma experimental. A partir de la quinta clase el ajuste es muy malo. La gráfica (c) corresponde al mismo set de datos, pero el variograma experimental ha sido restringido a un vecindario muy local (cutoff = 700, width = 100) y, de nuevo, se dio importancia al ajuste de las primeras cuatro clases del variograma experimental.
Figura 37. CE vs NF, Carminales (Caldas)
Las gráficas (d) y (f) corresponden a sendos variogramas obtenidos al aplicar kriging universal (UK). En estos casos se obtuvo ajustes aceptables, tanto para el set de 102 registros como para el de 88 datos. La gráfica (e) muestra que los datos residuales al aplicar kriging con deriva externa (KED) ostentan un comportamiento cercano al de puro efecto “pepita” (nugget), lo cual ha dificultado en gran medida todos los intentos por encontrar variogramas teóricos aceptables. Este problema también se encontró con los datos de La Dorada. Finalmente, las gráficas (g) y (h) corresponden a uno de los tres intentos por definir variogramas direccionales. El eje de mayor continuidad de los datos de nivel freático fue definido en la dirección cero grados (0°). Aunque la salida de la cuenca está al norte y se podría asumir que la dirección general del movimiento del agua subterránea es de sur a norte (en este caso, la dirección de mayor continuidad sería 90°),
94 se observa que las aguas subterráneas tienden a descargar en dirección al cauce de la quebrada Carminales; es decir, en buena parte de la cuenca parece que los flujos de aguas subterráneas adoptan una dirección de 90° (parte de las aguas viajan en sentido oeste → este, y parte en sentido este → oeste). En este orden de ideas, se ha preferido escoger la dirección de 0° como eje de mayor continuidad de los datos de nivel freático.
Tabla 11. Variogramas generados en la fase de análisis estructural de Carminales. Set 102 datos. Opción
Modelo
psill
rango
psill
rango
psill
102-OK-ISO-1
Nug+Bes
63
0
242584
45358
1.00
102-OK-ISO-2
Nug+Mat
20
0
3100
2500
0.99
2.4
102-OK-ISO-3
Nug+Mat+Gau
25
0
500
4000
0.96
1.5
102-OK-ISO-4
Nug+Gau
9
0
60
480
102-OK-ANI-1
Nug+Mat
20
0
3500
2500
Opción
Modelo
psill
rango
psill
rango
102-UK-ISO-1
Nug+Gau
30
0
148
3133
0.83
102-UK-ISO-2
Nug+Gau
25
0
910
2320
0.97
102-UK-ISO-3
Nug+Mat+Gau
2
0
2
467
102-UK-ISO-4
Cir
89
662
102-UK-ANI-1
Nug+Gau
15
0
1000
2300
Opción
Modelo
psill
rango
psill
rango
102-KED-ISO-1
Nug+Cir
2
0
4
364
0.66
102-KED-ISO-2
Nug+Gau
4
0
3
1000
0.40
102-KED-ISO-3
Nug+Mat+Gau
2
0
2
467
102-KED-ISO-4
Nug+Pen
4
0
3
772
102-KED-ANI-1
Nug + Gau
5
0
8
2500
100
rango
Dir.
Ani.
1400
SV
K
0.87
psill
2
rango
0
0.9
0.99
2.0
Dir.
Ani.
SV
K
108
0.64
4.1
1.00
psill
3
rango
0
0.7
0.99
Dir.
Ani.
SV
108
0.68
K
0.4
0.45 0
0.9
0.62
1.0
NOTAS: Modelos: “Nug” = Nugget; “Cir” = Circular; “Mat” = Matheron; “Gau” = Gaussiano; “Sph” = Esférico; “Bes” = Bessel; “Exp” = Exponencial. Dir = dirección máxima continuidad variograma. Ani: eje menor/eje mayor anisotropía. SV = varianza estructural. K = índice Kappa.
Las tablas 13 y 14 presentan los errores calculados para los 27 variogramas teóricos conformados. La primera columna de estas tablas se corresponde con la primera
95 columna de las tablas 11 y 12. Por cada grupo se ha seleccionado un variograma. Ellos están resaltados con color verde.
De los seis modelos teóricos escogidos, ninguno es direccional y cinco incluyen un efecto Nugget. El modelo anidado Matheron + Gaussiano fue seleccionado en los tres grupos del set de 88 registros. Para el set de 102 registros, el modelo Gaussiano fue seleccionado dos veces y el Circular una vez. El rango de los modelos seleccionados varió entre 480 m y 4600 m. Las varianzas totales de los modelos escogidos estuvieron en los rangos 69 – 2065, 89 – 2130, y 6 – 7, para OK, UK y KED, respectivamente.
Tabla 12. Variogramas generados en la fase de análisis estructural de Carminales. Set 88 datos. psi
Opción
Modelo
psill
rango
psill
rango
88-OK-ISO-1
Nug+Gau
22
0
29411
20769
1.00
88-OK-ISO-2
Nug+Mat
15
0
1700
2600
0.99
1.5
88-OK-ISO-3
Nug+Mat+Gau
15
0
1350
3500
0.99
1.5
88-OK-ISO-4
Nug+Gau
7
0
67
460
Opción
Modelo
psill
rango
psill
rango
88-UK-ISO-1
Nug+Gau
23
0
812
5128
0.97
88-UK-ISO-2
Nug+Mat
23
0
1329114
370612
1.00
1.0
88-UK-ISO-3
Nug+Mat+Gau
20
0
2100
3400
0.99
2.3
88-UK-ISO-4
Nug+Gau
8
0
115
769
Opción
Modelo
psill
rango
psill
rango
88-KED-ISIO-1
Nug+Sph
5
0
2
828
0.29
88-KED-ISIO-2
Nug+Mat
5
0
2
128
0.26
2.3
88-KED-ISIO-3
Nug+Mat+Gau
2
0
2
467
0.68
0.4
88-KED-ISIO-4
Nug+Pen
4
0
3
772
ll
70 0
rango
Dir.
Ani.
4500
SV
K
0.91
psi ll
10
rango
Dir.
Ani.
4673
SV
K
0.94
psi ll
3
rango
108
Dir.
Ani.
SV
K
0.45
NOTAS: Modelos: “Nug” = Nugget; “Cir” = Circular; “Mat” = Matheron; “Gau” = Gaussiano; “Sph” = Esférico; “Bes” = Bessel; “Exp” = Exponencial. Dir = dirección máxima continuidad variograma. Ani: eje menor/eje mayor anisotropía. SV = varianza estructural. K = índice Kappa.
96 Selección de los variogramas para la aplicación de CK La disponibilidad limitada de datos para aplicar la herramienta CK en La Dorada también se evidencia en el estudio de caso de la cuenca Carminales. En este apartado se ha seguido el mismo procedimiento aplicado a los datos de La Dorada. Partiendo del set de 102 registros se definió un subconjunto compuesto por 80 registros.
Figura 38. Ejemplos de variogramas construidos para Carminales, OK, UK y KED.
97 La figura 39 muestra los histogramas de las dos variables secundarias, para las dos versiones de conjunto de datos. Para cada variable se observa que la distribución de los datos en ambos conjuntos es similar entre sí, como era de esperarse al seleccionar en forma aleatoria los registros para la conformación del subconjunto de 80 datos. Aunque las distribuciones de los datos auxiliares son asimétricas (por ejemplo, para el set de 80 registros los coeficientes de asimetría son +0.98 y -2.75 para la conductividad y cota, respectivamente), se ha preferido no aplicar transformación alguna ya que ello no mejora de manera sensible la forma de distribución para este caso en particular.
La figura 40 muestra los variogramas experimentales (puntos negros) tanto para el NF (a) como para la Cota (c), así como para el co-variograma (b). La tabla 15 muestra los valores de los parámetros de los variogramas directos (NF y Cota) obtenidos en forma independiente. Es fácil advertir la similitud entre ambos, lo cual es prerrequisito para el co-kriging. Estos variogramas fueron obtenidos utilizando las opciones por defecto de la función fit.variogram. Se ha seleccionado un modelo tipo Gaussiano, incluyendo un efecto Nugget. Se ha dado prioridad al ajuste en las seis primeras clases de los variogramas experimentales.
La figura 41 muestra los variogramas experimentales (puntos negros) tanto para el NF (a) como para la CE (c), así como para el co-variograma (b). Como era de esperarse, no fue posible ajustar modelo alguno al co-variograma debido a que no existe una buena correlación la CE y el NF.
4.2.3. Generación de mapas, Carminales Por cada variograma teórico seleccionado en el numeral 4.2.2 se generaron tres mapas. La diferencia entre esos tres mapas radica en el número de observaciones utilizadas para predecir el nivel freático en cada punto de la malla de interpolación con resolución 12.5 x 12.5 previamente generada. En el primer mapa se tuvo en cuenta el set completo de datos a disposición (vecindario global). En el segundo se seleccionó un máximo de quince puntos (los más cercanos al sitio donde se desea interpolar), y en el tercer mapa el vecindario de búsqueda fue todavía más local ya que sólo se tuvo en cuenta un máximo de cinco puntos de observación.
98
Tabla 13. Selección variogramas. Cálculo de indicadores de error, datos de Carminales. Set 102 datos. Opción
ME
MAE
MSE2
RMSE
ASE
RMSSE
D
Ecuación regresión
102-OK-ISO-1
0.079
7.475
-0.003
11.767
34.445
1.193
0.973
y = 0.87x + 136.97; R2 = 0.90
102-OK-ISO-2
0.048
9.397
-0.004
14.571
34.071
2.840
0.957
y = 0.83x + 172.95; R2 = 0.85
102-OK-ISO-3
0.097
7.249
-0.007
10.821
34.639
1.975
0.977
y = 0.88x + 124.38; R2 = 0.92
102-OK-ISO-4
0.258
7.049
-0.019
11.479
32.628
2.265
0.973
y = 0.83x + 178.39; R2 = 0.92
102-OK-ANI-1
0.123
7.591
-0.008
11.690
34.715
2.142
0.973
y = 0.87x + 129.50; R2 = 0.91
Opción
ME
MAE
MSE2
RMSE
ASE
RMSSE
D
Ecuación regresión
102-UK-ISO-1
0.105
9.634
-0.007
14.463
34.363
2.270
0.958
y = 0.84x + 164.54; R2 = 0.85
102-UK-ISO-2
0.134
7.981
-0.008
12.263
34.987
2.040
0.971
y = 0.87x + 127.61; R2 = 0.90
102-UK-ISO-3
0.138
7.644
-0.009
11.865
35.105
1.991
0.973
y = 0.88x + 121.14; R2 = 0.90
102-UK-ISO-4
0.646
6.482
-0.041
11.621
35.096
1.674
0.974
y = 0.88x + 118.63; R2 = 0.91
102-UK-ANI-1
0.199
7.108
-0.011
10.824
35.833
2.144
0.978
y = 0.91x + 93.87; R2 = 0.92
Opción
ME
MAE
MSE2
RMSE
ASE
RMSSE
D
Ecuación regresión
102-KED-ISO-1
-0.017
2.200
0.003
3.749
37.610
1.654
0.998
y = 0.99x + 9.65; R2 = 0.99
102-KED-ISO-2
-0.002
2.184
0.000
3.468
37.613
1.526
0.998
y = 0.99x + 8.82; R2 = 0.99
102-KED-ISO-3
-0.019
2.084
0.004
3.478
37.618
1.569
0.998
y = 0.99x + 8.71; R2 = 0.99
102-KED-ISO-4
-0.050
2.185
0.014
3.754
37.550
1.827
0.998
y = 0.99x + 11.34; R2 = 0.99
102-KED-ANI-1
-0.005
2.139
0.001
3.383
37.615
1.421
0.998
y = 0.99x + 8.57; R2 = 0.99
NOTAS: ME, MAE, MSE2, RMSE, ASE, RMSSE y D: ver ecuaciones 5 a 11, páginas 48 a 51.
Por cada mapa, se generó tres superficies: la primera con los datos interpolados, la segunda con las varianzas asociadas a cada valor interpolado, y la tercera es el resultado de aplicar álgebra de mapas, al restar la superficie freática interpolada de la superficie topográfica.
99
Tabla 14. Selección variogramas. Cálculo de indicadores de error, datos de Carminales. Set 102 datos. Opción
ME
MAE
MSE2
RMSE
ASE
RMSSE
D
Ecuación regresión
88-OK-ISO-1
0.110
5.504
-0.011
8.390
10.687
1.728
0.874
y = 0.61x + 405.91; R2 = 0.65
88-OK-ISO-2
0.282
4.479
-0.025
6.665
12.034
1.434
0.931
y = 0.75x + 255.86; R2 = 0.78
88-OK-ISO-3
0.219
4.780
-0.022
7.139
11.837
1.605
0.919
y = 0.73x + 285.77; R2 = 0.74
88-OK-ISO-4
0.532
4.403
-0.053
6.610
11.929
1.514
0.932
y = 0.75x + 259.81; R2 = 0.78
Opción
ME
MAE
MSE2
RMSE
ASE
RMSSE
D
Ecuación regresión
88-UK-ISO-1
0.175
5.697
-0.016
8.242
11.345
1.600
0.886
y = 0.65x + 360.94; R2 = 0.66
88-UK-ISO-2
0.181
5.214
-0.017
7.848
10.882
1.497
0.894
y = 0.64x + 371.38; R2 = 0.69
88-UK-ISO-3
0.170
5.400
-0.017
8.020
11.386
1.668
0.893
y = 0.67x + 348.95; R2 = 0.67
88-UK-ISO-4
0.589
4.303
-0.062
6.451
12.412
1.676
0.937
y = 0.79x + 222.98; R2 = 0.79
Opción
ME
MAE
MSE2
RMSE
ASE
RMSSE
D
Ecuación regresión
88-KED-ISIO-1
0.020
2.185
-0.004
3.611
13.638
1.484
0.983
y = 0.94x + 64.33; R2 = 0.93
88-KED-ISIO-2
0.021
2.179
-0.004
3.604
13.638
1.479
0.983
y = 0.94x + 64.20; R2 = 0.93
88-KED-ISIO-3
0.000
2.112
0.000
3.703
13.666
1.588
0.982
y = 0.94x + 64.14; R2 = 0.93
88-KED-ISIO-4
0.022
2.197
-0.005
3.743
13.646
1.551
0.981
y = 0.94x + 66.33; R2 = 0.93
NOTAS: ME, MAE, MSE2, RMSE, ASE, RMSSE y D: ver ecuaciones 5 a 11, páginas 48 a 51.
Tabla 15. Modelos de variograma generados, aplicación CK, Carminales Opción
Modelo
psill
rango
psill
rango
SV
80-OK-ISO-1
Nug+Gau
5
0
70
350
0.93
Nug+Gau
5
0
80
350
0.94
80-OK-ISO-2
Mat
21
55
1.00
0.3
80-CK-ISO-CE
Mat
7300
55
1.00
0.3
80-CK-ISOCota
K
NOTAS: Modelos: “Nug” = Nugget; “Mat” = Matheron; “Gau” = Gaussiano. SV = varianza estructural. K = parámetro kappa
100
Figura 39. Histogramas de las variables secundarias para aplicar CK, Carminales.
Superficies interpoladas con las herramientas OK, UK y KED, Carminales La tabla 16 muestra los errores calculados para cada una de las 18 superficies interpoladas. Los errores han sido estimados usando el mismo procedimiento que para La Dorada.
En la cuenca de la quebrada Carminales, el comportamiento de los índices ME, MAE y MSE2 no ha sido tan homogéneo como lo fue para La Dorada. Por ejemplo, el índice ME disminuyó al hacer más local el vecindario de búsqueda cuando se aplicaron las herramientas OK y UK con el set de 102 datos, pero aumentó en el caso de KED. Con relación al set de 88 datos, las tendencias de ME fueron disímiles entre las tres herramientas de interpolación. Un comportamiento similar se observó con los índices MAE y MSE2.
En relación con el indicador RMSE, los menores errores fueron observados cuando el número máximo de puntos usados en la interpolación fue cinco (casos OK y UK). En cambio, con KED el mejor rendimiento se obtuvo cuando se empleó un vecindario global.
101
Figura 40. Variogramas y co-variograma, aplicaciĂłn CK con Cota como variable auxiliar. Carminales.
Figura 41. Variogramas y co-variograma, aplicaciĂłn CK con CE como variable auxiliar. Carminales.
Al comparar los tres interpoladores entre sĂ, KED ofrece los menores errores al igual que en La Dorada. Y al comparar los dos sets de datos, los menores errores se observan para
102 el conjunto de 88 datos cuando se utilizó OK y UK. Cuando se utilizó KED, los menores errores corresponden al set de 102 datos.
La figura 42 muestra ocho gráficas de dispersión en donde se comparan los valores observados con los interpolados como resultado de la validación cruzada, tal como se hizo para el estudio de caso de La Dorada. Las gráficas (a), (b) y (c) muestran los resultados de interpolación con las herramientas OK, UK y KED, respectivamente, con el set de datos de 102 registros. Es evidente que en el caso de la herramienta KED, los valores observados son muy cercanos a los reales. El rendimiento que se observa en las otras dos técnicas es muy similar entre sí, y es inferior al KED. Las gráficas (b), (d) y (e) corresponden a la aplicación de UK con el set de 102 registros, pero se diferencian entre sí en el número de datos tenidos en cuenta en cada interpolación. En el caso 102-UKISO-4-05, en donde se tuvo en cuenta sólo cinco puntos de observación (e), los datos interpolados están menos dispersos y difieren en menor medida de los datos observados, mientras que el peor rendimiento se detecta en el caso en el que se utilizó el set completo de datos (caso 102-UK-ISO-4-all). Esta tendencia es contraria a los que se observó con los datos de La Dorada. Las gráficas (a) y (f) presentan resultados obtenidos después de aplicar OK a los conjuntos de datos de 102 y 88 registros, respectivamente. Con el fin de facilitar su comparación se ha mantenido las mismas escalas en ambas gráficas. A pesar de la dispersión de los datos en las cotas más bajas (conjunto de 102 registros) parece que la gráfica (a) muestra un mejor rendimiento que la gráfica (f). En general, la misma tendencia se observa con la herramienta KED, pero no con UK.
Las últimas dos gráficas corresponden a la aplicación de KED en el set de 88 registros, con un vecindario global (g) y uno local (h). Para esta herramienta en particular, los mayores errores fueron estimados cuando se restringió el vecindario de búsqueda a un máximo de cinco puntos. El comportamiento contrario se observó en los otros dos interpoladores.
La figura 43 presenta ocho gráficas en donde se aprecia el comportamiento de los errores de acuerdo con la magnitud de los valores observados. Estas ocho gráficas
103 corresponden a los mismos casos presentados en la figura 42. En las gráficas que corresponden a la aplicación de OK se aprecia un efecto de escala: el interpolador subestima la variable regionalizada a medida que su valor real es mayor, y la sobreestima a medida que su valor real es menor. En el caso de KED, este fenómeno parece no existir. UK parece exhibir un escenario intermedio.
Tabla 16. Errores estimados en la construcción de las superficies interpoladas, métodos OK, UK y KED, Carminales. Opción
ME
MAE
MSE2
RMSE
ASE
102-OK-ISO-4-all
0.258
7.049
-0.019
11.479
32.628
102-OK-ISO-4-15
0.126
6.488
0.028
10.532
102-OK-ISO-4-05
-0.059
5.727
0.040
102-UK-ISO-4-all
0.646
6.482
102-UK-ISO-4-15
0.873
102-UK-ISO-4-05
RMSS
D
Ecuación regresión
2.265
0.973
y = 0.83x + 178.39; R2 = 0.92
34.017
2.023
0.978
y = 0.87x + 137.54; R2 = 0.93
8.530
35.763
1.601
0.986
y = 0.92x + 79.89; R2 = 0.95
-0.041
11.621
35.096
1.674
0.974
y = 0.88x + 118.63; R2 = 0.91
6.027
-0.072
10.418
36.172
1.482
0.980
y = 0.92x + 80.98; R2 = 0.92
0.025
5.477
0.021
8.505
37.215
1.144
0.987
y = 0.96x + 41.35; R2 = 0.95
102-KED-ISO-2-all
-0.002
2.184
0.000
3.468
37.613
1.526
0.998
y = 0.99x + 8.82; R2 = 0.99
102-KED-ISO-15
-0.001
2.131
-0.001
3.499
37.571
1.505
0.998
y = 0.99x + 10.03; R2 = 0.99
102-KED-ISO-05
0.038
2.551
-0.017
4.266
37.415
1.495
0.997
y = 0.98x + 16.39; R2 = 0.99
88-OK-ISO-3-all
0.219
4.780
-0.022
7.139
11.837
1.605
0.919
y = 0.73x + 285.77; R2 = 0.74
88-OK-ISO-3-15
0.018
4.724
0.030
7.104
11.834
1.557
0.920
y = 0.73x + 284.93; R2 = 0.74
88-OK-ISO-3-05
0.379
4.786
-0.046
6.900
12.201
1.418
0.927
y = 0.76x + 253.30; R2 = 0.76
88-UK-ISO-3-all
0.170
5.400
-0.017
8.020
11.386
1.668
0.893
y = 0.67x + 348.95; R2 = 0.67
88-UK-ISO-3-15
-0.377
5.107
0.104
7.548
11.895
1.503
0.910
y = 0.71x + 298.4; R2 = 0.71
88-UK-ISO-3-05
0.024
5.028
-0.003
7.206
14.154
1.186
0.931
y = 0.88x + 129.33; R2 = 0.76
88-KED-ISO-3-all
0.000
2.112
0.000
3.703
13.666
1.588
0.982
y = 0.94x + 64.14; R2 = 0.93
88-KED-ISO-3-15
0.099
2.192
-0.034
3.851
13.701
1.596
0.980
y = 0.94x + 64.44; R2 = 0.93
88-KED-ISO-3-05
0.162
2.624
-0.044
4.610
13.583
1.593
0.971
y = 0.91x + 89.85; R2 = 0.89
E
NOTAS: ME, MAE, MSE2, RMSE, ASE, RMSSE y D: ver ecuaciones 5 a 11, páginas 48 a 51.
Las figuras 44, 45 y 46 presentan, a manera de ejemplo, los mapas generados con las herramientas de interpolación OK, UK y KED, a partir de un mismo set de datos; en este caso, el conjunto compuesto por 102 registros.
104
Figura 42. Comparación valores observados vs valores interpolados. Carminales
La figura 44 corresponde a las superficies freáticas interpoladas. Los productos obtenidos de los tres interpoladores son tan diferentes entre sí que ha sido necesario utilizar escalas diferentes para cada mapa. La primera superficie ha sido obtenida con la herramienta OK. En este caso, el interpolador asume que hay una divisoria de aguas subterráneas que coincide aproximadamente con la recta discontinua roja, de tal forma
105 que parte de las aguas subterránea fluirían hacia el suroeste como lo indica la flecha roja. Este rasgo parece estar en contravía de lo que se espera sea el patrón de flujo de las aguas subterráneas en esta cuenca; es decir, la flecha roja sugiere que el agua subterránea en el sur de la cuenca fluye hacia zonas con una cota topográfica mayor. El segundo mapa ha sido obtenido con el interpolador UK. De acuerdo con el mapa obtenido, todas las aguas subterráneas fluirían en sentido suroeste → noreste, como lo indica la flecha roja. Este comportamiento también parece contradecir el comportamiento esperado de las aguas subterráneas en la margen derecha de la quebrada Carminales (principalmente en la parte alta de la cuenca), en donde se prevé que las aguas fluyan hacia el cauce; es decir, en sentido noreste → suroeste. El mapa obtenido con KED parece ser el que mejor refleja las condiciones de campo. La tabla de agua tiende a ser una réplica de la topografía. En la parte alta de la cuenca el nivel freático sugiere que las aguas subterráneas fluyen hacia el cauce de la quebrada Carminales, que es lo que se espera debido a su carácter de corriente permanente. Sin embargo, como se muestra en el último mapa de la figura 46, de acuerdo con KED con vecindario global la tabla de agua nunca corta la superficie topográfica; es decir, no se genera descarga de agua subterránea al cauce de la quebrada Carminales, lo cual también contradice las observaciones de campo.
La figura 45 muestra las varianzas calculadas para cada superficie interpolada. En general, KED ofrece las menores incertidumbres mientras que las mayores se observan para el interpolador UK. Como es de esperarse, los valores extremos de las varianzas están al sur de la cuenca ya que allí no hay puntos de observación. Sin embargo, se puede observar que para KED las varianzas al sur no son muy grandes respecto a las otras dos herramientas de interpolación debido a que dicho método usa los valores de cota de cada nodo en la malla de interpolación para estimar el nivel freático.
La figura 46 muestra las superficies obtenidas después de sustraer el nivel freático de la cota topográfica. De acuerdo con los resultados obtenidos, las zonas en negro corresponden a posibles zonas de descarga del agua subterránea. Se recuerda que los mapas de las figuras 44 – 46 no son necesariamente los mejores mapas obtenidos. Su presentación se hace con el fin de contrastar el rendimiento de las tres herramientas de
106 interpolación abordadas en este apartado del documento. OK limita las zonas de descarga a la parte baja de la cuenca, aunque sugiere que el cauce de la quebrada Carminales desde la parte media de la cuenca es efluente o ganador. UK aumenta las zonas anegables en la parte media de la cuenca, incluido el cauce de la quebrada Carminales. En contraste, KED (utilizando un vecindario global) indica que en toda la cuenca la tabla de agua se halla por debajo de la superficie topográfica, lo cual contradice las observaciones de los moradores que afirman que el drenaje es perenne. Obsérvese que sólo UK predice zonas de anegación coincidentes con los dos puntos auxiliares (estrellas color magenta) en la margen derecha del cauce en la parte media de la cuenca. Estos dos puntos son pequeñas lagunas que posiblemente son alimentadas por flujos de agua subterránea.
Las figuras 47, 48 y 49 presentan algunos resultados que se obtienen al variar el vecindario de búsqueda al momento de interpolar el nivel freático en la cuenca Carminales. La figura 47 contiene las superficies freáticas interpoladas con OK, usando el set de 88 registros. En la figura 47 se observa cómo el límite entre clases se hace más errático a medida que el vecindario de búsqueda se hace más local. Este problema es más acusado al sur y norte de la cuenca ya que en esos sectores no existen puntos de observación.
La figura 48 contiene los mapas de varianza de kriging para las interpolaciones realizadas con UK usando el conjunto de 88 registros. Las mayores varianzas se observaron cuando se utilizó un vecindario de máximo cinco puntos para la interpolación. En los otros dos casos (vecindario de 15 puntos y set completo de datos) las varianzas fueron similares. Un comportamiento parecido se observó cuando se utilizaron los otros dos interpoladores.
Finalmente, la figura 49 contiene tres superficies obtenidas al restar la superficie freática de la superficie topográfica, usando KED con el set de 88 registros, y variando el vecindario de búsqueda. En el primer mapa, las zonas anegables están restringidas a la parte baja de la cuenca. Las configuraciones del segundo y tercer mapa de la figura 49
107 son similares entre sĂ. En general, las zonas potenciales de descarga obtenidas con KED parecen no corresponder a rasgo geogrĂĄfico alguno.
Figura 43. Posible efecto de escala a errores obtenidos con datos de Carminales
108
Figura 44. Superficies interpoladas con OK, UK y KED. Set de 102 registros. Carminales
Superficies interpoladas con las herramienta CK, Carminales La tabla 17 muestra los errores calculados para cada una de las cuatro superficies generadas. Dos de ellas (80-CK-ISO-Cota y 80-CK-ISO-CE) corresponden a la aplicación de CK. Con el fin de evaluar si su utilización conlleva alguna mejora, también se generaron superficies con OK y se compararon entre sí los resultados.
109
Figura 45. Varianzas calculadas para las superficies interpoladas con OK, UK y KED. Carminales.
De la tabla 17 se desprende que CK disminuye en forma ostensible los errores asociados a la interpolaciรณn cuando se utiliza la cota como variable auxiliar (comparar 80-OK-ISO1 con 80-CK-ISO-Cota), pero es evidente el empeoramiento de los errores cuando se incorpora la CE como variable auxiliar.
110
Figura 46. Posibles zonas de descarga de agua subterránea según OK, UK y KED. Carminales
La figura 50 compara los valores observados con aquellos estimados con validación cruzada. Mientras en la gráfica (b) se observa una buena correspondencia entre los valores observados y los interpolados, en la (d) hay un divorcio total entre esos valores. Se recuerda que las gráficas (b) y (d) son el resultado de aplicar CK utilizando como variables auxiliares la Cota y la CE, respectivamente.
111
Figura 47. superficies freรกticas interpoladas con OK, usando el set de 88 registros. Carminales
Las grรกficas (a) y (c) se han obtenido al aplicar OK al mismo set de datos, pero con modelos de variograma forzados a ser similares a la estructura espacial detectada para las variables auxiliares correspondientes. Mientras fue posible encontrar un variograma que se ajustara en forma aceptable tanto al NF como a la Cota (ver grรกficas a y c, figura
112 40), no fue posible alcanzar el mismo propósito cuando se incorporó la CE como variable auxiliar (ver figura 41); de ahí que el modelo de variograma utilizado en las gráficas (c) y (d) de la figura 50 dé como resultado valores interpolados que distan mucho de los valores observados. Comportamientos no deseados (no mostrados aquí) también son evidentes cuando se evalúa la existencia de posibles efectos de escala en los errores.
Tabla 17. Errores estimados en la construcción de las superficies interpoladas, métodos OK y CK, Carminales. Opción
ME
MAE
MSE2
RMSE
ASE
80-OK-ISO-1
0.702
7.843
-0.046
14.482
30.902
80-CK-ISO-Cota
0.002
2.640
0.026
4.186
80-OK-ISO-2
-0.462
18.738
0.056
80-CK-ISO-CE
-0.398
48.516
0.033
RMSS
D
Ecuación regresión
2.264
0.954
y = 0.77x + 240.43; R2 = 0.86
36.001
6.112
0.997
y = 0.96x + 44.51; R2 = 0.99
34.081
5.754
7.437
0.326
y = 0.10x + 933.01; R2 = 0.40
68.144
47.025
10.590
0.175
y = -0.37x + 1414.1; R2 = 0.09
E
NOTAS: ME, MAE, MSE2, RMSE, ASE, RMSSE y D: ver ecuaciones 5 a 11, páginas 48 a 51.
La figura 51 presenta las superficies freáticas interpoladas. Los dos primeros mapas sugieren la existencia de una divisoria de aguas subterráneas señalada con la recta roja, dando lugar a que una parte de las aguas fluyan en sentido noreste → suroeste, lo cual no parece estar acorde con observaciones de campo. Las superficies mostradas en los mapas (c) y (d) son muy planas, y generan también flujos que van en sentido noreste → suroeste en las partes media y alta de la cuenca. El mapa (d) además exhibe unas depresiones del nivel freático no detectadas en campo.
La figura 52 muestra las varianzas kriging asociadas con las superficies mostradas en la figura 51. Las varianzas estimadas cuando se ha utilizado la CE como variable auxiliar son muy homogéneas en toda el área de estudio y curiosamente su magnitud es sensiblemente menor que las varianzas calculadas para el caso en que se ha tenido en cuenta la cota como variable secundaria.
113
Figura 48. Varianzas para las interpolaciones realizadas con UK, set de 88 registros. Carminales
Finalmente, la figura 53 muestra las zonas donde, de acuerdo con la interpolaciรณn de la tabla de agua, se espera que exista descarga de agua subterrรกnea. Los cuatro mapas generados restringen la mayor รกrea de las zonas de descarga a la parte baja de la cuenca. Sรณlo los dos primeros mapas incorporan zonas de descarga a algunos tramos del cauce de la quebrada Carminales en la parte media de la cuenca.
114
Figura 49. Zonas de descarga de agua subterránea, según KED, set 88 registros. Carminales
4.3. Discusión de los resultados La idea central del presente trabajo es comparar el rendimiento de cuatro herramientas de interpolación a partir de datos reales recolectados en dos escenarios distintos. Independientemente de cuál sea la mejor herramienta para los datos disponibles, se
115 espera que los resultados obtenidos signifiquen una mejora en el conocimiento que a la fecha se tiene de los dos acuíferos bajo estudio.
Figura 50. Comparación valores observados vs valores interpolados. CK. Carminales
En esencia, tres comparaciones han sido planteadas en el presente trabajo: • • •
Rendimiento de los interpoladores OK, UK, KED y CK a partir de un mismo set de datos. Rendimiento de cada interpolador a la luz de diferentes conjuntos de datos. Comparar resultados en el marco de dos escenarios distintos: La Dorada y cuenca de la quebrada Carminales.
El rendimiento de los cuatro interpoladores se ha hecho tomando en cuenta dos aspectos: • •
Los índices de error calculados con validación cruzada. El aspecto de las superficies interpoladas (tablas de agua), así como las varianzas asociadas a los valores interpolados, y el producto denominado aquí como “mapa de zonas de recarga y descarga de aguas subterráneas”. Estos mapas se
116 han evaluado a la luz de evidencias de campo e información proveída por otros estudios hidrogeológicos en las dos zonas de interés.
Figura 51. Superficies interpoladas, generadas con OK y CK. Carminales
A continuación, se discuten algunos temas relacionados con: 1) los datos usados en el presente trabajo y su influencia en la calidad de los modelos de variograma seleccionados; 2) el procedimiento adoptado en el presente trabajo para evaluar el rendimiento de las cuatro interpoladores kriging; y 3) los criterios adoptados para
117 escoger las superficies interpoladas más “apropiadas” a juicio del autor del presente reporte, a la luz de los datos disponibles.
Figura 52. Varianzas de datos interpolados, obtenidas con OK y CK. Carminales
4.3.1. Limitaciones de los datos utilizados El set completo de datos disponibles de La Dorada está conformado por una cantidad razonable de registros (191). Sin embargo, la distribución de los puntos de observación es muy desigual, con concentración de puntos en al menos cuatro sectores, y cinco zonas
118 con ausencia de información (ver figura 6). Aunque los interpoladores kriging pueden abordar en forma satisfactoria el problema de la conglomeración de datos (“cluster data”), no es posible obtener estimaciones con bajas incertidumbres en las regiones que carecen de datos observados.
Figura 53. Zonas de descarga de agua subterránea, según OK y CK. Carminales
La situación en la cuenca de la quebrada Carminales es más crítica, ya que la cantidad de datos observados es baja: 102 para el set completo, de los cuales sólo 88 puntos se
119 ubican al interior de la cuenca. Su distribución es muy desigual ya que casi todos los puntos se concentran en la parte media-baja de la cuenca. Los extremos sur y norte del área de estudio no cuentan con datos y, por ende, allí sólo es posible hacer extrapolación, no interpolación.
Una diferencia importante entre los datos de ambos estudios de caso reside en los tiempos de recolección de información. Como ambos acuíferos son someros, se espera que la tabla de agua cambie su configuración en respuesta a la alternancia entre las épocas de lluvia y estiaje. Para el caso de La Dorada, la campaña de medición de niveles se planificó de tal forma que la ventana de tiempo del muestreo fue de un mes (del 5 de febrero al 2 de marzo de 2018), en plena época seca y, por consiguiente, se asume que toda la información corresponde a un mismo periodo hidrológico. En contraste, la ventana de muestreo de Carminales fue de más de cuatro meses (del 15 de marzo al 26 de julio de 2017), a pesar de que el tamaño de la cuenca equivale a sólo un 5% de la extensión de La Dorada. La razón de esta discrepancia es que la medición de niveles en Carminales se hizo en el marco de una actualización de inventario de puntos agua; es decir, el propósito principal no fue utilizar esta información para interpolar la tabla de agua. En la mitad de esos cuatro meses hubo un periodo de lluvias que pudo modificar las condiciones hidrogeológicas en alguna medida.
Armstrong (1984) advierte de los problemas ocasionados en la configuración de los variogramas debido a poblaciones entremezcladas. Cuando un variograma es calculado a partir de información proveniente de diferentes campañas de muestreo, es probable que los datos pertenezcan a más de una población estadística. Esto da lugar a variogramas experimentales erráticos. En el caso de la cuenca de la quebrada Carminales, el efecto se agudiza debido al bajo número de datos disponibles. De hecho, casi todos los variogramas obtenidos con los datos de Carminales fueron erráticos.
Otro hecho que complica el uso de los datos de la quebrada Carminales es que los datos presentaron una distribución muy sesgada. Kerry y Oliver (2007) exploraron los efectos causados por la asimetría de los datos en la construcción de los variogramas experimentales, a partir de series simuladas de datos. Una de sus conclusiones fue que
120 entre más sesgada es una población, el efecto pepita (nugget) tiende a sobreestimarse mientras que el “sill” tiende a ser subestimado, dando lugar a variogramas muy planos (ausencia de correlación espacial entre los datos). Este efecto era más acusado cuando la cantidad de información disponible era limitada, cercana a cien datos. Por esta razón, las semivarianzas estimadas a partir de los datos de Carminales se trataron con un método robusto propuesto por Hawkins y Cressie (1984).
En relación con la utilización de las variables secundarias, ya se mencionó que, a diferencia de la cota, la CE viola algunas de las propiedades que deben tener las variables auxiliares al momento de ejecutar kriging multivariado. La principal violación es no tener una relación clara con la variable principal. La CE es un parámetro fisicoquímico que da una idea del grado de mineralización del agua. En el caso de las aguas subterráneas, los principales factores que afectan la magnitud de la CE son: la mineralogía, mezcla de aguas con diferente origen, presencia de procesos de contaminación, y tiempo de residencia del agua en el subsuelo. Si la mineralogía es homogénea en el área de estudio, y si además se asume ausencia de procesos de mezclas y polución, entonces la CE dependerá en mayor medida del tiempo de contacto del agua con los minerales que hacen parte del acuífero. A su vez, este rasgo tiene conexión con el patrón de flujo del agua subterránea, el cual está gobernado por la configuración de la superficie freática. Por lo anterior, se ha explorado la posibilidad de utilizar la CE para mejorar la interpolación del nivel freático. Infortunadamente, en las dos áreas de estudio la CE no ha mostrado tener relación alguna con el NF. En este orden de ideas, no sorprende que las superficies freáticas interpoladas con la herramienta CK, usando la CE como variable auxiliar, sean las que más distan de lo que se espera sea la configuración real de la tabla de agua.
Uno de los objetivos de la presente tesis es indagar si la utilización indiscriminada de niveles estáticos y dinámicos, o la inclusión de manantiales, pueden tener efectos drásticos en la calidad de las superficies freáticas interpoladas. Para ello, se prepararon las tres versiones de datos utilizadas con las herramientas OK, UK y KED para el estudio de caso de La Dorada. Un escenario ideal para llevar a cabo tal comparación hubiese sido preparar los tres conjuntos de datos de tal manera que todos tuvieran la misma
121 cantidad de registros y los mismos puntos de observación. Infortunadamente, éste no es el caso en la presente tesis. El cambio de configuración de la red de puntos de observación entre los tres conjuntos de datos genera ruido y entorpece la consecución del objetivo propuesto.
4.3.2. Evaluación rendimiento interpoladores La selección de los modelos de variograma y superficies interpoladas más “apropiados” se basa en gran medida en los indicadores de error calculados a partir de la validación cruzada. En este sentido, la validación cruzada puede ser considerada como una valiosa herramienta exploratoria, ya que permite escoger, entre un grupo de candidatos, los más aptos de acuerdo con los datos disponibles. Davis (1987) hace hincapié en que la validación cruzada no ha sido diseñada como una técnica para la prueba de hipótesis; en otras palabras, si la validación cruzada sugiere que el rendimiento de un modelo es mejor que otro para un set de datos en particular, en general no se puede afirmar que dicho modelo siempre será el mejor. Por ejemplo, en la presente tesis se ha visto como para el set de datos de 191 registros y usando OK, el modelo de variograma más apropiado parece ser de tipo Nugget + Circular; pero si se usa el set de 146 registros, el mejor modelo parece ser de tipo Nugget + Bessel, y si el set es de 102 registros, la selección es Nugget + Matheron.
Otra forma de medir el rendimiento de los interpoladores es dividiendo el set original de datos en dos conjuntos: uno para llevar a cabo la interpolación, y un segundo conjunto para validar la bondad de las herramientas de interpolación. Cuando ya se ha seleccionado un modelo de variograma y una herramienta de interpolación, se estiman valores de la variable de interés en las mismas coordenadas de los puntos que hacen parte del conjunto de validación y, posteriormente, se estiman los errores comparando los valores estimados con los observados. Esta modalidad de evaluar el rendimiento del proceso de interpolación tiene la ventaja, respecto a la validación cruzada, de utilizar un set independiente de datos. El problema es que cuando la información disponible es limitada, como sucede en el presente trabajo, es un desperdicio desechar números del set de datos que se utilizará para interpolar.
122 Aunque los índices de error calculados a partir de la validación cruzada son una buena guía, no son suficientes para hacer la selección final. En los numerales 4.1 y 4.2 del presente informe se ha mostrado cómo los errores asociados con la herramienta KED son más pequeños comparados con los resultados obtenidos en las otras herramientas de interpolación. Sin embargo, las superficies generadas con KED no siempre parecen reflejar las observaciones de campo.
En general, los variogramas experimentales obtenidos en el presente trabajo asociados con la herramienta KED fueron los que presentaron el comportamiento más plano (puro efecto de pepita). Este rasgo se observó en las dos áreas de estudio. La fuerte correlación entre el nivel freático y la cota topográfica (R2 = 0.96 para los aljibes de La Dorada; R2 = 0.99 para los aljibes de Carminales) da lugar a pequeños valores residuales sin una aparente estructura espacial. Se recuerda que para KED, los variogramas experimentales se construyen con los valores residuales que se obtienen al extraer de los datos originales la tendencia del NF debida a la influencia de la variable secundaria, en este caso la cota topográfica. Las superficies freáticas interpoladas con KED son casi una réplica exacta de la configuración topográfica. Para el caso de la cuenca de la quebrada Carminales, en donde la topografía es abrupta, la configuración de la tabla de agua resultante parece estar acorde con lo que se espera sea el patrón de flujo del agua subterránea, pero en el caso de la Dorada, donde los gradientes topográficos son muy bajos, la superficie freática obtenida tiene una apariencia muy artificial.
Otro aspecto por destacar es cómo abordar el problema de la falta de estacionariedad de la variable NF. Es evidente que el nivel freático presenta tendencias regionales: los gradientes piezométricos son necesarios para el movimiento del agua subterránea. En teoría, la herramienta más apropiada para interpolar el NF debería ser UK (o KED). Matemáticamente hablando, OK podría considerarse como un caso particular de UK, en el que la tendencia regional es expresada mediante un monomio de orden cero; es decir, una constante. En la práctica, la presencia de tendencias regionales en la variable principal se puede tratar interpolando en vecindarios locales. Para cada vecindario se calcula una media de la variable principal. En un nuevo vecindario, la media puede variar.
123
Para la generación de los mapas de tabla de agua en el presente estudio se ha hecho tres ejercicios de interpolación: uno con un vecindario global, otro con un vecindario muy local (número máximo de puntos a considerar = 5) y otro escenario intermedio (número máximo de puntos a considerar = 15). Las superficies generadas con el vecindario más local a veces son muy erráticas (ver, por ejemplo, el mapa de la derecha de la figura 25). Este comportamiento parece estar asociado a la mala distribución de los puntos de observación. Cuando todos los puntos de observación más cercanos al punto donde se desea hacer la interpolación están a un solo lado, lo que se hace en realidad es extrapolar. Una consecuencia directa de ello es que las incertidumbres de los valores estimados son mayores, y eso es muy evidente en los mapas de varianzas de kriging, como el mostrado en la figura 26 (mapa de la derecha).
Journel y Rossi (1989) indican que, para un modelo de variograma residual dado y una configuración de datos correspondiente a una situación de interpolación, donde la ubicación a estimar está rodeada de datos en todos los lados y está dentro del rango de correlación de datos, OK y UK ofrecen casi idénticas estimaciones. Sólo cuando los puntos a interpolar están por fuera del polígono conformado por los puntos de observación vecinos, las estimaciones pueden diferir marcadamente, dependiendo del método de abordaje de las tendencias regionales de la variable principal. Este aspecto se ve claramente en las superficies freáticas generadas para la cuenca Carminales. Los tres mapas presentados en la figura 44 difieren entre sí, especialmente al sur en donde no existen puntos de observación.
4.3.3. Síntesis de los resultados obtenidos Comparación entre conjunto de datos2 Teniendo en cuenta las limitaciones mencionadas al final del numeral 4.3.1, a continuación se mencionan los rasgos más llamativos percibidos con los índices de error en los tres sets de datos preparados para La Dorada. 2
Esta comparación aplica únicamente al estudio de caso de La Dorada porque en Carminales no hubo datos de manantiales y no fue posible diferenciar niveles estáticos y dinámicos.
124
Kriging Ordinario (OK) Los valores de ME son más cercanos a cero a medida que el número de registros aumenta; es decir, no importa si se incluyen manantiales o si se mezclan lecturas de niveles estáticos con dinámicos, en cualquier caso, ME mejora con el aumento de datos. En cambio, los peores errores se observan en el conjunto que incluye niveles estáticos medidos únicamente en aljibes y pozos (set de 102 registros). Un comportamiento contrario se observa con el indicador MAE, ya que sus valores son sustancialmente menores en el set con 102 registros. La inclusión de los manantiales (set de 146 registros) parece incrementar la magnitud de este error. El indicador MSE2 no es muy útil en el presente trabajo ya que su valor (casi siempre muy cercano al cero) es similar en los tres conjuntos de datos.
El indicador RMSE se comporta de forma parecida al error MAE: los menores errores están asociados al set de datos que incluye niveles estáticos medidos únicamente en aljibes y pozos (set de 102 registros). En los otros dos conjuntos, la magnitud de RMSE es similar entre sí. El error ASE es levemente inferior en el set de 191 registros, y levemente mayor en el conjunto de datos de niveles estáticos, incluyendo manantiales (set de 146 registros). En todos los casos, ASE fue mayor que RMSE, lo cual sugiere que en términos generales los modelos sobreestiman la variable interpolada. Sin embargo, esta tendencia está condicionada por un efecto de escala, como se aprecia en las gráficas (a), (f) y (g) de la figura 20. Respecto al indicador RMSSE, en el set de 191 registros el valor siempre es mayor que uno, pero en los otros dos conjuntos oscila alrededor de dicho valor. El mejor promedio se observó para el conjunto de 146 registros. Para el índice D, los mejores valores corresponden al conjunto de 102 registros y los peores al set de 191 registros, aunque en realidad todos no estuvieron muy alejados de uno (1).
Kriging Universal (UK) Los valores de ME son más cercanos a cero para el conjunto de 191 registros, pero a diferencia de OK, los errores más grandes se observan en el conjunto de 146 registros.
125 De otro lado, el comportamiento de MAE, MSE2, RMSE, ASE, RMSSE y D es similar al mostrado por OK.
Kriging con Deriva Externa (KED) En general, los errores calculados para los variogramas asociados con la herramienta KED fueron los mejores respecto a las otras dos herramientas de interpolación involucradas en esta comparación. Los errores ME fueron menores para el set de 146 registros, seguidos muy de cerca por los valores obtenidos para el set de 102 registros. Para el set completo, los errores fueron los más grandes. Este comportamiento es contrario a lo observado en las otras dos herramientas. El índice MAE mejora a medida que el número de registros disminuye; es decir, los errores más pequeños (promedio 2.5 metros) corresponden al set de 102 registros, mientras que los mayores (promedio 3.0 metros) son los del set de 191 registros. Al igual que con OK y UK, el índice MSE2 fue muy similar en los tres conjuntos, estando levemente más alejado del cero en el set de 191 registros.
El comportamiento del índice RMSE fue: set191 > set146 > set102, mientras que el comportamiento de ASE fue: set146 > set191 > set102. Siempre ASE > RMSE. Respecto al índice RMSSE, la tendencia en el set de 102 registros fue obtener valores por encima de uno. En los otros dos conjuntos, este índice osciló alrededor de dicho valor. El valor del índice D fue casi idéntico en los tres conjuntos, siempre muy cercano a uno (1).
Las mejores superficies interpoladas
La Dorada Por cada una de las cuatro herramientas kriging se ha seleccionado una superficie interpolada. Las figuras 54, 55 y 56 presentan en su orden las superficies freáticas, los mapas de desviación estándar y las zonas potenciales de descarga y recarga de aguas subterráneas.
OK y UK generan superficies sencillas (dos primeros mapas de la figura 54), en general con flujos de agua subterránea con sentido suroeste → noreste. Los rangos del nivel
126 freático, dentro del área de estudio, son similares en ambos mapas (146 a 222 msnm para OK, y 142 a 231 msnm para UK).
Figura 54. Mejores tablas de agua interpoladas, La Dorada.
KED genera una superficie que es casi una réplica exacta de la topografía. Eso da lugar a un patrón de flujo del agua subterránea complejo. CK sugiere la existencia de dos picos en la tabla de agua, uno al norte y otro al sur, y una depresión al noreste el cual implicaría un cambio en el sentido del flujo del agua subterránea en una zona del límite noreste. Los gradientes piezométricos sugeridos por esta superficie son los más altos.
127 La figura 55 muestra las incertidumbres asociadas con las superficies freáticas interpoladas. En esta ocasión, en vez de representar las varianzas kriging, se muestran las desviaciones estándar, las cuales están definidas en las mimas unidades que la variable de interés. UK genera el rango más estrecho en desviaciones estándar mientras que KED ostenta el rango más amplio. Como era de esperarse, las incertidumbres son más grandes en los sectores donde no existen puntos de observación.
Figura 55. Desviaciones estándar asociadas a los datos interpolados, La Dorada.
128 La figura 56 muestra los mapas con las zonas probables de descarga y recarga del agua subterránea. El mapa obtenido con KED (el tercero) parece no reflejar ningún rasgo geográfico. Los otros tres comparten algunas similitudes entre sí. Por ejemplo, se sugiere que algunos tramos de los cauces de los ríos La Miel, Magdalena, Purnio, Guarinó, y de las quebradas El Tigre, Caño Grande y en menor extensión Doña Juana, son efluentes. Esos tres mapas también sugieren que los alrededores del casco urbano de La Dorada son anegables. La Charca de Guarinocito también se observa en estos mapas, especialmente en el producido con CK. Para ubicar estos sitios se recomienda ver la figura 19.
Figura 56. Zonas potenciales de descarga y recarga de agua subterránea, La Dorada.
Estos mapas también han sido utilizados para obtener una idea sobre qué tan acorde son las superficies freáticas generadas respecto a observaciones de campo. Todos los
129 manantiales (cuadros rojos) y puntos auxiliares (estrellas magenta) son sitios de descarga de agua subterránea. Las superficies de la figura 56 tienen una resolución de 30 m x 30 m. En cada mapa, se ha contado los manantiales y puntos auxiliares que concuerdan con celdas de color negro. Esa información se muestra en la tabla 18. También se indica el número de manantiales y puntos auxiliares que quedan a no más de dos celdas de distancia de las zonas negras.
El mejor rendimiento lo ostenta el mapa generado con la herramienta CK utilizando la cota como variable auxiliar. Un 70.7% de los puntos etiquetados como manantiales y puntos auxiliares concuerdan o están muy cerca de las zonas de descarga sugeridas por CK. El peor rendimiento lo tiene la herramienta KED con sólo una coincidencia entre 58 posibilidades. Tabla 18. Conteo concordancia manantiales y puntos auxiliares con zonas de descarga de agua subterránea Caso \ Herramienta kriging
OK
UK
KED
CK-Cota
Concuerdan
14
13
0
23
A no más de 25 metros de distancia
12
14
1
18
No concordancia
32
31
57
17
% concordancia
44.8
46.6
1.7
70.7
Total
58
58
58
58
Es necesario aclarar que los manantiales (no los puntos auxiliares) fueron utilizados en la construcción de los variogramas y en todo el proceso de interpolación. Las herramientas kriging son interpoladores exactos; es decir, si un punto de la grilla de interpolación concuerda con las coordenadas de un punto de observación, la herramienta otorga a dicho punto el mismo valor del dato observado. La malla de interpolación para la Dorada se construyó con una resolución de 30 m x 30 m. Ningún nodo de la malla concuerda con la ubicación de los 191 puntos de observación. Para la generación de las superficies, cada nodo interpolado ha funcionado como el centroide de un cuadrado con lado 30 m. Por consiguiente, las celdas en las que se ubican los
130 manantiales pueden tener valores diferentes de cero cuando se aplica álgebra de mapas (cota topográfica MENOS nivel freático).
Las figuras 57, 58 y 59 muestran las superficies relacionadas con la cuenca de la quebrada Carminales. Los cuatro mapas de la figura 57 muestran grandes diferencias entre sí, especialmente en los extremos norte y sur de la cuenca. En estos dos sectores no hay puntos de observación y, por tanto, allí se hace extrapolación, no interpolación. Se puede observar que ningún mapa seleccionado ha sido construido con el set de 102 puntos que incluye algunos puntos de observación por fuera de la cuenca en los extremos norte y este del área de estudio.
Figura 57. Mejores tablas de agua interpoladas, Carminales.
131 El tercer mapa (generado con KED) de la figura 57 es el que muestra una configuración más cercana a lo esperado, ya que sugiere que los flujos de agua subterránea van en dirección al cauce de la quebrada Carminales.
La figura 58 muestra las variaciones estándar de los cuatro mapas. En el caso de CK, el rango de incertidumbres es el más restringido. Sin embargo, la tabla de agua generada por esta herramienta sugiere que al sur de la cuenca el agua subterránea fluye en sentido sur, lo cual parece no corresponder con el funcionamiento hidrológico esperado.
Figura 58. Desviaciones estándar asociadas a los datos interpolados, Carminales.
132
Figura 59. Zonas potenciales de descarga y recarga de agua subterrรกnea, Carminales.
133
5. CONCLUSIONES
Principales resultados relacionados con los datos Aunque en general los métodos kriging asumen que los datos a interpolar siguen una distribución normal, cuando ésta se aleja de esa condición, los variogramas tienden a ser más erráticos. Por tanto, a veces es necesario aplicar alguna transformación a los datos originales para que la distribución se acerque más a una normal teórica. Sin embargo, no siempre las transformaciones ofrecen los resultados esperados, como ha sucedido con los datos de la cuenca de la quebrada Carminales. En este caso, la utilización de métodos más robustos para el cálculo de los semivariogramas, como el método de Hawkins y Cressie (1984) empleado en la presente tesis, mejora ligeramente el aspecto de los variogramas experimentales. Para La Dorada, los datos de NF mostraron una distribución cercana a la normal y por consiguiente no fue necesario considerar ninguna acción al respecto. Una de las características que deben mostrar las variables secundarias cuando se emplean como ayuda para la interpolación de la variable principal es tener algún grado de correlación con esta última. Respecto a la cota, es evidente la existencia de una fuerte correlación lineal con el nivel freático en las dos áreas de estudio. Para el caso de la herramienta KED, esta fuerte correlación causa que la configuración de la tabla de agua interpolada sea casi una réplica exacta de la topografía lo que da lugar a tablas de aguas muy complejas y con una apariencia muy artificial en las dos áreas de estudio, especialmente en La Dorada. En cambio, el desempeño de la cota con la herramienta CK estuvo más acorde a la información proveída por otras herramientas de investigación sobre el funcionamiento de los dos acuíferos objeto de estudio. Respecto a la CE, en ninguna de las dos áreas de estudio se observó correlación alguna entre dicha variable y el nivel freático. El intento por generar superficies interpoladas con ayuda de la CE tuvo como propósito verificar si fuera factible obtener alguna mejora de la configuración del nivel freático fruto del azar. En las dos
134 áreas de estudio es evidente que la conductividad eléctrica no representó mejora alguna.
Conclusiones relacionadas con el análisis estructural y generación de mapas 76 variogramas experimentales y sendos variogramas teóricos para La Dorada, y 31 para Carminales, fueron generados en la presente tesis. El número y ancho de las bandas, así como la ventana de restricción para la construcción de los variogramas experimentales, se seleccionaron de tal forma que se pudiera observar una estructura
espacial
clara
para
las
semivarianzas.
Ninguna
información
hidrogeológica fue utilizada para este propósito. Por consiguiente, las decisiones tomadas en esta fase de la tesis fueron en cierta medida subjetivas. Cuando se utilizaron los datos originales para el cálculo de las semivarianzas (método OK), en general fue fácil ajustar variogramas teóricos típicos, con un rango y un sill, y en muchas ocasiones con un nugget. Cuando los variogramas experimentales se basaron en valores residuales (métodos UK y KED), el componente nugget de los variogramas ajustados aumentó en importancia, sobre todo con los variogramas calculados para el método KED, muchos de los cuales parecieron responder únicamente a un efecto de pepita puro (ausencia de correlación espacial entre los valores residuales). Respecto al método CK, los covariogramas se obtuvieron de manera fácil cuando la variable auxiliar fue la cota, mientras que en el caso de la conductividad eléctrica no fue posible obtener ningún covariograma aceptable, por razones obvias debido a la falta de correlación entre CE y NF. Además de variogramas omnidireccionales, también se calcularon variogramas direccionales, tomando en consideración cuatro direcciones (0°, 45°, 90° y 135°) con una tolerancia de ±22.5°. En general, los variogramas direccionales obtenidos fueron más erráticos que los omnidireccionales debido a la reducción drástica en el número disponible de pares de datos para el cálculo de las semivarianzas. En la presente tesis, en general la inclusión de la anisotropía no dio lugar a una gran mejora en el rendimiento de la interpolación. En la mayoría de los casos, los variogramas teóricos direccionales que mejor se ajustaron a los datos lo hicieron con una tasa de anisotropía entre 0.7 y 0.9.
135 La bondad de cada una de las cuatro herramientas de interpolación abordadas en la presente tesis se evaluó tomando en consideración dos aspectos: los índices de error estimados a partir de la validación cruzada, y la congruencia de los mapas generados respecto a información hidrogeológica obtenida por medios independientes. La herramienta KED fue la que exhibió los mejores índices de error de acuerdo con los cálculos de validación cruzada. Esta tendencia se observó en las dos áreas de estudio y con todos los conjuntos de datos utilizados. Los rendimientos mostrados por las herramientas OK y UK fueron similares entre sí, con una ligera ventaja para OK, aunque esta tendencia no fue constante en las dos áreas de estudio y tampoco con todos los conjuntos de datos. Respecto a la herramienta CK, definitivamente el rendimiento de la cota como variable auxiliar fue mucho mejor que la CE, en las dos áreas de estudio. Para el caso de La Dorada, la incorporación de los manantiales en los ejercicios de interpolación no mejoró las superficies interpoladas; de hecho, algunos de los mejores resultados se obtuvieron para el set de 102 datos; es decir, para el conjunto de datos en donde se excluyeron todos los manantiales. En cada ejercicio de interpolación se varió el vecindario de búsqueda generando así tres mapas: uno utilizando un vecindario global, y dos con número máximo de datos a considerar de 15 (escenario intermedio) y 5 (vecindario muy local). En general, la interpolación llevada a cabo con un vecindario muy local (cinco puntos) generó superficies erráticas. Se estima que la razón de ello es la fuerte desigualdad en la distribución de los datos observados en las dos áreas de estudio. Así mismo, las incertidumbres de los datos interpolados aumentaron a medida que el vecindario de búsqueda se hacía más local. La desigual distribución de los puntos de observación genera problemas cuando se desea estimar la variable de interés por fuera del polígono formado por la red de observación. El caso más crítico lo presenta la cuenca de la quebrada Carminales en donde casi todos los puntos se concentran en la parte media y media-baja de la cuenca. Hacia el sur, donde no existen pozos ni aljibes, los resultados generados por las cuatro herramientas de interpolación difirieron mucho entre sí. Respecto a las tablas de agua obtenidas para La Dorada, las herramientas OK, UK y CK-cota dan lugar a superficies sencillas, con un patrón regional del flujo de agua
136 suroeste → noreste. Los resultados con OK y UK son similares entre sí. CK sugiere la existencia de dos puntos máximos en la tabla de agua, uno al norte y otro al sur, y una depresión al noreste el cual implicaría un cambio en el sentido del flujo del agua subterránea en una zona del límite noreste. KED genera tablas con una configuración casi idéntica a la topografía. Los rangos de las desviaciones estándar de los datos interpolados son similares para las herramientas OK, UK y CK-cota (entre 5.8 y 16.7 metros), mientras que KED ostenta un rango mayor (2.6 a 34.2 metros). En general, las tablas de agua obtenidas con OK, UK y CK-cota cortan la superficie topográfica en zonas donde hay cauces de ríos o humedales. Estas tres herramientas generan mapas similares: por ejemplo, todas sugieren que los ríos La Miel, Purnio y algunos sectores de los ríos Magdalena, Guarinó y quebradas El Tigre y Doña Juana son efluentes. En cambio, los resultados con KED parecen estar divorciados de los humedales y corrientes superficiales identificados en campo. La selección del mejor mapa se ha hecho contrastando las superficies interpoladas con los manantiales y puntos auxiliares identificados por los habitantes de La Dorada. El mapa más acorde con dichos puntos de control es el obtenido con CK usando la cota como variable secundaria: el 70% de los puntos de control ha coincidido con las zonas potenciales de descarga sugeridas por la tabla de agua interpolada. Para el caso de la cuenca de la quebrada Carminales, los mejores mapas se obtuvieron con el set de 88 registros. OK y UK generan superficies similares y son las únicas que reproducen en gran medida la propiedad efluente de la quebrada Carminales. Sin embargo, ambas exageran las superficies de descarga en el sector norte (parte baja) de la cuenca. Entre estas dos herramientas, UK ofrece las menores incertidumbres y, por tal motivo, se asume como la mejor opción de acuerdo con la información disponible.
Conclusiones relacionadas con la hipótesis de trabajo y preguntas de investigación Para el caso de La Dorada, y teniendo en cuenta los datos disponibles para la presente tesis, la utilización de la información topográfica como variable auxiliar mejora la interpolación cuando se utiliza con la herramienta CK. Con KED, los errores estimados de la interpolación son menores, pero el resultado dista mucho de las
137 observaciones hidrológicas en campo. Para el caso de la cuenca de la quebrada Carminales, no se observa una mejora notable en la interpolación de la tabla de agua cuando se tiene en cuenta la cota topográfica. En el presente estudio, la evidente falta de correlación entre la conductividad eléctrica del agua y el nivel freático es la responsable de que esta variable auxiliar no sea útil en la estimación de la tabla de agua en las dos áreas de estudio. La inclusión de los manantiales en la interpolación, para el estudio de caso de La Dorada, no ha generado una mejora notable en la calidad de las superficies generadas. Por lo anterior, se concluye que sólo la información topográfica usada con la técnica co-kriging, y únicamente en el estudio de caso de La Dorada, ha mejorado notablemente la estimación de la configuración de la tabla de agua. Aunque los índices de error calculados a partir de la validación cruzada son una buena guía, no son suficientes para evaluar el rendimiento de las herramientas de interpolación kriging. Es necesario validar las superficies generadas o, por lo menos, contrastarlas con información hidrogeológica disponible.
Recomendaciones Delimitación de zonas de recarga: Las mejores superficies freáticas obtenidas en las dos áreas de estudio del presente trabajo pueden ser utilizadas por CORPOCALDAS para delimitar las principales zonas de recarga. Las evaluaciones hidrogeológicas llevadas a cabo hasta el momento en las dos zonas de interés plantean la hipótesis de trabajo de que la infiltración directa de la lluvia local es uno de los mecanismos principales de recarga de los acuíferos. Lo anterior significa que el 100% de las áreas delimitadas como “zonas de recarga potencial” en el presente trabajo (cuarto mapa de la figura 56 y segundo mapa de la figura 59) podrían de hecho contribuir a la recarga de los acuíferos. Esas áreas corresponden a más del 50% de la superficie para cada estudio de caso. Esas áreas son muy grandes en términos de imponer restricciones en el uso del suelo. Por ende, dentro de esas zonas, CORPOCALDAS podría priorizar los sectores más elevados, asumiendo una curva de nivel topográfico en cada estudio de caso como límite para esas áreas priorizadas.
138 Redes de observación: Las superficies freáticas seleccionadas también pueden servir para rediseñar las redes de observación de calidad del agua subterránea. En este tipo de redes, es recomendable seleccionar puntos de observación sobre una misma línea de flujo, con el fin de evaluar la evolución química del agua subterránea a medida que el agua subterránea avanza desde altos a bajos niveles piezométricos. A partir de las mejores superficies freáticas seleccionadas, se pueden estimar varias líneas de flujo (cada línea de flujo sigue los planos con las máximas pendientes) y sobre ellas se pueden escoger los sitios donde se podrían perforar los pozos de observación.
139
6. REFERENCIAS Aboufirassi, M., y Mariño, M.A. (1983). Kriging of water levels in the Souss aquifer, Morocco. Journal of the International Association for Mathematical Geology, 15 (4), 537–551. Ahmadi, S.H., y Sedghamiz, A. (2008). Application and evaluation of kriging and cokriging methods on groundwater depth mapping. Environmental Monitoring and Assessment, 138 (1-3), 357–368. Ahmed S., y de Marsily G. (1989) Co-Kriged Estimates of Transmissivities Using Jointly Water Level Data. In: Armstrong M. (eds) Geostatistics. Quantitative Geology and Geostatistics, vol 4. Dordrecht: Netherlands. Springer Armstrong, M. (1984). Common problems seen in variograms. Mathematical Geology, 16 (3), 305-313. Beshes, M., Delhomme, J.P. y de Marsily, G. (1975). Précision de la connaissance de la piézométrie d'un aquifère: conséquence sur le calage d'un modèle, Int. Rep. LHM/RD75/23 bis, Ecole des Mines, Fontainebleau, France. Bivand, R.S., Pebesma E., y Gómez-Rubio, V. (2013). Applied spatial data analysis with R (2nd ed.). New York, USA: Springer. Boezio, M.N.M., Costa, J.F.C.L., y Koppe, J.C. (2006). Accounting for Extensive Secondary Information to Improve Watertable Mapping. Natural Resources Research, 15 (1), 33–48. Burrough, P.A. y McDonnell, R.A. (1998). Principles of Geographical Information Systems. New York, USA: Oxford University Press. Chilès J.P., y Delfiner P. (1999). Geostatistics: modeling spatial uncertainties. Wiley Series in Probability and Statistics. Chichester, UK: Wiley. Cressie, N.A. (1993). Statistics for Spatial Data. New York, USA: John Wiley & Sons, Inc. Davis, B.M. (1987). Uses and abuses of cross-validation in geostatistics. Mathematical Geology, 19 (3), 241-248. Delbari, M. (2013). Accounting for exhaustive secondary data into the mapping of water table elevation. Arabian Journal of Geosciences, 7 (10), 4221–4233. Delhomme, J.P. (1978) Kriging in the hydrosciences. Adv Water Ressources 1 (5): 251– 266.
140 Estrada, J.J., Viana, R. y González, H. (2001). Geología de la plancha 205 Chinchiná. Escala 1:100000. Memoria explicativa. Instituto de Investigaciones e Información Geocientífica, Minero-Ambiental y Nuclear INGEOMINAS. Bogotá. Feininger, T., Barrero, D., Castro, N., Ramírez, O., Lozano, H., y Vesga, J. (1970). Mapa geológico de Colombia. Oriente de Antioquia, cuadrángulo I-9 y parte de los cuadrángulos H-9, H-10, I-10, J-9 y J-10 Planchas 132 Yolombó, 148 San Carlos, 168 Argelia (Aquitania), 188 La Dorada y 117 Amalfi. Escala 1:100000. Memoria explicativa. Instituto Colombiano de Geología y Minería INGEOMINAS. Bogotá. Gandin, L.S. (1965). Objective Analysis of Meteorological Fields, 242 pp., Israel Program for Scientific Translations, Jerusalem. GEOSUB (2009). Estudio para el ajuste del modelo hidrogeológico conceptual del acuífero de Santágueda – km 41 en los municipios de Manizales y Palestina. Contrato 233/2008. Reporte interno de CORPOCALDAS. Gotway, C.A., y Hartford, A.H. (1996). Geostatistical Methods for Incorporating Auxiliary Information in the Prediction of Spatial Variables. Journal of Agricultural, Biological, and Environmental Statistics, 1 (1), 17-39. Gundogdu, K.S., y Guney, I. (2007). Spatial analyses of groundwater levels using universal kriging. Journal of Earth System Science, 116(1), 49–55. Guekie simo, A.T., Marache, A., Lastennet, R., y Breysse, D. (2016). Geostatistical investigations for suitable mapping of the water table: the Bordeaux case (France). Hydrogeology Journal, 24 (1), 231–248. Gundogdu, K.S., y Guney, I. (2007). Spatial analyses of groundwater levels using universal kriging. Journal of Earth System Science, 116 (1), 49–5. Hawkins, D.M., y Cressie, N. (1984). Robust kriging. A proposal. Journal of the International Association for Mathematical Geology, 16(1), 3–18. Hernández-Stefanoni, J.L., y Ponce-Hernández, R. (2006). Mapping the Spatial Variability of Plant Diversity in a Tropical Forest: Comparison of Spatial Interpolation Methods. Environmental Monitoring and Assessment, 117 (1-3), 307–334. Hussain, I., Shakeel, M., Faisal, M., Soomro, Z. A., Hussain, M., y Hussain, T. (2014). Distribution of Total Dissolved Solids in Drinking Water by Means of Bayesian Kriging and Gaussian Spatial Predictive Process. Water Quality, Exposure and Health, 6 (4), 177–185. Isaaks, E. y Srivastava, R.M. (1989). An Introduction to Applied Geostatistics. New York, USA: Oxford University Press.
141 Johnston, K., Ver Hoef, J.M., Krivoruchko, K., y Lucas, N. (2001). Using ArcGIS Geostatistical Analyst. GIS by ESRI. New York USA. Journel, A.G., y Rossi, M.E. (1989). When do we need a trend model in kriging? Mathematical Geology, 21 (7), 715–739. Kambhammettu, B.V.N.P., Allena, P., y King, J.P. (2011). Application and evaluation of universal kriging for optimal contouring of groundwater levels. Journal of Earth System Science, 120 (3), 413–422. Kerry, R. y Oliver, M.A. (2007). Determining the effect of asymmetric data on the variogram. I. Underlying asymmetry. Computers y Sciences, 33, 1212-1232. Kitanidis, P.K. (1997). Introduction to geostatistics. Applications in hydrogeology. Cambridge, UK: Cambridge University Press. Le, N.D. y Zidek, J.V. (2006). Statistical Analysis of Environmental Space-Time Processes. Springer Series in Statistics. New York, USA: Springer. Li, J. y Heap, A.D. (2008). A Review of Spatial Interpolation Methods for Environmental Scientists. Record 2008/23. Camberra, Australia: Geoscience Australia. Li, J. y Heap, A.D. (2011). A review of comparative studies of spatial interpolation methods in environmental sciences: Performance and impact factors. Ecological Informatics, 6, 228-241. Li, J., y Heap, A.D. (2014). Spatial interpolation methods applied in the environmental sciences: A review. Environmental Modelling & Software, 53, 173–189. Lin, Y.-P., Tan, Y.-C., y Rouhani, S. (2001). Identifying spatial characteristics of transmissivity using simulated annealing and kriging methods. Environmental Geology, 41 (1-2), 200–208. Liu, C., Jang, C., y Liao, C. (2004). Evaluation of arsenic contamination potential using indicator kriging in the Yun-Lin aquifer (Taiwan). Science of The Total Environment, 321 (1-3), 173–188. Matheron, G. (1962). Traite de Geostatistique Appliquée, Tome I. Mémoires du Bureau de Recherches Géologiques et Minieres, No. 14. Paris, France : Editions Technip. Matheron, G. (1963). Traite de Geostatistique Appliquée, Tome II: Le Krigeage. Mémoires du Bureau de Recherches Géologiques et Minieres, No. 24. Paris, France : Editions Bureau de Recherche Géologiques et Minieres. Matheron, G. (1965). Les variables régionalisées et leur estimation: Une application de la théorie des fonctions aléatoires aux sciences de la nature. Masson, Paris.
142 Matheron, G. (1969). Le krigeage universel. Vol. 1. Cahiers du Centre de Morphologie Mathematique, Ecole des Mines de parís, Fontainebleau. Matheron, G. (1971). The theory of regionalized variables and its applications: Cahiers du Centre de Morphologie Mathematique, No. 5, Fontainebleau, France. Moukana, J.A., Asaue, H. y Koike, K. (2013). Co-kriging for modeling shallow groundwater level changes in consideration of land use/land cover pattern. Environmental Earth Sciences, 70 (4), 1495-1506. Nas, B., y Berktay, A. (2010). Groundwater quality mapping in urban groundwater using GIS. Environmental Monitoring and Assessment, 160 (1-4), 215–227. Nikroo, L., Kompani-Zare, M., Sepaskhah, A.R., y Fallah Shamsi, S.R. (2010). Groundwater depth and elevation interpolation by kriging methods in Mohr Basin of Fars province in Iran. Environmental Monitoring and Assessment, 166 (1-4), 387–407. Oliver, M.A. (2010). Geostatistical Applications for Precision Agriculture. New York, USA: Springer. Oliver, M.A., y Webster, R. (2014). A tutorial guide to geostatistics: Computing and modelling variograms and kriging. CATENA, 113, 56–69. Oliver, M.A. y Webster, R. (2015) Basic steps in geostatistics: The variogram and kriging. Switzerland: Springer. Painter, S.L., Woodbury, A.D., y Jiang, Y. (2007). Transmissivity estimation for highly heterogeneous aquifers: comparison of three methods applied to the Edwards Aquifer, Texas, USA. Hydrogeology Journal, 15 (2), 315–331. Petitgas, P., Woillez, M., Rivoirard, J., Renard, D., y Bez, N. (2017). Handbook of geostatistics in R for fisheries and marine ecology. ICES Cooperative Research Report No. 338. Copenhagen, Denmark: Emory D. Anderson. Piccini, C., Marchetti, A., Farina, R., Francaviglia, R. (2012). Application of Indicator kriging to Evaluate the Probability of Exceeding Nitrate Contamination Thresholds. International Journal of Environmental Research, 6 (4), 853-862. Pucci, A.A., y Murashige, J.A.E. (1987). Applications of Universal Kriging to an Aquifer Study in New Jersey. Ground Water, 25 (6), 672–678. Rossiter, D.G. (2018). Co-kriging with the gstat package of the R environment for statistical computing (Version 3.0). Technical note. Cornell University. Rouhani, S. (1986). Comparative Study of Ground-Water Mapping Techniques. Ground Water, 24 (2), 207–216.
143 Sophocleous, M. (1983). Groundwater observation network design for the Kansas groundwater management districts, U.S.A. Journal of Hydrology, 61 (4), 371–389. Stein, M.L. (1999). Interpolation of Spatial Data: Some Theory for Kriging. New York, USA: Springer-Verlag. Toro, L.E. (2017). Informe Parcial 2. Interpretación Información Hidrogeoquímica. Contrato 288 de 2016. Reporte interno de CORPOCALDAS. Universidad Tecnológica de Pereira (2016). Informe final monitoreo de calidad y niveles acuíferos de Caldas año 2015. Contrato 136 de 2015. Reporte interno de CORPOCALDAS, 223 pp Vargas, M.C. (2009). Desarrollo de la primera etapa del proceso de investigación planteada para las aguas subterráneas en la cuenca baja del rio Guarinó, oriente de Caldas, cuenca del río Magdalena, como parte de un esquema regional para el recurso hídrico subterráneo en el departamento. Convenio 168-2008. Reporte interno de CORPOCALDAS. Varouchakis, Ε.A., y Hristopulos, D.T. (2012). Comparison of stochastic and deterministic methods for mapping groundwater level spatial variability in sparsely monitored basins. Environmental Monitoring and Assessment, 185 (1), 1–19. Varouchakis, E.A., y Hristopulos, D.T. (2013). Improvement of groundwater level prediction in sparsely gauged basins using physical laws and local geographic features as auxiliary variables. Advances in Water Resources, 52, 34–49. Wackernagel, H. (2003). Multivariate geostatistics: an introduction with applications (3rd Ed.). Berlin, Germany: Springer-Verlag. Webster, R. (2000). Is soil variation random? Geoderma, 97 (3-4), 149–163. Webster, R. y Oliver, M.A. (2007). Geostatistics for Environmental Scientists (2nd ed.). Chichester, England: John Wiley & Sons, Ltd. Willmott, C.J. (1981). On the validation of models. Physical Geography, 2 (2), 184–194. Willmott, C.J. (1982). Some Comments on the Evaluation of Model Performance. Bulletin of the American Meteorological Society, 63 (11), 1309–1313. Yang, F., Cao, S., Liu, X., y Yang, K. (2008). Design of groundwater level monitoring network with ordinary kriging. Journal of Hydrodynamics, Ser. B, 20 (3), 339–346. Zhou, F., Guo, H.-C., Ho, Y.-S., y Wu, C.-Z. (2007). Scientometric analysis of geostatistics using multivariate methods. Scientometrics, 73 (3), 265–279.
144
ANEXO A-1: Datos de La Dorada X
Y
NF
Cota
CE
191
146
130
X
Y
NF
Cota
CE
191
146
102
130
929916
1127225
161
161
30
X
930447
1127503
181
181
80
X
X
X
927132
1119869
176
181
231
X
X
X
X
X
X
926840
1121791
164
176
231
X
930833
1128310
168
168
81
X
X
932475
1111332
167
171
94
X
X
X
X
925364
1086078
201
205
233
X
X
X
X
X
934160
1097903
167
172
234
X
X
X
X
926488
1120587
170
177
104
X
X
X
926525
1090781
198
198
104
X
X
X
927010
1082429
205
205
234
X
X
X
926978
1082414
207
207
235
X
X
936380
1122225
167
167
107
X
X
X
927428
1091125
190
195
256
X
X
X
932727
1103443
162
166
110
X
X
X
X
928859
1127286
159
170
258
X
X
X
930526
1111221
204
204
114
X
X
X
X
925372
1086100
202
202
259
X
X
932492
1102890
164
170
121
X
926219
1085386
180
188
266
X
X
X
X
930777
1088022
175
189
124
X
X
X
932174
1090135
199
199
128
X
X
X
X
933964
1094115
192
197
268
X
X
X
X
X
934092
1097177
168
175
271
X
924695
1077463
206
219
135
X
X
X
923787
1082411
272
272
136
X
924989
1083962
195
201
272
X
X
927941
1123404
165
169
273
932351
1093178
180
180
136
X
X
X
X
X
X
X
932313
1093083
189
189
273
X
X
930268
1105263
185
197
136
X
927973
1123654
172
172
137
924241
1081726
218
218
276
X
X
X
X
X
926864
1082414
197
212
277
X
X
932938
1130647
145
147
138
X
X
X
927001
1082253
203
203
278
X
X
932859
1104091
171
177
138
X
932081
1101028
154
161
282
X
X
924412
1077977
229
234
139
X
936883
1111366
155
162
287
X
928361 930719
1125987
152
160
139
X
X
X
926989
1082267
206
206
292
X
X
1111631
204
204
140
X
X
X
928148
1124220
158
160
294
X
X
929800
1103841
185
186
142
X
924814
1084084
209
209
301
X
X
929540
1104282
185
195
147
X
X
X
933918
1128187
148
148
303
X
X
927833
1122628
164
164
157
X
X
X
932191
1090126
188
191
310
X
X
X
X
936070
1117683
171
172
159
X
X
X
931113
1093848
192
195
317
X
X
X
X
932716
1115708
179
179
159
X
X
X
923741
1077478
228
235
327
X
X
X
X
932454
1102818
158
164
160
X
926903
1113811
195
197
328
X
928827
1127335
155
158
160
X
X
X
X
931081
1098260
180
180
329
X
X
X
X
932921
1104441
147
153
170
X
X
X
X
928541
1119186
176
186
330
X
X
X
X
932581
1091684
171
177
173
X
X
X
X
928916
1104812
181
181
334
X
X
929065
1119029
175
180
176
X
X
X
X
924716
1087901
201
201
341
X
X
924338
1084322
205
205
178
X
X
X
929704
1121930
161
165
352
X
X
928927
1104753
174
175
179
X
X
X
X
925910
1085102
191
199
352
X
932715
1103032
164
170
180
X
X
X
X
929565
1104299
170
181
353
X
933278
1104805
160
165
183
X
X
X
X
927772
1117032
200
200
353
X
X
932687
1103353
158
162
196
X
X
X
X
928593
1113295
181
189
354
X
X
X
X
926738
1083767
189
198
199
X
X
X
X
926551
1081968
194
205
354
X
X
X
X
927495
1120223
186
192
201
X
927075
1082519
207
207
358
X
X
934690
1117837
161
163
203
X
929516
1085802
179
190
363
X
X
X
X
936341
1109385
162
169
204
X
923625
1077492
225
233
365
X
X
X
X
926569
1080136
193
206
210
X
X
X
929809
1112822
183
197
369
X
935615
1109796
158
158
211
X
X
X
926962
1082307
214
214
373
X
932322
1099503
168
169
212
X
X
X
926250
1085317
182
190
377
X
927671
1122616
170
170
219
X
X
X
926105
1077278
188
204
380
X
928218
1116220
189
192
220
X
X
X
926625
1116038
189
194
390
X
X
X
X
932739
1103157
161
167
223
X
924748
1077542
199
212
391
X
X
X
X
927450
1119996
189
193
223
X
931233
1101110
165
173
396
X
X
102
X
X
X
X
X
X
X
X
X
X
NOTA: Coordenadas planas en MAGNA-SIRGAS-Colombia-Bogotá. NF en msnm. Cota en msnm. CE en S∙cm-1.
X X
X
X X X
X X
X
X
X X
X X X
X X X
X
X
X
X
X
145 X
Y
NF
Cota
CE
191
146
102
130
X
Y
NF
Cota
CE
191
146
102
130
931820
1101049
156
175
401
X
933628
1098611
160
164
405
X
X
X
X
926918
1111405
198
205
738
X
X
X
X
932449
1101724
165
171
748
X
X
X
936547
1113412
166
172
408
X
X
927506
1112757
192
198
758
X
928393
1125848
157
163
408
X
926770
1111510
190
199
759
X
X
X
X
926698
1111452
194
208
410
X
931120
1098253
175
181
411
X
924974
1087310
206
213
761
X
X
X
X
933558
1096185
167
173
800
X
X
X
927447
1114689
182
186
412
X
X
926870
1080310
193
198
809
X
931103
1093847
192
195
418
X
928212
1112623
187
190
429
X
929774
1103505
168
171
816
X
X
X
X
926924
1090244
196
200
820
X
X
X
932103
1114020
174
187
445
X
X
934002
1097394
169
177
858
X
933948
1095879
173
181
448
X
931289
1115533
187
190
453
X
932445
1100057
168
172
892
X
X
X
X
935795
1124106
150
160
899
X
X
X
929117
1113179
224
230
456
X
X
935054
1095197
158
161
904
X
932234
1127624
149
166
458
X
X
X
926592
1079996
187
200
459
X
X
X
X
928294
1114101
185
186
906
X
X
X
X
X
929830
1103857
177
177
937
X
X
924655
1077534
201
213
472
X
X
925588
1076687
194
194
476
X
X
X
X
932479
1101368
160
166
962
X
X
X
932137
1116280
174
176
984
936733
1114502
159
166
480
X
X
929446
1118572
171
174
1009
927693
1115591
172
180
487
X
X
X
X
X
934331
1098121
163
166
1068
X
925394
1086068
194
197
489
X
X
X
X
930257
1098215
178
183
1100
927761
1115425
181
189
494
X
928139
1087422
186
198
494
X
X
X
X
926601
1082822
186
197
X
X
X
928032
1114156
187
190
925861
1077330
206
208
495
X
X
X
X
933925
1126071
149
929418
1086320
172
186
496
X
X
X
X
935764
1124171
933751
1098620
165
169
498
X
X
X
X
935774
934031
1126225
140
146
500
X
X
X
X
932392 926154
1099908
159
162
512
X
X
X
1077289
196
202
512
X
X
X
929065
1091401
187
187
514
X
X
933966
1098968
167
171
523
929763
1082229
187
193
930081
1098178
182
927502
1115090
207
931529
1099090
930908
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
1145
X
X
X
X
1199
X
X
X
X
153
1581
X
X
X
X
162
163
1939
X
X
X
X
1124118
157
163
1989
X
X
X
X
927463
1117479
186
191
X
X
X
X
927150
1082588
197
197
X
X
X
924194
1081849
217
217
X
X
X
926520
1099048
224
224
X
X
X
928391
1124379
212
212
X
X
524
X
926643
1114290
190
190
X
X
187
525
X
X
X
928727
1113003
215
215
X
X
207
525
X
X
X
929673
1112172
243
243
X
X
162
170
540
X
X
X
932773
1115718
177
177
X
X
1107905
171
183
551
X
932004
1114629
213
213
X
X
926560
1077128
201
215
555
X
X
X
X
931043
1103245
167
167
X
X
926582
1080149
193
206
558
X
X
X
X
922398
1078575
260
260
926097
1114393
190
194
561
X
X
X
X
924485
1088387
221
221
X
X
926605
1077231
191
210
581
X
X
X
X
924375
1084190
202
202
X
X
929657
1082158
174
179
589
X
X
X
X
932011
1092813
179
179
X
X
926156
1077288
196
202
607
X
X
X
X
931533
1098942
176
183
X
X
X
928422
1114015
181
183
616
X
X
X
X
931049
1087975
177
190
X
X
X
934111
1097975
163
169
631
X
X
X
X
926522
1085247
179
187
X
X
X
926186
1078119
190
211
643
X
X
X
X
932688
1103343
161
163
227
X
X
X
X
925463
1083960
186
195
651
X
926197
1081295
192
202
398
X
931820
1092939
182
187
655
X
X
X
X
932704
1103439
159
163
224
X
934313
1095586
178
183
660
X
X
X
X
925987
1114312
195
200
398
X
X
X
X
926839
1078973
189
202
676
X
934405
1097884
167
170
694
X
931088
1102748
164
167
735
X
X
X
X
X
X
NOTA: Coordenadas planas en MAGNA-SIRGAS-Colombia-Bogotá. NF en msnm. Cota en msnm. CE en S∙cm-1.
146
ANEXO A-2: Datos de cuenca de la quebrada Carminales X
Y
NF
Cota
CE
102
88
80
X
Y
NF
Cota
CE
102
88
80
821514
1053412
1043.47
1046
26
X
X
X
822577
1053644
1037.71
1039
177
X
X
X
823674
1052733
1050.1
1052
63
X
X
X
821091
1052766
1064.5
1067
181
X
X
X
823791
1052787
1050.65
1055
69
X
X
X
821421
1056689
1067.47
1056
184
X
X
822592
1052810
1047.95
1051
74
X
X
X
821621
1053380
1046.6
1048
187
X
X
823647
1052699
1049.8
1050
87
X
X
X
822162
1054384
1038.33
1039
191
X
X
821355
1056265
1084.92
1085
91
X
X
822529
1052174
1062.22
1063
192
X
X
X
821765
1054906
1016.15
1017
92
X
X
X
822169
1054606
1036.27
1037
199
X
X
X
822439
1052868
1045.9
1049
96
X
X
X
822436
1052468
1050.8
1052
200
X
X
X
823362
1052732
1048.25
1052
97
X
X
X
821742
1054666
1025.61
1027
200
X
X
X
822065
1054528
1034.42
1036
99
X
X
X
823712
1057597
939.2
944
202
X
821510
1054426
1033.3
1034
101
X
X
X
821266
1054585
1033.47
1034
203
X
X
X
822196
1053123
1044.2
1046
102
X
X
823730
1053914
975.14
982
205
X
822547
1053478
1034.4
1039
102
X
X
821550
1053507
1042.68
1045
207
X
X
X
821328
1054140
1029.8
1035
103
X
X
822117
1054904
1037.1
1041
210
X
X
X
821421
1056566
1053.5
1069
104
X
X
821311
1054110
1032.65
1034
213
X
X
823487
1052929
1047.3
1052
106
X
X
822446
1052235
1068.2
1070
219
X
X
X
822573
1053632
1037.91
1039
110
X
X
X
823496
1053727
1016.76
1018
222
X
822792
1052866
1037.3
1038
111
X
X
X
822487
1053926
1038.41
1039
226
X
X
X
821992
1054634
1032
1032
114
X
X
X
821661
1055803
1029.04
1030
235
X
X
X
822767
1053417
1039.1
1041
119
X
X
X
822993
1057475
870.2
875
244
X
821064
1057571
1025
1025
120
X
824090
1051154
1087
1087
247
X
X
821519
1055956
1031.34
1032
121
X
X
821781
1054576
1027.92
1031
248
X
X
821452
1054228
1032.3
1040
125
X
X
821531
1055894
1028.59
1030
253
X
X
X
821815
1053500
1038.2
1044
126
X
X
822119
1054533
1037.8
1038
254
X
X
X
822069
1054188
1037.97
1041
130
X
X
822357
1052429
1053.4
1054
267
X
X
X
821816
1052761
1047.55
1050
131
X
X
822908
1052218
1054.4
1056
270
X
X
X
822380
1053733
1032.6
1036
131
X
X
X
821244
1054712
1034.7
1035
274
X
X
821096
1055958
1077.3
1079
132
X
X
X
821819
1052732
1045.59
1049
278
X
X
X
822902
1052277
1052.25
1054
136
X
X
X
824088
1051241
1087
1087
281
X
X
X
821584
1053174
1041.8
1043
137
X
X
X
822211
1054187
1033.34
1035
286
X
X
X
821487
1056428
1061.4
1062
138
X
X
X
823989
1051980
1063.3
1064
289
X
X
X
822046
1054551
1030.2
1031
139
X
X
X
823995
1051973
1061.9
1063
306
X
X
X
821356
1054357
1032.13
1033
139
X
X
X
821814
1054038
1047.54
1049
310
X
X
821773
1053665
1041
1049
139
X
X
822336
1052311
1061.6
1062
312
X
X
X
822085
1054647
1033.2
1037
142
X
X
X
821437
1052861
1049.77
1050
313
X
X
X
821715
1053724
1038
1045
145
X
X
X
820272
1057881
999.7
1000
321
X
822299
1053772
1034.72
1039
146
X
X
X
821272
1054602
1033.6
1034
330
X
X
X
821279
1054124
1034.4
1037
148
X
X
X
822786
1052775
1040.4
1041
331
X
X
X
821687
1053812
1040.6
1046
151
X
X
X
823501
1057205
901.2
903
335
X
822248
1052724
1048.4
1055
156
X
X
X
822248
1052787
1053.7
1049
340
X
X
X
821271
1054234
1027.6
1041
156
X
X
821218
1054321
1035.6
1038
379
X
X
X
821271
1054444
1037.4
1034
157
X
X
X
824019
1052728
1048.8
1056
385
X
X
X
822066
1054578
1026.8
1033
157
X
X
X
821579
1054444
1036.2
1038
419
X
X
X
820695
1057557
987.65
989
159
X
X
823495
1057301
911.6
914
435
X
820226
1057788
1002
1002
160
X
X
822385
1054149
1039.75
1043
439
X
821459
1053851
1041.14
1043
161
X
X
X
823582
1057525
942
946
544
X
822458
1052224
1068.88
1071
161
X
X
X
823082
1057436
888.6
889
545
X
821452
1053637
1035.35
1037
164
X
X
X
823586
1057528
940.35
941
598
X
821886
1054547
1032.65
1033
165
X
X
X
821190
1054706
1037.47
1041
200
X
821789
1053734
1044.4
1052
169
X
X
X
823772
1054217
963.7
970
340
X
824397
1052860
1068.18
1071
176
X
X
X
821968
1052966
1033.1
1044
290
X
X
X
X
X
NOTA: Coordenadas planas en MAGNA-SIRGAS-Colombia-Bogotá. NF en msnm. Cota en msnm. CE en S∙cm-1.
X
X
X
X
X
X X
X
X
X X
X
X
147
ANEXO B: Scripts R #-----------# # Script cálculos KED Para La Dorada. Ver abajo variantes para los otros métodos de interpolación # #-----------# LIBRERIAS Y ENTONO DE TRABAJO # Cargando las librerías requeridas library(sp) library(gstat) library(rgdal) # Ajustando el entorno de trabajo setwd("D:/LETE_Tesis_SIG") # Directorio que contiene los datos # PREPARANDO DATOS # Importando los datos ld_data <- read.delim("ld_db_102_nivel.txt") # Archivo con datos de NF y Cota. coordinates(ld_data) <- c("X", "Y") ld_grid30pto <- read.delim("ld_grid30.txt") # Malla para interpolación coordinates(ld_grid30pto) <- c("X", "Y") ldlim <- readOGR("ld_lim.shp") # Archivo shapefile con límite del área de estudio, sólo para visualizar datos y copiar proyección # Verificando la proyección de los datos proj4string(ld_data) proj4string(ld_grid30pto) proj4string(ldlim) # Asignando proyección a los objetos ld_data y ld_grid100pto (misma proyección que ldlim) proj4string(ld_data) <- CRS("+proj=tmerc +lat_0=4.596200416666666 +lon_0=-74.07750791666666 +k=1 +x_0=1000000 +y_0=1000000 +ellps=GRS80 +units=m +no_defs") proj4string(ld_grid30pto) <- CRS("+proj=tmerc +lat_0=4.596200416666666 +lon_0=-74.07750791666666 +k=1 +x_0=1000000 +y_0=1000000 +ellps=GRS80 +units=m +no_defs") # Mostrando datos plot(ldlim) plot(ld_data, add=T, pch=21, cex=0.6) #-----------# VARIOGRAMAS # Variograma Experimental vr.ld102.NF.KED <- variogram(NF ~ Cota, locations = ld_data, cutoff = 15000, width = 650) # Ajustar parámetros cutoff y width print(plot(vr.ld102.NF.KED, plot.numbers=T, main="Residuals, Cota co-variable")) # Ajustando el variograma teórico (vr.ld102.NF.KED.fit <- fit.variogram(vr.ld102.NF.KED, vgm(c("Exp", "Gau", "Sph", "Cir", "Bes", "Pen")))) # Ajuste automático print(plot(vr.ld102.NF.KED, plot.numbers=T, model=vr.ld102.NF.KED.fit, main="Residuals, Cota co-variable")) #-----------# CROSS-VALIDATION x <- krige.cv(NF ~ Cota, ld_data, vr.ld102.NF.KED.fit) write.csv(x, file = "cv_ked_102a") # El archivo generado contiene valores interpolados, varianzas y valores observados summary(x$residual) summary(x) #------------
148
# Aplicando KED KED.ld102.Co <- krige(NF ~ Cota, locations = ld_data, newdata = ld_grid30pto, model = vr.ld102.NF.KED.fit) KED.ld102.Co3 <- krige(NF ~ Cota, locations = ld_data, newdata = ld_grid30pto, model = vr.ld102.NF.KED.fit, nmax = 15) KED.ld102.Co5 <- krige(NF ~ Cota, locations = ld_data, newdata = ld_grid30pto, model = vr.ld102.NF.KED.fit, nmax = 5) # Exportando resultados writeOGR(obj = KED.ld102.Co, dsn = "Resultados", layer = "KEDld102a_al", driver = "ESRI Shapefile") writeOGR(obj = KED.ld102.Co3, dsn = "Resultados", layer = "KEDld102a_15", driver = "ESRI Shapefile") writeOGR(obj = KED.ld102.Co5, dsn = "Resultados", layer = "KEDld102a_05", driver = "ESRI Shapefile")
VARIANTES Ajustar ecuación: en vez de NF ~ Cota (sólo aplica para KED), utilizar: NF ~ 1 Para OK NF ~ X+Y Para UK Verificar que los campos de las coordenadas corresponden a X y Y, de lo contrario ajustar según caso. Ajuste variograma teórico: Existen muchas variantes para el ajuste. Se puede seleccionar un modelo en particular y ajustar manualmente algunos parámetros o dejar que gstat haga los cálculos automáticamente. En el siguiente ejemplo, se intenta ajustar un modelo tipo Esférico (Sph) y se indican valores inicales de psill (10), rango (15000) y nugget (7): (vr.ld102.NF.KED.fit <- fit.variogram(vr.ld102.NF.KED, vgm(10, model="Sph", 15000, 7))) Variogramas direccionales: ejemplo, con dirección de máxima continuidad = 135° y tasa de anisotropía = 0.9. Se generan cuatro variogramas en las direcciones 0°, 45°, 90° y 135°. En el ejemplo, se intenta ajustar un modelo de variograma tipo “Bes”. v.dir.102 <- variogram(NF ~ Cota, ld_data, cutoff = 15000, width = 650, alpha = (0:3)*45) #seleccionado v.anis.102 <- vgm(10, "Bes", 150, 0.1, anis = c(135, 0.9)) plot(v.dir.102, v.anis.102, main = "135, 0.9")
Secuencia de comandos para calcular corregionalización (aplicación de CK, con cota como variable auxiliar). # El modelo lineal corregionalización requiere que los rangos de las variables principal y secundaria sean iguales (Rossiter, 2018). # Se crea el objeto gstat conteniendo los dos sets de datos: un set con NF y el otro extendido con Cota (g <- gstat(NULL, id = "NF", form = NF ~ 1, data=ld_data)) (g <- gstat(g, id = "Cota", form = Cota ~ 1, data=ld_data_extra)) # Calcular y mostrar los dos variograms directos y el co-variograma. v.cross <- variogram(g, cutoff = 10000, width = 850) str(v.cross) plot(v.cross, pl=T) # Adicionar los modelos de variograma al objeto gstat y ajustarlos usando el modelo lineal de corregionalización (g <- gstat(g, id = "NF", model = v.ld130.NF.OK.fit, fill.all=T)) # Se ajustan simultáneamente los tres variogramas, asegurando no vilar las restricciones matemáticas (positive definite co-kriging # system) (g <- fit.lmc(v.cross, g, fit.method=6, correct.diagonal=1.01)) plot(variogram(g), model=g$model)
Para más información, consultar: Rossiter (2018), y Bivand et al. (2013).