105095

Page 1

Master Thesis ǀ Tesis de Maestría submitted within the UNIGIS MSc programme presentada para el Programa UNIGIS MSc at/en

Interfaculty Department of Geoinformatics- Z_GIS Departamento de Geomática – Z_GIS University of Salzburg ǀ Universidad de Salzburg

Comportamiento del nivel freático en el cultivo de banano (Musa Acuminata) en la provincia Guayas, Ecuador Understanding groundwater level behaviour in Banana Crop (Musa Acuminata) in Guayas Province, Ecuador’ by/por

Ingeniero Carlos Antonio Hernández García 11746451 A thesis submitted in partial fulfilment of the requirements of the degree of Master of Science– MSc Advisor ǀ Supervisor:

Anton Eitzinger PhD

Guayaquil – Ecuador, 29 de octubre del 2020


Compromiso de Ciencia Por medio del presente documento, incluyendo mi firma personal certifico y aseguro que mi tesis es completamente el resultado de mi propio trabajo. He citado todas las fuentes que he usado en mi tesis y en todos los casos he indicado su origen.

Guayaquil – Ecuador, 29 octubre 2020. ________________________________________________________________________ (Lugar y Fecha)

(Carlos Antonio Hernández García)


Dedicatoria

Dedicado a las tres mujeres importantes de mi vida: madre, esposa e hija.

Agradecimiento

Gracias al Dr. Egbert Spaans y MSc. Griselda Cortes que siempre mantuvieron la motivación y el apoyo para seguir en el crecimiento académico y profesional. Sin duda, la empresa ALIA2 S.A ha sido una plataforma para mi crecimiento profesional. A la empresa Diximant S.A por la colaboración y facilitar la información para el desarrollo de la investigación. Agradecimiento al equipo UNIGIS, docentes, tutores y supervisor de tesis. Gracias por su insistencia en la honestidad académica en la formación profesional. Gracias a Dios porque con él todo es posible.


RESUMEN La baja productividad a nivel de país, en el cultivo de banano, es alarmante. Se han identificado diferentes causas que inciden, siendo el mal drenaje uno de ellos. El primer paso para solucionar el problema es conocer el comportamiento del nivel freático. A nivel de campo se instalaron pozos de observación para monitoreo. El segundo paso es la integración del análisis espacial a las mediciones de campo. En el estudio se evaluó la capacidad de predecir valores reales del nivel freático mediante la interpolación con Kriging Ordinario, Kriging Simple, Kriging Univeral e IDW. También se evalúo el sistema de drenaje en las haciendas Catay y San Miguel, mediante el comportamiento del nivel freático, antes y después de las intervenciones realizadas. Kriging Ordinario presentó error medio (ME) de 0.18 y error cuadrado medio (RMSE) de 23.18, mediante validación cruzada, siendo menor con respecto a los otros interpoladores. En la validación, Kriging Ordinario obtuvo los valores más bajos de ME y RMSE. Las superficies de interpolación que generó Kriging Ordinario y Kriging Simple fueron similares y representan de mejor forma el comportamiento del nivel freático en campo. Kriging Universal subestimó la variabilidad en sus predicciones con una raíz cuadrada del error medio estandarizado (RMSS) mayor a 1 en todos los casos y generó superficies de interpolación con pocos cambios. IDW produjo superficie de interpolación considerando valores mínimos y máximos, generando puntos de concentración. Por tanto, Kriging Ordinario es el método que mejor predice los valores observados y se ratifica que el protocolo de decisiones para definir los parámetros en el modelo de interpolación fue acertado. Finalmente, se constató que el drenaje en las haciendas ha mejorado en el 2018 y 2019 con respecto al 2016 y 2017.

PALABRAS CLAVES: nivel freático, drenaje, validación cruzada, validación, productividad.


5

ABSTRACT The low productivity of Ecuadors’ banana crop is alarming. Different causes have been identified, one of them being poor soil-water-drainage. As an approach to solve the problem, understanding the groundwater levels in areas where banana is cultivated is crucial. Thus, for data measurements and monitoring purposes, observation wells were installed in the field. Further, spatial analysis were carried out to complement the measurements. The study evaluated the ability to predict real groundwater table values through interpolation with ordinary kriging, simple kriging, universal kriging and IDW. Also, the drainage system at the Catay and San Miguel sites were evaluated through the behavior of the groundwater table before and after the interventions carried out. Results from Ordinary Kriging showed a mean error (ME) of 0.18 and root mean square error (RMSE) of 23.18, by means of cross validation, were lower with respect to the other interpolators. In validation, Ordinary Kriging obtained the lowest ME and RMSE values. The interpolation surfaces generated by Ordinary Kriging and Simple Kriging were similar and better represented the behavior of the groundwater table in the field. Universal Kriging underestimated the variability in your predictions with root mean square standardized error (RMSS) greater than 1 in all cases and generated interpolation surfaces with little change. IDW produced interpolation surface considering minimum and maximum values, causing concentration points. Therefore, Ordinary Kriging is the method that best predicts the observed values and provides evidence that the decision protocol to define the parameters in the interpolation model was right. Finally, the study confirmed that the drainage in the two sites has improved in 2018 and 2019 compared to 2016 and 2017, respectively.

KEYWORDS: groundwater, drainage, cross validation, validation, productivity.


6

INDICE DE CONTENIDO CAPITULO I ........................................................................................................................... 13 1

INTRODUCCIÓN ........................................................................................................... 13 1.1

ANTECENDENTES .................................................................................................. 13

1.2

OBJETIVOS Y PREGUNTA DE INVESTIGACIÓN ....................................................... 14

1.2.1

Objetivo general: ........................................................................................... 14

1.2.2

Objetivos específicos: .................................................................................... 14

1.2.3

Preguntas de investigación ............................................................................ 15

1.3

HIPÓTESIS .............................................................................................................. 15

1.4

JUSTIFICACIÓN ...................................................................................................... 15

1.5

ALCANCES.............................................................................................................. 17

CAPITULO II .......................................................................................................................... 18 2

REVISIÓN DE LITERATURA ........................................................................................... 18 2.1

CARACTERÍSTICA DE MUSA ACUMINATA (A)........................................................ 18

2.2

MARCO TEÓRICO .................................................................................................. 19

2.2.1

Autocorrelación espacial ............................................................................... 20

2.2.2

Exploración de datos y selección de modelos ............................................... 21

2.2.3

Modelos de interpolación espacial ............................................................... 23

2.2.4

Interpolación IDW.......................................................................................... 24

2.2.5

Interpolación geoestadística: Kriging ............................................................ 26

2.2.6

Kriging Simple (KS) ......................................................................................... 27

2.2.7

Kriging Ordinario (KO).................................................................................... 27

2.2.8

Kriging Universal (KU) .................................................................................... 30

2.2.9

Validación cruzada ......................................................................................... 30

2.2.10 Validación ...................................................................................................... 32 2.3

MARCO METODOLÓGICO: ESTADO DEL CONOCIMIENTO ................................... 33

CAPITULO III ......................................................................................................................... 37 3

METODOLOGÍA ............................................................................................................ 37 3.1

LOCALIZACIÓN DEL ÁREA DE ESTUDIO ................................................................. 37

3.2

CRONOLOGÍA DE LAS MEDICIONES DE CAMPO ................................................... 40

3.3

DISEÑO DEL POZO DE OBSERVACIÓN ................................................................... 41

3.4

DEFINICIÓN DE INTERVALOS DE COMPARACIÓN ................................................. 41

3.5

MANEJO DE LA INFORMACIÓN ............................................................................. 42

3.6

ANÁLISIS EXPLORATIVO DE DATOS ESPACIALES ................................................... 43


7

3.6.1

Datos atípicos o Outliers ................................................................................ 43

3.6.2

Distribución de los datos ............................................................................... 44

3.7

MÉTODOS DE INTERPOLACIÓN ............................................................................. 47

3.7.1

Kriging Ordinario (KO).................................................................................... 47

3.7.2

Kriging Simple (KS) ......................................................................................... 48

3.7.3

Kriging Universal (KU) .................................................................................... 49

3.7.4

Distancia Inversa Ponderada (IDW) ............................................................... 50

3.8

VALIDACIÓN DE LOS MÉTODOS DE INTERPOLACIÓN ........................................... 50

3.8.1

Validación Cruzada ........................................................................................ 50

3.8.2

Validación ...................................................................................................... 51

3.9

JUSTIFICACIÓN DE LA METODOLOGÍA .................................................................. 54

CAPITULO IV......................................................................................................................... 55 4

RESULTADOS Y ANÁLISIS ............................................................................................. 55 4.1

RESULTADOS ......................................................................................................... 55

4.1.1

Precipitación en las haciendas ...................................................................... 55

4.1.2

Exploración de datos ..................................................................................... 56

4.1.3

Comportamiento no normal de los datos ..................................................... 59

4.1.4

Comportamiento del nivel freático ............................................................... 62

4.1.5

Comportamiento del nivel freático en Catay ................................................ 63

4.1.6

Comportamiento del nivel freático en San Miguel ....................................... 67

4.1.7

Validación cruzada ......................................................................................... 69

4.1.8

Validación cruzada: Catay y San Miguel ........................................................ 69

4.1.9

Análisis de regresión entre valores observados y estimados ....................... 72

4.1.10 Resumen estadístico: validación cruzada ...................................................... 73 4.1.11 Resumen estadístico: validación ................................................................... 74 4.2

ANÁLISIS DE RESULTADOS .................................................................................... 75

4.2.1

Comportamiento no normal de los datos ..................................................... 75

4.2.2

Comportamiento del nivel freático: Catay .................................................... 76

4.2.3

Comportamiento del nivel freático: San Miguel ........................................... 77

4.2.4

Validación de los diferentes métodos de interpolación ............................... 78

CAPITULO V.......................................................................................................................... 80 5

6

CONCLUSIONES Y RECOMENDACIONES ...................................................................... 80 5.1

CONCLUSIONES ..................................................................................................... 80

5.2

RECOMENDACIONES ............................................................................................. 81

REFERENCIAS BIBLIOGRÁFICAS.................................................................................... 83


8

INDICE DE TABLAS Tabla 1. Ocurrencia anual de valores cercanos a 180 cm en las mediciones del nivel freático en las haciendas. .................................................................................................... 62 Tabla 2. Exploración del nivel freático en la semana 12 en diferentes años. ..................... 63 Tabla 3. Exploración del nivel freático en semana 16 en la hacienda San Miguel. ............. 63 Tabla 4. Resumen estadístico de la validación cruzada de los diferentes métodos de interpolación correspondiente a semana 12 en hacienda Catay. ....................................... 73 Tabla 5. Resumen de la validación cruzada de los diferentes métodos de interpolación correspondiente a semana 13 en hacienda San Miguel. .................................................... 74 Tabla 6. Resumen estadístico para los datos de prueba utilizados en la validación en Catay. ................................................................................................................................... 74 Tabla 7. Resumen estadístico para los datos de prueba de la validación en San Miguel. .. 75


9

INDICE DE FIGURAS Figura 1. Conceptualización de la autocorrelación y la correlación espaciales. ................. 20 Figura 2. Árbol de decisión general para seleccionar el modelo de predicción espacial adecuado con base en los resultados de estimación del modelo. ...................................... 22 Figura 3. Fórmula para calcular la interpolación IDW. ....................................................... 25 Figura 4. Pasos del modelo del variograma: (a) localización de la muestra y valores medidos, (b) nube de variogramas (c) semivarianzas agregadas a lags y (d) variograma final. ..................................................................................................................................... 29 Figura 5. Esquema del funcionamiento de la validación cruzada. ...................................... 32 Figura 6. Ubicación de las haciendas Catay y San Miguel. .................................................. 37 Figura 7. Ubicación de las haciendas Catay y San Miguel en las cuales se ha monitoreo el nivel freático. ....................................................................................................................... 38 Figura 8. Ubicación de los pozos de observación del nivel freático en la hacienda Catay. 39 Figura 9. Ubicación de los pozos de observación en la hacienda San Miguel..................... 40 Figura 10. Base de datos de la hacienda Catay que contiene el nivel freático en diferentes fechas de medición. ............................................................................................................. 43 Figura 11. Ejemplo de un boxplot........................................................................................ 44 Figura 12. Prueba de normalidad gráfica correspondiente a semana 8 del 2018 en Catay. ............................................................................................................................................. 45 Figura 13. Algoritmo para la transformación de Johnson. .................................................. 46 Figura 14. Semivariograma del modelo de interpolación KO correspondiente a los datos de semana 12 del 2016 en Catay......................................................................................... 48 Figura 15. Semivariograma del modelo de interpolación KS correspondiente a los datos de semana 11 del 2017 en Catay.............................................................................................. 49 Figura 16. Semivariograma del modelo de interpolación KU correspondiente a los datos de semana 10 del 2018 en Catay......................................................................................... 50 Figura 17. Datos de entrenamiento y datos de prueba para la validación de los métodos de interpolación en la hacienda Catay. ............................................................................... 52 Figura 18. Datos de entrenamiento y datos de prueba para la validación de los métodos de interpolación en la hacienda San Miguel. ...................................................................... 53 Figura 19. Precipitación semanal en la hacienda Catay en el 2017 y 2019. ........................ 55 Figura 20. Precipitación anual en la hacienda San Miguel en el 2017 y 2019. ................... 56 Figura 21. Profundidad del nivel freático en las semanas 8 a la 12 en el 2016 y 2019 en la hacienda Catay. ................................................................................................................... 57 Figura 22. Profundidad del nivel freático en las semanas 7 a la 12 en el 2017 y 2019 en la hacienda Catay. ................................................................................................................... 58 Figura 23. Profundidad del nivel freático en las semanas 8 al 16 en el 2017 al 2019 en la hacienda San Miguel............................................................................................................ 59


10

Figura 24. Pruebas de normalidad en los datos de campo (a), datos transformados por Johnson (b) y logaritmo natural (C) correspondiente a semana 6 del 2018 en Catay. ....... 60 Figura 25. Pruebas de normalidad para los datos menores a 179 cm (a), datos transformados por Johnson (b) y logaritmo natural (C) correspondiente a semana 6 del 2018 en Catay. ..................................................................................................................... 61 Figura 26. Comportamiento del nivel freático en la semana 11 del 2015, 2017 y 2019 y semana 12 del 2016 en Catay utilizando KO. ...................................................................... 64 Figura 27. Comportamiento del nivel freático en la semana 09 del 2016, 11 del 2017 y 10 del 2018 y 2019 en Catay utilizando KO. ............................................................................. 65 Figura 28. Comportamiento del nivel freático en semana 12 en la hacienda Catay utilizando el interpolador KO. ............................................................................................. 66 Figura 29. Comportamiento del nivel freático en semana 13 en la hacienda San Miguel utilizando KO........................................................................................................................ 67 Figura 30. Comportamiento del nivel freático en la semana 16 del 2017 al 2019 en San Miguel empleando el interpolador KO. ............................................................................... 68 Figura 31. Comportamiento del nivel freático en semana 12 del 2016 en Catay utilizando cuatro métodos de interpolación. ....................................................................................... 70 Figura 32. Comportamiento del nivel freático en semana 13 del 2017 en San Miguel utilizando cuatro métodos de interpolación. ...................................................................... 71 Figura 33. Regresión lineal entre valores observados y estimados con los cuatro métodos de interpolación con datos de semana 12 del 2016 en Catay. ........................................... 72 Figura 34. Regresión lineal entre valores observados y estimados con los cuatro métodos de interpolación para los datos de semana 13 del 2017 en San Miguel............................. 73


11

LISTADO DE ABREVIATURAS AD: Prueba no paramétrica de Anderson-Darling. ASE: Promedio del Error Estándar BLUE: Mejor Estimador Lineal Insesgado (BLUE en inglés) Foc: hongo Fusarium oxysporum f. sp. Cubense, agente causal de la enfermedad más destructivas de las musáceas. IDW: Interpolador de la Distancia Inversa Pondera (IDW en inglés) KO: Kriging Ordinario KS: Kriging Simple KU: Kriging Universal LC: Land consolidation o consolidación de tierras como herramienta de desarrollo rural. LF: Test de normalidad de Kolmogorov-Smirnov con la corrección Lilliefors LPI: Interpolación Polinómica Local (LPI en inglés). ME: Error medio MS: Media estandarizada NN: Interpolador Vecino Natural (NN en inglés) OLS: Regresión lineal global Mínimos Cuadrados Ordinarios (OLS en inglés). RBF: Interpolaciones con Funciones de Base Radial (RBF en inglés). RMSE: Raíz Cuadrada del Error Cuadrado Medio RMSS: Raíz Cuadrada del error medio estandarizado SB: La distribución de la familia de Johnson con la variable limitada (B) SI: Soil index o índice de suelo o calidad del suelo. SL: La distribución de la familia de Johnson con la variable lognormal (L)


12

SU: La distribución de la familia de Johnson con la variable ilimitada (U) SW: Test de normalidad de Shapiro Wilk


13

CAPITULO I 1

INTRODUCCIÓN

1.1 ANTECENDENTES

El cultivo de banano es el segundo rubro agrícola de importancia económica para el país, solamente superado por la exportación de camarones. El cultivo se desarrolla en la costa ecuatoriana, en terrenos con topografía plana o casi plana. La producción se concentra principalmente en manos de pequeños productores, donde el 97% de ellos, tienen menos de 100 ha y el 3% concentra una superficie mayor a 100 ha (INEC, 2015). En este contexto, el área de estudio se realiza en 310 ha, de las 600 ha totales que tiene el productor con cultivo de banano. Las provincias del Guayas, Los Ríos y El Oro abarcan el 92% de los productores de banano del país. El área de estudio está ubicada en la provincia del Guayas, en la cuenca del río Guayas y específicamente al costado sur del río Bulu Bulu que conforma la subcuenca del río del mismo nombre. La cuenca del río Guayas corresponde al 13% del territorio ecuatoriano y en ella se concentran los suelos de alto potencial agrícola para los cultivos de subsistencia y de exportación, entre ellos el banano. La distribución de los totales anuales de precipitación a través de la cuenca es irregular desde 750 mm hasta 3000 mm. También, la distribución estacional es irregular con el 85% del total de la precipitación concentrándose en los primeros cuatro meses del año. Como consecuencia, todos estos factores provocan una extrema irregularidad de los caudales de los ríos causando con frecuencia inundaciones en ciudades y zonas agrícolas del sector que implican pérdidas económicas severas (Rossel, Cadier, y Gómez , 1996). A nivel macro las obras de control de inundaciones en la costa ecuatoriana, como el trasvase Bulu Bulu – Cañar, han contribuido notablemente a evitar las inundaciones en zonas críticas (Secretaria Nacional Del Agua, 2013). A nivel local, las haciendas construyen muros perimetrales de tierra y estaciones de bombeo de drenaje ubicadas en el punto más bajo de la propiedad para evitar posible inundación y controlar el nivel freático. Las


14

haciendas, en las que se realizó el estudio no están exentas de problemas de mal drenaje y desde el 2015 se han instalado pozos de observación para monitorear el comportamiento del nivel freático. También, se han realizado significativas inversiones en obras de drenaje y en estaciones de bombeo de drenaje para mejorar el drenaje de la hacienda y con ello la productividad. Desde el 2015 se instalaron 41 pozos de observación en cada hacienda. A partir del 2016 con información generada por los pozos de observación se realizaron inversiones para mejorar el drenaje. Desde el 2016 hasta el 2019 se han medido semanalmente el nivel del agua en cada pozo durante el invierno. El siguiente paso consiste en incorporar el análisis espacial de dicha información para conocer el comportamiento del nivel freático en las haciendas que han tenido problemas de mal drenaje, antes y después de las mejoras en el sistema de drenaje. Para realizar el análisis espacial de dicha información se utilizarán diferentes métodos de interpolación, tres métodos geoestadísticos como Kriging Simple, Kriging Ordinario, Kriging Universal y otro determinista como IDW (Ponderación de distancia inversa). Adicionalmente, se evaluará cuál o cuáles métodos predicen de mejor forma los valores reales del nivel freático. Finalmente, se evaluará el comportamiento del nivel freático antes y después de las mejoras en el sistema de drenaje.

1.2 OBJETIVOS Y PREGUNTA DE INVESTIGACIÓN

1.2.1 Objetivo general: Analizar el comportamiento del nivel freático en las haciendas bananeras de San Miguel y Catay, ubicadas en la provincia del Guayas, Ecuador, en el período del 2016 al 2019. 1.2.2 Objetivos específicos: o Comparar el nivel freático en dos períodos, antes y después de la intervención, del sistema de drenaje de las haciendas. o Evaluar cuatro métodos de interpolación y su capacidad de predecir los valores reales del nivel freático, mediante la validación y criterios estadísticos.


15

o Determinar el mejor método de interpolación para la variable nivel freático con base en la mejor estimación de los valores reales y facilidad de aplicación. 1.2.3 Preguntas de investigación ¿El nivel freático se encuentra más profundo, deseable para la planta, con el rediseño del sistema de drenaje en las haciendas? ¿Cuál método geoestadístico predice mejor los valores reales (observados)? ¿IDW es un interpolador, no geoestadístico, que predice de forma aceptable los valores reales?

1.3 HIPÓTESIS La metodología propuesta ayuda a determinar el método de interpolación con capacidad de estimar los valores observados (reales) del nivel freático.

1.4 JUSTIFICACIÓN

Ecuador es el primer productor mundial de banano, siendo este cultivo un rubro fundamental para la economía del país. En el 2017, la exportación bananera representó alrededor del 2% del PIB general y el 35% del PIB agrícola (Ministerio de Comercio Exterior del Ecuador, 2017). En términos de generación de empleos se estima que en el 2015 la actividad bananera generó trabajo para más de un millón de familias ecuatorianas. Por tanto, el cultivo de banano representa una actividad fundamental para la economía del país. La productividad del cultivo es un punto importante que va de la mano con la rentabilidad. A nivel de país es alarmante la baja productividad, siendo en promedio 1900 cajas/ha/año (INEC, 2015). Esto representa el 60% del rendimiento que tienen las empresas bananeras competitivas. Las causas de la baja productividad pueden ser varios factores, siendo el mal drenaje una de las principales. Según Gauggel, Sierra, y Arévalo (2003), el mal drenaje


16

causado por un nivel freático alto puede afectar el rendimiento potencial de cultivo, reduciéndolo entre 10% hasta 60%. Estudios a nivel de campo realizado por Araujo y Malan (2019), a pequeños productores de banano en la zona Naranjal, provincia del Guayas indican que más del 53% de los productores atribuyen como causa de los problemas de baja productividad en el cultivo a la falta de asesoría técnica. El 73% de los pequeños productores consideran que la capacitación al productor y personal de campo en el manejo óptimo del cultivo ayudaría a mejorar la productividad. Según el MAGAP 2013 citado por Elbehri et al., (2015) en Ecuador, el 79% de los productores bananeros son pequeños ocupando el 25% de la superficie cultivada con rendimientos promedio de 28.9 ton/ha/año, en cambio los grandes productores solamente representan el 5% y ocupan el 38% de la superficie cultivada con altos rendimientos alrededor de 57.7 ton/ha/año. De acuerdo con Cuesta (2019), Ecuador no requiere sembrar más área para incrementar el volumen exportable, sino producir más toneladas en el área cultivada. Para lograr el incremento de productividad el gobierno debería diseñar y financiar un programa de fortalecimiento de la productividad para pequeños y medianos productores destinados a renovación de plantación, mejorar el riego y drenaje, transporte interno, vías de acceso y plantas empacadoras, siendo estas las causas de la baja productividad en pequeños y medianos productores del Guayas, Los Ríos y El Oro (Cuesta, 2019). Por lo tanto, en el contexto del manejo óptimo del cultivo, el drenaje sigue siendo uno de los factores claves para mejorar la productividad. El agricultor para solucionar los problemas de mal drenaje opta por realizar una red excesiva de drenajes, más de lo necesario. Esto conlleva a generar pérdida de área productiva alrededor del 10%, ocupado por drenajes, y altos costos de mantenimiento de drenajes que superan el 9% de los costos fijos anuales (Arias y Véliz, 2018). Otro escenario, ocurre cuando el productor tiene poca cantidad de drenajes y pocos profundos, siendo insuficiente para solucionar el problema. Por ello, es importante, conocer la causa del mal drenaje para corregirlo con una red de drenajes óptima. El primer paso para dimensionar y solucionar el problema de mal drenaje es conocer el comportamiento del nivel freático. Realizar una red de pozos de observación del nivel freático y medir el nivel del agua en el pozo durante el invierno son la base para diagnosticar


17

el problema y evaluar si el sistema de drenaje actual es funcional. Por tanto, es importante abordar el estudio del nivel freático integrando las mediciones en campo y el análisis espacial para generar información precisa y detallada que permitan comprender el comportamiento de este fenómeno antes y después de la implementación del drenaje en campo. En resumen, el tema es relevante porque brinda una solución práctica a un problema poco estudiado, que tradicionalmente ha tenido planteamientos empíricos. Sin duda, beneficiará a los productores de banano que buscan el mejoramiento continuo de sus plantaciones.

1.5 ALCANCES

El estudio pretende mostrar a través de mapas generado por las interpolaciones, el comportamiento del nivel freático desde el 2016 hasta el 2019 en el área de estudio. Se evidenciarán zonas que han mejorado y posiblemente otras que se encuentran en estado crítico. Contribuyendo de esta forma a la toma de decisiones en el manejo óptimo del drenaje. Un segundo alcance del estudio es incorporar el análisis espacial a las mediciones de campo. De esta forma, incentivar el análisis geoestadístico y pensamiento crítico a variables que tradicionalmente tienen interpretaciones empíricas. Los usuarios que encontrarán utilidad en el estudio será el personal técnico de campo y el departamento de investigación de las haciendas. También, otros productores del cultivo de banano y cacao de la provincia del Guayas, que tiene en sus haciendas instalado pozos de observación, encontrarán utilidad en la interpretación visual de los mapas del nivel freático generados.


18

CAPITULO II 2

REVISIÓN DE LITERATURA

2.1 CARACTERÍSTICA DE MUSA ACUMINATA (A) La mayoría de los cultivares de plátano y banano de la familia musácea tuvieron su origen en dos especies silvestres: Musa acuminata (A) y Musa balbisiana (B) que por diploidía e hibridación generaron las variedades cultivadas actualmente (Simmonds, 1973; citado por Hoyos-Leyva et al., 2012). En el grupo acuminata se encuentran los bananos Diploide (AA) con el clon más representativo “Lady’s Finger”, en el triploide (AAA) está el Gros Michel y el subgrupo Cavendish con los clones más representativo como el “Gran Enano o Williams”, “Valery”, “Lacatan”, los tetraploides (AAAA) y (AAAB) tienen clones FHIA -2 y FHIA – 1 respectivamente (Soto, 2005). De todos los clones, Valery y Gran Enano son los que más se explotan comercialmente. El banano es una planta herbácea gigante que posee un tallo formado por un rizoma subterráneo que crece dentro del suelo, con raíces cortas. En el rizoma nacen las vainas o estipulas de las hojas que se conforman en espiral y se sobreponen unas a otras hasta formar el tronco o pseudotallo. Una vez que la planta se desarrolla totalmente aparece la bellota o flor en la parte superior. Las flores son unisexuadas y se presentan en grupo de dos hileras llamadas “manos”, cubierta por una bráctea rojiza. La inflorescencia comprende varias de estas manos de flores femeninas. Cada mano puede tener de 10 a 24 bananos y el racimo crece completamente entre 70 a 90 días de aparecer la flor (Terranova, 2001 citado por Cordero, 2016). La variedad Cavendish se convirtió en el principal sustituto para el banano Gros Michel en la década de 1950 después que los cultivos de banano Gros Michel fueron desvastados por el mal de Panamá (Fusarium oxysporum f.sp. cubense (Foc)). Actualmente, una de las cepas de Foc o linaje genético es coloquialmente conocida como raza tropical 4 (RT4) e infecta muchas variedades locales de banano, así como banano Cavendish que se exporta en grandes cantidades, los cuales son muy susceptible a esta cepa. El monocultivo mundial de banano Cavendish favorece la rápida propagación del hongo (Kema, 2015).


19

2.2 MARCO TEÓRICO La idea de la existencia de un orden espacial es un concepto clave en geografía (Mesén, 2015). En caso de que las reparticiones espaciales de las variables de interés para la geografía fueran completamente al azar, tendría que estudiar cada unidad territorial como un caso particular. Por otro lado, una repartición espacial ajustada a una función de probabilidad definida da mucho crédito a la predicción estocástica que se podría hacer desde la disciplina Geográfica o utilizando herramientas estadísticas. Cuando los fenómenos son organizados o semi-organizados y se busca describir los patrones de distribución regular, se utilizan de forma complementaria los modelos estocásticos y determinísticos. Chavasse y Seoane (1997) desarrollaron una propuesta para realizar una simulación conjunta de un modelo determinístico complejo y uno estocástico para representar los caudales en la cuenca baja del río Iguazú. La finalidad de emplear modelos para estudiar un fenómeno radica en encontrar patrones repetitivos y principios generales que expliquen esta configuración. Waldo Tobler, 1970, apoya este enfoque con lo que se conoce como la primera ley de la geografía, lo cual dice “…todo está relacionado con todo lo demás, pero las cosas que están más cerca están más relacionadas que las cosas que están más distantes” (Tobler, 1970, p.236 citado por Mesén, 2015). Por tanto, la primera ley de la geografía explica que la repartición espacial de muchos fenómenos es espacialmente organizada y susceptible de ser descrita, explicada y proyectada utilizando el método científico. El estudio de los fenómenos con correlación espacial, por medio de métodos geoestadísticos, surgió a partir de los años sesenta, especialmente, con el propósito de predecir valores de las variables en sitios no muestreados (Giraldo Henao, 2011). Según Siabato y Guzmán-Manrique (2019), entre los elementos que han aportado a la implementación y desarrollo de un conjunto de metodologías de análisis espacial resaltan: la econometría espacial, aportes de Waldo Tobler con la primera ley de la geografía y la formalización del concepto de autocorrelación espacial. Como antecedente a estos trabajos, resaltan los de Sichel (1947; 1949) y Krige (1951) citados por Giraldo Henao (2011). Sichel observó la naturaleza asimétrica de la distribución del contenido de oro en las minas surafricanas y las equiparó a una distribución de probabilidad lognormal. Esto


20

permitió una primera estimación de las reservas, bajo el supuesto de que las mediciones eran independientes, contradiciendo la experiencia que indica que existen zonas más ricas que otras. Por su parte, el geólogo G. Krige propuso una variante del método de medias móviles, el cual puede considerarse como el equivalente al Kriging simple. En los años sucesivos la teoría se fue depurando, ampliando de esta forma el campo de validez. De la minería las técnicas geoestadísticas se han aplicados a otros campos como la hidrología, física de suelos, clima y monitoreo ambiental. 2.2.1 Autocorrelación espacial Un concepto fundamental en el análisis espacial es la autocorrelación espacial. El término fue acuñado por Cliff y Ord en 1967, durante la conferencia anual de la Regional Science Association (Cliff y Ord, 1969, citado por Siabato y Guzmán-Manrique, 2019). La autocorrelación espacial se refiere al grado en que los objetos o actividades en algún lugar de la superficie de la tierra son similares a otros objetos o actividades cercanas. Este concepto puede interpretarse como un índice descriptivo que mide aspectos de la forma en que se distribuyen las cosas en el espacio, al mismo tiempo puede interpretarse como un proceso causal que mide el grado de influencia ejercida por algo sobre sus vecinos (Goodchild, 1986).

Figura 1. Conceptualización de la autocorrelación y la correlación espaciales. Fuente: Siabato y Guzmán-Manrique, 2019.


21

La Figura 1 muestra la naturaleza univariada de la autocorrelación (a) y la multivariada de la correlación (b). Esto implica que la autocorrelación espacial relaciona una variable en diferentes espacios y la correlación relaciona múltiples variables en el mismo lugar. Por tanto, aplicando los conceptos de autocorrelación espacial se pueden analizar y evaluar patrones espaciales y así como identificar la presencia de clusters espaciales. Muchas variables en el espacio se conocen con puntos de muestreos y se pretende predecir valores en zonas no muestreadas. Para realizar este tipo de análisis se parte de un principio en el que todas las cosas están relacionadas entre sí y es muy probable que los valores de puntos cercanos sean más similares entre sí, que con valores de puntos más lejanos (Burrough y McDonnell, 1998, citado por Gomariz Castillo, 2013). Cuando se predicen valores en zonas no muestreadas implica la generación de superficies continuas a partir de datos distribuido irregularmente (Caruso y Quarta, 1997). Existen una variedad de métodos que pueden realizar esta tarea, pero la dificultad radica en elegir el que mejor reproduce la superficie real. Según Li y Heap, 2008 citado por Curtarelli, Leão, Ogashawara, Lorenzzetti, y Stech (2015), indican que existen más de cuarenta métodos de interpolación descritos en la literatura, los cuales son clasificados en determinísticos, geoestadísticos y combinados. 2.2.2 Exploración de datos y selección de modelos La interpolación espacial se centra en el análisis y simulación de una muestra de datos, así como su comportamiento en el espacio e influencia en otros puntos. La pregunta que surge es ¿Cuál método de interpolación espacial es el que mejor predice? y la respuesta es que hasta ahora no hay hallazgos consistentes con respecto a cuál es el mejor método de interpolación (Curtarelli et al., 2015). Existen factores que afectan la estimación de un interpolador espacial. Por ejemplo, el tamaño de la muestra y la naturaleza de los datos. Un paso previo sugerido es la exploración de los datos. Según Gomariz Castillo (2013), el análisis de los datos implica: conocer el tipo de distribución (normal, binomial, lognormal, poisson), analizar la distribución en el espacio y analizar la correlación espacial mediante variograma. Otros elementos que se debe tener en cuenta son: el tipo de variable, la densidad y distribución espacial de los datos, tipo de superficie, estructura espacial, existencia de información secundaria y el conocimiento de los procesos que intervienen.


22

Adicionalmente, es importante especificar los objetivos de la interpolación, ya que diferentes objetivos pueden producir diferentes criterios de evaluación de la interpolación. También, cada método tiene sus ventajas e inconvenientes que dependen en gran medida de las características del conjunto de puntos (Caruso y Quarta, 1997). Como ejemplo se podría seguir el siguiente árbol de decisiones propuesto por Hengl (2009).

Figura 2. Árbol de decisión general para seleccionar el modelo de predicción espacial adecuado con base en los resultados de estimación del modelo. Fuente: Hengl (2009).


23

En la Figura 2 se presenta una propuesta general para seleccionar el modelo de predicción espacial adecuado. El primer paso es verificar si el modelo determinista ya está definido. Sino ha sido definido se puede correlacionar las variables muestreadas con los factores ambientales. Si los factores ambientales están significativamente correlacionados, se puede ajustar un modelo de regresión lineal múltiple y luego analizar los residuos para la autocorrelación espacial. En caso de que los residuos no presentan autocorrelación espacial se procede con la estimación de los Mínimos Cuadrados Ordinarios o Ordinary Least Squares (OLS) de los coeficientes de regresión. Caso contrario, es que los residuos muestren autocorrelación espacial y en este caso se puede ejecutar una regresión Kriging. Si los datos no muestran una correlación con los factores ambientales, se podría analizar el variograma de la variable objetivo. También, se puede considerar modelar la anisotropía. Si se ajusta un variograma diferente del efecto puro de nugget, entonces se puede ejecutar Kriging Ordinario. Caso contrario, si solo se ajusta un variograma lineal, entonces se puede usar algún interpolador mecánico como la interpolación de IDW. Si el variograma de la variable objetivo no muestra autocorrelación espacial, ni correlación con los factores ambientales significa que el único modelo de predicción estadístico válido es estimar una media global para toda el área. Esto podría ser frustrante porque conduce a un mapa sin sentido donde cada píxel muestra el mismo valor, debe tener en cuenta que incluso este análisis es informativo. Finalmente, ¿Cómo funciona en la práctica la selección del modelo de predicción espacial? Una opción es el gstat package de R en el cual un usuario puede cambiar fácilmente de uno a otro modelo de predicción cambiando los argumentos en la función kriging genérica. ArcGis Pro tiene una herramienta de análisis geoestadístico con diferentes tipos de interpoladores geoestadístico y determinístico. 2.2.3 Modelos de interpolación espacial La interpolación determinista puede usar interpoladores locales o globales. Los interpoladores locales usan un número limitado de puntos de datos de entrada, ya sea de cierta distancia del punto que se está interpolando o un número fijo de puntos, para aplicar la función de interpolación. Los datos de entrada utilizados para calcular cada función


24

forman una “ventana”, que se mueve a través del conjunto de datos, aplicando diferentes funciones a lo largo de los datos. Los interpoladores globales usan todos los valores de un set de datos, con los cuales estiman una sola función que es aplicable para toda el área de estudio. En comparación con los métodos locales de interpolación, los métodos globales dan lugar a superficies más suavizadas y pueden ser más sensitivos a valores atípicos (Lund University, 2004). Un ejemplo de método de interpolación global es Trend Surfaces. Este se calcula con un polinomio que cubre toda el área que se está interpolando. El polinomio usado puede variar en complejidad (orden polinomial). Por ejemplo, las superficies de tendencias pueden ser de primer orden (lineal), segundo orden (cuadrática) o tercer orden (cúbica). La interpolación IDW (Inverse Distance Weighted) es un ejemplo de método de interpolación local y Kriging es un método de interpolación geoestadístico. A continuación, se describen cada uno de los métodos. 2.2.4 Interpolación IDW Como su nombre lo indica, la distancia a los puntos conocidos es el factor principal de la interpolación. Se supone que cuando más cercano está el punto estimado a un punto conocido, más fuerte será la influencia de ese punto conocido (Lund University, 2004). El usuario tiene la posibilidad de seleccionar la “influencia” de la distancia.


25

Figura 3. Fórmula para calcular la interpolación IDW. Fuente: Lund University (2004). Durante la interpolación, la importancia de los puntos de datos conocidos está determinado por la distancia a esos puntos. Cuanto menor sea la distancia a los puntos de datos conocidos, más fuerte será la influencia de ese punto. Está es la razón por la que en la fórmula matemática se utiliza el inverso de la distancia (1/d), ya que la “influencia” de la distancia será un número “grande” para distancias cercanas y un número “pequeño” para distancias largas (Figura 3). El “peso” de la distancia se determina con la constante k. Por tanto, cuando más grande es k, mayor es la importancia de la distancia en el algoritmo de interpolación. Por lo tanto, la autocorrelación disminuye con el incremento de la distancia de acuerdo con una función de ponderación (Gomariz Castillo, 2013). Según Musashi, Pramoedyo, y Fitriani (2018), la interpolación IDW tiene la debilidad que no se puede predecir el valor por encima del máximo y por debajo del mínimo de los puntos de la muestra, enmascarando picos que podría existir en la realidad, conocido como efecto bull’s eye. Para evitar estos problemas se recomienda que la muestra de puntos sea lo suficientemente densa. Otro problema con este método es el efecto edge effect o extrapolación y para evitar la extrapolación es necesario tener puntos de datos conocidos que cubran un área más grande que el área de interés (Lund University, 2004). Como ventajas es un método sencillo, directo, estable y rápido. Según Musashi et al. (2018), la ventaja de IDW consiste en que las características de la interpolación se pueden controlar,


26

limitando los puntos de entrada en el proceso de interpolación. Cualquier entrada que tenga pequeñas o ninguna correlación espacial puede eliminarse del método de cálculo. 2.2.5 Interpolación geoestadística: Kriging Kriging es un método geoestadístico para interpolación de puntos. Su nombre deriva de D.G. Krige, quién introduce el uso de la media móvil para evitar los errores sistemáticos en la interpolación (Caruso y Quarta, 1997). La interpolación geoestadística difiere de la interpolación determinista en que asume que los puntos de datos de origen son una muestra estadística especifica o realización de una función real de la superficie subyacente. Por lo tanto, esta muestra debe analizarse primero para crear un modelo adecuado que proporcione la mejor estimación posible de esta superficie adyacente (Smith, Goodchild, y Longley , 2018). Burrough y McDonnell (1998, 2015) citados por Smith et al. (2018), describen a la interpolación Kriging como un proceso de múltiples etapas que se basa en el cálculo y modelo del variograma experimental. Como proceso central de la interpolación, los autores mencionan las siguientes etapas: o Examinar los datos para normalidad y tendencias. Transforme cuando sea necesario, teniendo en cuenta que Kriging solo requiere normalidad para crear intervalos de confianza. Cualquiera que sea la distribución de datos, Kriging proporcionará un mejor predictor imparcial de valores en puntos no muestreados. o Calcular el variograma experimental y ajustar un modelo adecuado. Si el valor de nugget es muy alto, entonces la interpolación no es sensible. o Verificar el modelo mediante validación cruzada o mediante la inclusión de un archivo de validación separado. Por ejemplo, mediciones adicionales no incluidas en el proceso de modelado. Es importante examinar los resultados de la validación para el tamaño y signo de las desviaciones y cualquier patrón inesperado, como sesgo espacial o picos. o Decidir si aplicar Kriging o simulación condicional. La simulación condicional se usa cada vez más, pero no se admite en muchos paquetes estadísticos. Es importante diferenciar que Kriging es efectivamente un interpolador de suavizado, mientras que la simulación condicional no lo es.


27

o Si usa Kriging entonces use el modelo de variograma para interpolar sitios en una cuadricula regular donde los sitios tienen el mismo tamaño que la muestra original. o Presentar los resultados como mapas de celdas de cuadrículas o contornos, individualmente o sobre otras capas de datos. Tanto las predicciones como la desviación estándar de las predicciones deben calcularse y mapearse en la mayoría de los casos. Si los errores aleatorios tienen distribución normal y satisfacen condiciones de estacionariedad, entonces se pueden producir mapas de probabilidad, cuantiles o confianza. 2.2.6 Kriging Simple (KS) Kriging simple es el método más sencillo y parte de la hipótesis que la aleatoriedad de la función, estacionariedad y la media de la función aleatoria es conocida y constante. Kriging simple es conocido como el método de medias conocidas y constante (Marko y Alamri, 2014). 2.2.7 Kriging Ordinario (KO) Una versión estándar de Kriging es llamada Kriging Ordinario (KO), conocido también como BLUE que son las siglas de best linear unbiased estimator (Caruso y Quarta, 1997). BLUE significa el mejor estimador lineal no sesgado. Es mejor ya que trata de minimizar la varianza del error para cada valor estimado. Es lineal ya que usa combinaciones ponderadas de los valores conocidos. Es no sesgado porque trata de que los valores estimados no sean sobreestimados, ni subestimados siendo las medias imparciales (Marko y Alamri, 2014). KO parte del supuesto que la media es desconocida y constante a través del área de estudio. Las predicciones se basan en el supuesto del siguiente modelo (Hengl, 2009):

Donde µ es una función estacionara constante (medias globales) y έ(s) es la parte estocástica espacial correlacionada de la variación. Las predicciones se realizan con el siguiente modelo:


28

Donde λ0 es el vector de los “pesos” de Kriging (wἰ), z es el vector de n observaciones en ubicaciones primarias. En cierto modo, kriging puede apreciarse como una sofisticación del método IDW. El problema clave de IDW es determinar cuanta importancia debe asignarse a cada vecino. Pensando intuitivamente, debería existir una manera de estimar el “peso” de forma objetiva. De modo que los pesos reflejen la verdadera estructura de la autocorrelación espacial. La novedad que Matheron (1962) y sus colegas citado por Hengl (2009), introdujeron en el análisis de datos de puntos es la derivación y el trazado de las llamadas semivarianzas.

Donde z(sἰ) es el valor de la variable objetivo en alguna ubicación muestreada y z (sἰ + h) es el valor del vecino a la distancia sἰ + h. Se puede suponer que hay n observaciones de puntos, esto produce n * (n-1)/2 pares para los que se puede calcular la semivarianza. Luego se trazan todas las semivarianzas en función de sus distancias de separación, lo cual producirá una nube de variogramas (Figura 4b). Dichas nubes no son fáciles de describir visualmente, por lo que los valores generalmente se promedian para una distancia estándar llamada lag. Si se muestran dichos datos promediados se obtiene un variograma estándar experimental o de muestra (Figura 4c). Usualmente se espera que las semivarianzas son más pequeñas a una distancia más corta y luego se estabilizan a cierta distancia dentro de la extensión del área de estudio. Esto puede interpretarse de la siguiente manera: los valores de una variable objetivo son más similares a una distancia más corta, hasta una cierta distancia donde las diferencias entre los pares son más o menos iguales a la varianza global.


29

Figura 4. Pasos del modelo del variograma: (a) localización de la muestra y valores medidos, (b) nube de variogramas (c) semivarianzas agregadas a lags y (d) variograma final. Fuente: Hengl (2009). Una vez calculado el variograma experimental, se puede ajustarlo usando alguno de los modelos de variograma autorizados, tales como lineal, exponencial, gaussiana y similares (Isaaks y Srivastava, 1989; Goovaerts, 1997; citado por Hengl (2009).Los variogramas son ajustados comúnmente mediante la estimación iterativa de mínimos cuadrados ponderados, donde los pesos se determinan en función del número de pares de puntos o con base en la distancia. Mas comúnmente, los pesos son determinado usando N j/h2j, donde Nj es el número de pares en un cierto lag y hj es la distancia (Figura 4d). Esto significa que el algoritmo dará más importancia a las semivarianzas con un gran número de pares de puntos y a distancias más cortas. La Figura 4d muestra el resultado del ajuste automático del variograma, dado un variograma experimental y usando el Nj/h2j . En este caso se obtuvo un modelo exponencial con un parámetro nugget = 0, still = 0.74 y el range = 449


30

m. Este como un ejemplo. Una vez estimado el modelo del variograma se puede usarlo para derivar semivarianzas en todas las ubicaciones y resolver los “pesos” de Kriging. 2.2.8 Kriging Universal (KU) KU también llamado Kriging con una tendencia es un procedimiento que utiliza un modelo de regresión como parte del proceso kriging. Usualmente, modela los valores medios locales desconocidos como teniendo una tendencia local lineal o cuadrático (Smith et al., 2018). KU excluye el supuesto de que la media tiene que ser constante y permite detectar tendencias espaciales. KU es considerado un buen estimador de valores locales. 2.2.9 Validación cruzada El objetivo de la validación cruzada es evaluar y comparar los métodos de interpolación y obtener una estimación del error cometido por el modelo (Gomariz Castillo, 2013). La mejor interpolación es la que minimiza el error de predicción en un punto desconocido. Desafortunadamente, no se tiene conocimiento del valor real en los puntos no muestreados. Por lo tanto, la idea es simular esta situación. Se considera cada punto de datos y se ejecuta la interpolación y el valor interpolado para este punto se compara con el valor real. Este procedimiento se denomina validación cruzada o crossvalidation. De esta forma se tienen dos conjuntos de datos: los valores medidos y los calculados (Caruso y Quarta, 1997). Según Hengl (2009), la verdadera calidad de un mapa de interpolación se puede evaluar comparando los valores estimados con observaciones reales en puntos de validación. Para este caso, dos medidas son usualmente las más relevantes: ME (error de la media) y RMSE (mínimo error cuadrático medio). De acuerdo con Gomariz Castillo (2013), el RMSE se calcula con la siguiente expresión:


31

Emery (2013) afirma que la validación cruzada es presentada usualmente bajo la forma de pruebas gráficas, como: o La nube de correlación entre los valores de los datos y los valores estimados. o El histograma de los errores estandarizados. o La nube de correlación entre los errores estandarizados y los valores estimados. o El mapa de ubicación de los datos, donde se localiza los datos “mal” estimados. Es decir, aquellos cuyos errores estandarizados salen del intervalo [-α, α]. También sugiere satisfacer en lo mejor posible los siguientes criterios estadísticos: o Las medias de los errores y de los errores estandarizados miden el sesgo del estimador y deben ser cercanas a cero. Para Kriging este criterio es secundario pues los valores obtenidos por Kriging son insesgados por construcción, de tal forma que la media de errores tenderá hacia cero. o La varianza de los errores que mide la precisión del estimador debe ser mínima. o La varianza de los errores estandarizados debe ser cercana a 1. o El coeficiente de correlación entre los valores estimados y los valores de los datos debe ser lo más cercano posible a 1. o El número de datos mal estimados debe ser el menor posible. Este número se considera satisfactorio si representa menos del 5% del total de los datos. En cierto sentido, la validación cruzada “engaña” un poco al utilizar todos los datos para estimar los modelos de tendencia y autocorrelación. Elimina cada ubicación de datos de uno en uno y predice el valor de datos asociados. Por ejemplo, en la Figura 5 se muestran 10 puntos. La validación cruzada omite un punto (punto rojo) y calcula el valor en esta ubicación utilizando los 9 puntos restantes (puntos azules). Este procedimiento se repite para un segundo punto y así sucesivamente. Se comparan los valores estimados y medidos en la ubicación del punto omitido.


32

Figura 5. Esquema del funcionamiento de la validación cruzada. Fuente: Esri (2019). El último paso en la validación cruzada es la generación de un resumen estadístico que contiene la siguiente información (Esri, 2019): o Promedio de los ME: Es el promedio de los errores de validación cruzada. Es una medida de sesgo. Si el modelo no está desviado el valor debe ser cercano a cero. o Raíz cuadrada del RMSE: mide cuanto se aproximan de media los valores estimados a los valores medidos. Cuanto menor es el valor, más preciso son las predicciones. o Una versión estandarizada del error medio (MS): Un valor cercano a cero indica que el modelo no está sesgado. o Una versión estandarizada del cuadrático medio (RMSS): Este valor cuantifica la fiabilidad de los errores estándar de la predicción. Este valor debe ser próximo a 1 y una desviación importante de uno, indica que los errores estándar de la predicción no son precisos. o Promedio de los errores estándares (ASE): Este valor debe ser próximo al RMSE. Si este valor se desvía considerablemente del RMSE, significa que es posible que los errores estándar no sean precisos. 2.2.10 Validación Una técnica de validación es el jack-knife, el cual no considera una reposición de los datos. Este método divide a los datos en dos grupos y se estiman los datos de un grupo a partir de los datos del otro grupo (Emery, 2013).La validación primero elimina parte de los datos, conjunto de datos de prueba, y luego usa el resto de los datos, conjunto de datos de entrenamiento, para desarrollar los modelos de tendencia y autocorrelación que se


33

utilizaran para la predicción (Esri, 2019). El resumen estadístico utilizado para comparar las predicciones con los valores medidos es similar tanto para la validación como para la validación cruzada. La validación crea un modelo solo para un subconjunto de datos, datos de entrenamiento, por lo que no verifica directamente el modelo final que debe incluir todos los datos disponibles (Esri, 2019). Más bien, la validación verifica si un protocolo de decisiones es válido. Por ejemplo, la elección del modelo de variograma o la vecindad de búsqueda. Por ende, si el protocolo de decisión funciona para la validación, se podría sentir cómodo, que también funcione para todo el conjunto de datos.

2.3 MARCO METODOLÓGICO: ESTADO DEL CONOCIMIENTO

En geografía y ciencias ambientales, normalmente se utilizan interpoladores y métodos geoestadísticos para modelar superficies continuas a partir de datos puntuales (GutiérrezHernández, Cámara-Artigas, Senciales-González, y García, 2015). En la literatura existen muchos trabajos de investigación publicados que compararon el rendimiento de dos o más métodos de interpolación en diversos campos de investigación como climatología, estudios ambientales, oceanografía, entre otros (Samira, Ahmed, y Lhoussaine, 2014). En la Agricultura, específicamente en la edafología, se realizaron estudios para erosión de suelos, salinidad y fertilidad de suelos. Sin embargo, los resultados de comparar métodos de interpolación espacial no han sido concordantes. En algunos trabajos publicados, el método estocástico geoestadístico Kriging se encontró mejor que el método determinista IDW, mientras que otros investigadores encontraron que esto no era cierto (Samira et al., 2014). Por lo tanto, la pregunta sobre qué método es el más apropiado para condiciones específicas aún no se ha resuelto. En el campo de hidrología Gutiérrez-Hernández et al. (2015), utilizaron el IDW, Kriging Ordinario y Co-Kriging Ordinario para predecir la superficie freática en zonas del ecotono del Parque Nacional de Doñana mediante datos piezométricos. En este estudio los autores concluyeron que cuando los datos son escasos e irregularmente repartidos conviene


34

decantarse por métodos geoestadísticos, ya que ofrecen más información sobre la exactitud y la incertidumbre en la predicción. Además, cuando es posible incorporar variables secundarias correlacionadas y bien muestreadas, el Co-Kriging mejora el desempeño de Kriging. Por otro lado Curtarelli et al. (2015), evaluaron diferentes métodos de interpolación espacial para mapear la batimetría de un reservorio hidroeléctrico del Amazonas para ayudar en la toma de decisiones del manejo de agua. Los autores concluyen que, para este caso del reservorio de la Amazonía, el método Kriging Ordinario (KO) mostró el más bajo RMSE (0.92 m o 0.86% de rango) y el más alto coeficiente de correlación (0.997) comparado con IDW, Interpolación Polinómica Local (LPI) e Interpolación con Funciones de Base Radial (RBF). Posiblemente se debe a que las muestras de profundidad están irregularmente espaciadas, donde el método KO es el más adecuado. Por lo tanto, la elección de que método utilizar podría guiarse por el diseño de la muestra. Las técnicas de interpolación se utilizan a menudo para analizar el flujo de agua subterránea y la distribución de parámetros físicos y químicos. Estudios realizados por Jie, Hanting, Hui, Jianhua, y Xuedi (2013), sobre la distribución espacial del agua subterránea mediante la evaluación de tres parámetros: nivel, salinidad y nitratos, concluyeron que cuando los datos tienen alta correlación espacial, entonces el método Kriging es confiable. Caso contrario, el método IDW es más adecuado para los datos con correlación espacial débil y se centra en los valores de las ubicaciones vecinas con una distancia especial, mientras Kriging hace énfasis en toda la tendencia. Los métodos de interpolación también se usan para conocer el comportamiento de variables climáticas. Musashi et al. (2018), compararon los métodos de interpolación IDW y Natural Neighbor (NN) con la variable temperatura del aire en la ciudad de Malang, Indonesia. Los resultados de la comparación RMSE muestran que es mejor utilizar el método IDW que el método NN, ya que los valores de RMSE (1.2292) en IDW son menores comparado con el RMSE (1.6273) del método NN. En la Edafología, más específicamente en la fertilidad del suelo Samira et al. (2014), realizaron estudios sobre la evaluación y comparación del rendimiento de tres métodos de interpolación espacial (IDW, KO y Spline) utilizando el criterio estadístico de RMSE para la validación cruzada y luego generar un conjunto de mapas precisos de la fertilidad del suelo


35

como pH, materia orgánica, fósfofo y potasio en 45 000 ha al noroeste de Marruecos. Según los resultados del estudio realizado, KO, usando modelos exponenciales o esféricos, es más preciso para predecir los patrones espaciales de las cuatro propiedades de suelos (pH, materia orgánica, fósforo y Potasio) comparado con los métodos IDW y Spline. Por su parte Déleg (2018), determinó la variabilidad espacial de las propiedades físicas de suelos en parcelas experimentales utilizando para ello dos métodos de interpolación: KO y IDW. En este caso, los resultados indicaron que el método KO presentó mayores valores de eficiencia de predicción, aunque para ciertas variables la diferencia no fue muy amplia. También se han utilizado los métodos de interpolación para el estudio de la variabilidad espacial de la profundidad de suelo. Se toman muestras de la profundidad de suelo a ciertos intervalos y se estiman los valores en los lugares no muestreados. Estudios realizados por Frolla, Zilio, y Kruger (2015), en el cual compararón la habilidad predictiva de dos métodos usuales de interpolación IDW y KO para estimar la profundidad de suelos en sitios no muestreados y elaborar un mapa de profundidad de suelo para manejo por ambientes. Los autores concluyeron que los interpoladores no presentaron diferencias marcadas en su exactitud. Por lo tanto, por su simplicidad relativa y una ligera tendencia a lograr mejores valores en los estadísticos utilizados se sugirió el uso IDW. Para la promoción de la agriculura sostenible se utiliza la consolidación de la tierra (LC) como herramienta para mejorar la eficiencia del procesamiento del área agrícola y la promoción del desarrollo rural (Uyan, 2018). Para lograr el proceso de reasignación después de LC es muy importante determinar un índice de suelo (SI) para cada una de las parcelas agrícolas para el éxito de los proyectos de LC. El SI está compuesto por la siguiente fórmula: Topsoil (perfil, edad, variación, erosion) + Textura del topsoil + Pendiente + Perfil de suelo (drenaje, salinidad, pH, toxicidad y erosión). Hoy en día, los métodos de interpolación se aplican ampliamente en los procesos de mapeo para estimar el SI en sitios no muestreados. Uyan comparó tres métodos de interpolación IDW, KO y Funciones de RBF para estimar el SI para un proyecto LC de 2700 ha en Karaman, Turquía. Según Uyan (2018), los métodos KO y RBF fueron más precisos con respecto al método IDW de acuerdo con el RMSE para validación cruzada. Por lo tanto, el SI estimado por RBF y KO fueron similares y más precisos comparado con SI estimado por IDW.


36

En la agronomía, las herramientas de interpolación son utilizadas en menor grado con respecto a otras ciencias. En el tema del manejo de agua relacionado al drenaje Mérida y Vaquero (2004), utilizaron el programa Surfer para mostrar el comportamiento del nivel freático en una hacienda de banano del trópico húmedo de Costa Rica. En el 2012, Román, evaluó la respuesta espacial de la productividad al nivel freático de la finca El Paso en el cultivo de banano basado en el uso del sistema de información geográfico (Román, 2012). Según el autor, la herramienta de interpolación IDW bajo los criterios descritos en la metodología, genera adecuadamente los mapas de altimetría, isobatas e isohipsas, necesarios para analizar la variabilidad espacio temporal de los datos recolectados en cada pozo de observación del nivel freático. Los métodos de interpolación IDW y Kriging son los más comunes y ampliamente utilizado en diferentes campos de estudio. La respuesta sobre cuál método predice de forma más precisa una variable no es consistente para todas las variables y condiciones de estudio.


37

CAPITULO III 3

METODOLOGÍA

3.1 LOCALIZACIÓN DEL ÁREA DE ESTUDIO El monitoreo del nivel freático se llevó a cabo en las haciendas Catay y San Miguel, las cuales se localizan en la planicie aluvial de la costa ecuatoriana, en la provincia del Guayas. Las haciendas se ubican al oeste de Guayaquil y al este de la cordillera (Figura 6).

Figura 6. Ubicación de las haciendas Catay y San Miguel. Fuente: Esri (2009).


38

Catay está ubicada en la latitud 2º16’20.63” S y longitud 79º33’27.23” O y la hacienda San Miguel se ubica en la latitud 2º25’54.16’’ S y longitud 79º26’33.15” O. La Figura 7 muestra la ubicación de las haciendas en la planicie de la costa.

Figura 7. Ubicación de las haciendas Catay y San Miguel en las cuales se ha monitoreo el nivel freático. Fuente: Google Earth Pro (2019). La cordillera de los Andes se ubica al este y el río Guayas al oeste de las haciendas. Numerosos ríos y esteros naturales conducen el agua de la cordillera a través de la planicie hasta llegar al río Guayas para desembocar finalmente en el océano Pacifico. A partir del 2015, se inició a medir el nivel freático a través de pozos de observación que se instalaron por toda la propiedad con una densidad de 1 pozo por cada 3.5 ha, siendo 41 pozos en total en San Miguel y 47 en Catay. También se instalaron pluviómetros en cada hacienda para medir la precipitación. El objetivo fue conocer el comportamiento del nivel freático para diagnosticar y solucionar el problema del mal drenaje en las haciendas. Una vez realizado las obras de drenaje se continúa el monitoreo del nivel freático para evaluar la red de drenaje existente. La ubicación de los pozos de observación en cada hacienda se presenta en las Figuras 8 y 9. La hacienda Catay limita al Norte con el Rio Bulu Bulu y Oeste con el canal para el control de inundaciones del proyecto Bulu Bulu – Cañar. La hacienda San Miguel está rodeada por


39

cultivos de caña azúcar y banano, pasando por la propiedad en dirección de Este hacia el Oeste el río Ruidoso con caudal todo el año.

Figura 8. Ubicación de los pozos de observación del nivel freático en la hacienda Catay.


40

Figura 9. Ubicación de los pozos de observación en la hacienda San Miguel.

3.2 CRONOLOGÍA DE LAS MEDICIONES DE CAMPO Las lecturas del nivel freático en los pozos de observación se realizaron en la época de invierno, desde semana 1 hasta semana 20, correspondiente a los meses de enero a mayo. El 60% de la precipitación anual ocurre entre la semana 9 hasta la 14, siendo el período crítico para el drenaje en las haciendas. Para las mediciones del nivel freático se tomaron en cuenta los siguientes criterios:


41

o El lunes a las 6:00 am se toma la lectura de la profundidad del nivel freático desde el borde del tubo del pozo. o Cuando llueve más de 100 mm, se realiza una lectura adicional 24 horas después de la lluvia en todos los pozos. o En los pozos que se encontró el nivel freático menos de 80 cm de la superficie se continúa monitoreando todos los días hasta que el nivel freático es mayor a 80 cm de profundidad. o Una vez finalizada la medición en campo, se ingresa la información en una hoja de Excel para elaborar los mapas del comportamiento del nivel freático. o Finalmente, el estudio del comportamiento del nivel freático mediante los cuatro métodos de interpolación se realizó en las semanas comprendidas entre la 10 hasta la 16, siendo este el período crítico.

3.3 DISEÑO DEL POZO DE OBSERVACIÓN Los pozos de observación tienen una profundidad de 180 cm y diámetro de 5 cm. El pozo tiene un tubo PVC de 210 cm de longitud con perforaciones cada 10 cm a lo largo del tubo para permitir el ingreso del agua. Una vez colocado el tubo en el centro del pozo, se rellena el espacio entre el pozo y el tubo con grava para evitar la entrada de sedimentos. En la superficie sobresalen 30 cm de tubo, los cuales se restan de la medición realizada. En la parte superior del tubo se coloca una tapa enroscada. Cada pozo tiene su identificación numérica secuencial.

3.4 DEFINICIÓN DE INTERVALOS DE COMPARACIÓN En la elaboración de los mapas de interpolación del nivel freático se utilizó una simbología definida por intervalos manuales con base en cuatro categorías. Nivel freático problemático ≤ 60 cm y representado por el color rojo, marginal de 61 – 100 cm siendo de color amarillo, adecuado de 101 – 140 cm indicando áreas de color celeste y profundo de 140 – 180 cm de color azul intenso. El objetivo de utilizar esta categoría para todos los


42

mapas y años se debe a que se requiere comparar el comportamiento del nivel freático en diferentes tiempos. Las cuatro categorías establecidas se basan en el criterio fisiológico de la planta de banano, más no a un criterio estadístico. Estudios realizados por Araya (2003), indican que alrededor del 95% al 100% del sistema radical del banano se encuentra en los primeros 100 cm de profundidad y el 90% se concentra en los primeros 60 cm. Por tanto, se necesita diagnosticar el problema del nivel freático en profundidades que se relacionen con el sistema radicular de la planta.

3.5 MANEJO DE LA INFORMACIÓN El análisis exploratorio de los datos se realizó en el programa RStudio, el cual es un entorno y lenguaje de programación con un enfoque al análisis estadístico y espacial. Los mapas generados por los cuatro métodos de interpolación, validación cruzada y validación mediante un subconjunto de datos se realizaron utilizando la extensión de Geoestadística Análisis de ArcGIS Pro. La información del nivel freático se almacenó en una base de datos que contiene el número de pozo, la ubicación en el lote, las coordenadas X, Y en unidad de medida UTM 17S y la profundidad del nivel freático en la semana y año respectivo. Por ejemplo, S8_16, indica el nivel del agua en la semana 8 del 2016 (Figura 10).


43

Figura 10. Base de datos de la hacienda Catay que contiene el nivel freático en diferentes fechas de medición.

3.6 ANÁLISIS EXPLORATIVO DE DATOS ESPACIALES Se realizó un análisis explorativo de los datos para tener una primera compresión del tipo de datos espaciales que está manejando. El análisis explorativo consistió en identificar datos atípicos en el conjunto de datos y determinar si los datos tienen o no una distribución normal. Para realizar el análisis explorativo se utilizaron las herramientas de análisis estadístico, tales como: Box plot, diagrama Q, Q, Shapiro-Wilk (SW) test y Lilliefors (LF) test. 3.6.1 Datos atípicos o Outliers El primer análisis realizado fue encontrar datos atípicos o Outliers. Según Samira et al. (2014), los datos atípicos deben eliminarse si se cree que no pertenecen a la población, ya que pueden alterar el análisis. Se utilizó el método gráfico conocido como diagrama de cajas o box plot para la búsqueda de datos atípicos en los datos semanales de cada hacienda en los diferentes años de medición. Se eliminaron los datos de nivel freático con valor mayor a 180 cm, ya que no pertenecen a la población.


44

El box plot utiliza el concepto de cuartil de un conjunto de datos. Consiste en una “caja” que representa el 50% de los datos (Figura 11). El límite superior de la caja será el cuartil 75 que se extiende hasta el valor máximo y el límite inferior de la caja sería el final del cuartil 25 ya que el mismo comienza desde el valor mínimo. La línea que aparece dentro de la caja representa la mediana y cuando hay valores atípicos aparecen como puntos afuera de la caja.

Figura 11. Ejemplo de un boxplot. Fuente: Cabrera (2016). También el diagrama de cajas permitió comparar visualmente cómo se comporta la profundidad del nivel freático en los diferentes años. 3.6.2 Distribución de los datos El análisis geoestadístico, como muchos procedimientos estadísticos, suponen que la distribución de los datos es normal (Samira et al., 2014). Existen diferentes procedimientos para evaluar si la variable se distribuye de forma normal. Una es el método gráfico a través de histogramas y diagramas QQ y el método numérico como las pruebas de normalidad de Shapiro-Wilk (SW) test, Kolmogorov-Smirnov (KS) test, Lilliefors (LF) test y AndersonDarling (AD) test (Razali y Wah, 2011).


45

El diagrama QQ y las pruebas de normalidad SW y LF fueron los métodos utilizados para verificar la normalidad de los datos. El diagrama de QQ plot grafica una recta que representa la distribución normal y unos puntos que representan la distribución de los datos medidos (Figura 12). Mientras más alejados estén los puntos de la recta, menos siguen una distribución normal. Se realizó un diagrama QQ plot para los datos semanales de los pozos de observación en las dos haciendas, siendo 47 datos para Catay y 41 datos para San Miguel.

Figura 12. Prueba de normalidad gráfica correspondiente a semana 8 del 2018 en Catay. Las pruebas inferenciales de normalidad de SW y LF se emplearon para determinar el valor de probabilidad. Un valor de P>0.05 indica la normalidad de los datos (Parada, 2019; Samira et al., 2014; Yañez-Vazquez, Samano-Abonce, Santos-Olvera, y Ruiz-Barcenas, 2018). Por ende, valores menores a 0.05 indican que la variable presenta una distribución no normal. Se utilizaron las pruebas SW y LF porque son pruebas potentes para todos los tipos de distribución y tamaño de muestra, siendo SW la mejor (Razali y Wah, 2011). Es importante mencionar que estas pruebas no funcionan bien para muestras pequeñas, menor a 30 datos. Una vez revelada la no normalidad de los datos se realizaron transformaciones logarítmicas ln(x), siendo una de las más ampliamente utilizadas en el campo científico (Samira et al.,


46

2014). También se utilizó la transformación de Jonhson el cual selecciona de manera óptima una de las tres familias de distribución para transformar los datos a fin de que sigan una distribución normal (yañez-vazquez et al., 2018). La transformación de Jonhson generó los siguientes resultados: datos transformados, la función utilizada en la transformación con variable limitada (SB), variable lognormal (SL) o variable ilimitada (SU), el valor de probabilidad, los valores de lamda (λ), épsilon (ε), eta (η), gamma (γ) de las variables en la función de transformación (Figura 13). Según Fernández (2015), la variable transformada a menudo tiene un buen ajuste a la distribución normal.

Figura 13. Algoritmo para la transformación de Johnson. Fuente: Minitab (2020). Una vez realizada las transformaciones tanto logarítmica como de Johnson, se procedió a realizar las pruebas de normalidad para los valores transformados. Se realizó la prueba gráfica de QQ plot y pruebas numéricas de SW y LF. Finalmente, el análisis de interpolación se realizó con los datos sin transformar. Las transformaciones logarítmicas y de Johnson no generaron un comportamiento normal de los datos y los valores de probabilidad de SW y LF fueron similares a los datos primarios.


47

3.7 MÉTODOS DE INTERPOLACIÓN Los análisis de interpolación empleados fueron: IDW, KO, KS y KU. IDW es un método determinístico y Kriging son métodos geoestadísticos. 3.7.1 Kriging Ordinario (KO) En KO se realiza el análisis de interpolación con datos sin transformación. Seguidamente, se elabora el variograma y los parámetros que permiten optimizar el modelo. En la Figura 14 se observa el Semivariograma correspondiente a los datos de semana 12 del 2016 en Catay. Los puntos de color rojo representan los bins, correspondiente a los pares de puntos agrupados en función de su distancia y dirección. Los puntos color azul representa la media de los pares de puntos o bins. La línea continua representa el modelo del Semivariograma. El modelo seleccionado es esférico y tiene un nugget con valor de 493, sill de 1551 y rango de 2400, distancia en la cual el variograma se aplana. Otro parámetro del modelo es el vecindario o radio de búsqueda, el cual se estableció con 19 vecinos, con máximo 5 y mínimo 2 vecinos por sector. Se seleccionó el modelo esférico porque es el que mejor se ajusta a los datos en el modelo del Semivariograma. Fue un criterio visual y no un parámetro matemático o estadístico. Los valores de nugget, sill y rango se originan del modelo del Semivariograma. En la selección de los parámetros del vecindario de búsqueda se utilizaron los valores máximos y mínimos por defecto que indica el modelo y se seleccionó la mayor cantidad de vecinos que genera el sector. La literatura no es concordante sobre la selección de estos parámetros. Algunos autores indican que si los datos no muestran tendencia en dirección norte – sur y este – oeste, se podría utilizar un solo sector. En cambio, otros indican que se debería trabajar con la cantidad máxima de vecinos que genera un sector y corroborar las decisiones tomadas con los resultados de la validación del método.


48

Figura 14. Semivariograma del modelo de interpolación KO correspondiente a los datos de semana 12 del 2016 en Catay. 3.7.2 Kriging Simple (KS) En Kriging Simple se realiza el análisis con datos sin transformación. KS puede usar Semivariograma o covarianza y para el caso del estudio se utiliza Semivariograma. En la Figura 15 se observa el Semivariograma y los parámetros del modelo para los datos correspondiente a semana 11 del 2017 en Catay. El modelo seleccionado es esférico con un nugget de 0, Sill de 568 y rango de 658 y el radio de búsqueda para estimar el lugar de predicción fue de 18 vecinos, con máximo 5 y mínimo 2 por sector. Los criterios para la selección del modelo esférico y el vecindario de búsqueda fueron similares a los establecidos en KO.


49

Figura 15. Semivariograma del modelo de interpolación KS correspondiente a los datos de semana 11 del 2017 en Catay. 3.7.3 Kriging Universal (KU) En KU se llevó a cabo utilizando datos sin transformaciones. KU presupone que existe una tendencia de invalidación de los datos y que esta se puede modelar mediante una función determinística polinómica (Esri, 2019). La modelación de la tendencia se realizó con LPI, utilizando solamente los puntos que están dentro del vecindario con valor mínimo de 10 y máximo 1000. La función Kernel utilizada es de tipo exponencial. El siguiente paso, fue elaborar el Semivariograma con nugget de 50, rango de 427 y con Sill de 50, ya que el Sill parcial es de cero (Figura 16). El vecindario de búsqueda para estimar el lugar de predicción de 16 vecinos con máximo de 5 y mínimo de 2 por sector. Se utilizó la función LPI porque es la función que se ajusta utilizando puntos solamente dentro del vecindario de búsqueda. Los valores mínimos y máximo se definen por defecto al utilizar dicha función. Para la selección del modelo esférico del Semivariograma y el vecindario de búsqueda se aplicaron los criterios establecidos en KO.


50

Figura 16. Semivariograma del modelo de interpolación KU correspondiente a los datos de semana 10 del 2018 en Catay.

3.7.4 Distancia Inversa Ponderada (IDW) IDW es un método de interpolación determinístico exacto, en el cual existen pocas decisiones a tomar para definir los parámetros del modelo. El parámetro que más influye es la potencia siendo un número real positivo y su valor predeterminado es 2. El parámetro potencia utilizado estuvo en el rango de 1.8 hasta 4 en el análisis de interpolación para las diferentes semanas. Un valor de potencia alto puede poner énfasis en los puntos más cercanos, caso contrario cuando se especifica un valor más bajo, los puntos circundantes adquirirán más influencia que los que están más lejos. No existe una forma de determinar que un valor de potencia es demasiado grande, como guía general una potencia de 30 es extremadamente grande y su uso sería cuestionable (Esri, 2019). Finalmente, se trabajó con un radio de búsqueda de 15 vecinos, con valor máximo de 15 y mínimo 10 en un sector.

3.8 VALIDACIÓN DE LOS MÉTODOS DE INTERPOLACIÓN

3.8.1 Validación Cruzada Se realizó la validación cruzada para los cuatro métodos de interpolación. Para los métodos geoestadísticos Kriging se obtuvo un resumen estadístico que contiene: promedio de los ME, la RMSE, el MS, el RMSS y el ASE. Para el IDW se generó un resumen estadístico que


51

solamente contiene ME y RMSE. En cambio, la validación cruzada para los métodos Kriging contiene un resumen estadístico con más información. La validación cruzada generó un reporte que contiene los valores estimados y los valores medidos. Con esta información se realiza un análisis de regresión lineal de los valores observados y los valores estimados. Se graficó una línea de tendencia, la ecuación y el coeficiente de determinación R2 para cada expresión. Se comparó el R2 entre los cuatro métodos de interpolación para cada semana de medición del nivel freático. Se busca un R2 lo más cercano a 1, mientras mayor el R2 mejor es el ajuste de los datos al modelo. Finalmente, se realiza una evaluación visual de los mapas de interpolación generados por los cuatro métodos de interpolación. Los mapas se elaboraron en una misma escala 1:5500, igual simbología y categorías para fines de comparación. 3.8.2 Validación El primer paso en la validación consistió en la elaboración de un subconjunto de datos, que corresponde a los datos de entrenamiento del modelo. El tamaño del subconjunto de datos por defecto es del 50% del total. En el caso se utiliza el 80% y se deja el 20% para los datos de prueba (Figuras 17 y 18). Con el 80% de los datos se procede a realizar los diferentes métodos de interpolación utilizando los parámetros definidos para cada modelo. La validación se realizó con los datos de prueba y la capa geoestadística generada por la interpolación de los datos de entrenamiento. Finalmente, se generó un resumen estadístico que contiene: el promedio de los ME, la RMSE, el MS y el ASE. Con todos estos parámetros estadístico se evaluó que tan acertado fue el protocolo de decisiones para desarrollar los diferentes modelos de interpolación.


52

Figura 17. Datos de entrenamiento y datos de prueba para la validación de los métodos de interpolación en la hacienda Catay.


53

Figura 18. Datos de entrenamiento y datos de prueba para la validación de los métodos de interpolación en la hacienda San Miguel.


54

3.9 JUSTIFICACIÓN DE LA METODOLOGÍA La metodología utilizada planteó un procedimiento para estudiar el comportamiento del nivel freático en diferentes años en las haciendas. Este procedimiento, tiene tres componentes principales: la exploración de los datos, el modelo de interpolación y la validación del modelo. La exploración de los datos es un paso importante porque permitió tener una primera compresión de los datos que se está analizando y ayudó a tomar decisiones en los parámetros del modelo de interpolación. Los modelos de interpolación evaluados fueron tres modelos geoestadísticos Kriging y un modelo determinístico (IDW). La razón de utilizar métodos geoestadísticos se debe a que tienen una particularidad, lo cual predice un valor en un punto desconocido y también evalúa el error de la predicción. Por otro lado, IDW es un interpolador local, exacto y es el más utilizado en la literatura con respecto a otros métodos determinista. El tercer componente es la validación de los modelos, que permite evaluar que tan acertadas fueron las decisiones tomadas en los diferentes parámetros del modelo de interpolación. Por lo tanto, se utilizó está metodología debido a que contiene procedimientos sistemáticos para llegar a conclusiones sobre el comportamiento de un fenómeno en condiciones específicas. La pregunta sobre qué método de interpolación es el más apropiado para condiciones específicas aún no se ha resuelto. Los resultados de comparar métodos de interpolación espacial no han sido concordantes en las diferentes publicaciones (Samira et al., 2014). La metodología desarrollada no responde a la pregunta sobre cual método es el más apropiado para estudiar el comportamiento del nivel freático en general, más bien responde a condiciones específicas locales. Adicionalmente, la metodología desarrollada permitió evaluar que tan acertado fue el protocolo de decisiones utilizado en el desarrollo de los modelos de interpolación. En síntesis, la metodología utilizada permitió generar conocimiento válido, práctico y confiable sobre el uso de métodos de interpolación para estudiar el comportamiento del nivel freático en las haciendas.


55

CAPITULO IV 4

RESULTADOS Y ANÁLISIS

4.1 RESULTADOS 4.1.1 Precipitación en las haciendas En las Figuras 19 y 20 se presenta la precipitación anual distribuida por semana en las haciendas Catay y San Miguel, correspondiente a los años 2017 y 2019. La precipitación histórica en los últimos 10 años en la zona donde se ubica la hacienda Catay fue de 1430 mm. El 54% de la precipitación anual ocurre en 6 semanas aproximadamente, siendo el período de semana 9 hasta semana 14.

Figura 19. Precipitación semanal en la hacienda Catay en el 2017 y 2019. En la hacienda San Miguel en 7 semanas ocurre el 53% de la precipitación anual, siendo este período de semana 9 hasta 15. En la zona donde se ubica la hacienda llueve más comparada con Catay.


56

Figura 20. Precipitación anual en la hacienda San Miguel en el 2017 y 2019.

4.1.2 Exploración de datos Las Figuras 21 y 22 muestran la presencia de datos atípicos en las semanas 8 y 9 del 2016, semanas 7 y 11 del 2017 y semanas 7, 8 y 12 del 2019 en la hacienda Catay. Se excluyeron del análisis de interpolación solamente los datos mayores a 180 cm de profundidad, el cual lo encuentra en semana 8 del 2016 en Catay, ya que los pozos de observación tienen una profundidad no mayor a 180 cm. Según Samira et al. (2014), los datos atípicos deben eliminarse si se cree que no pertenecen a la población. En este caso los datos atípicos que se encuentran fuera del diagrama de “caja”, en la parte inferior del primer cuartil pertenecen a la población y por tanto no se eliminan.


57

Figura 21. Profundidad del nivel freático en las semanas 8 a la 12 en el 2016 y 2019 en la hacienda Catay. En las Figuras 21 y 22 se observa que el nivel freático se encuentra más cercano a la superficie en el 2016 y 2017 comparado con el 2019. El primer y segundo cuartil y la mediana son menores en el 2016 y 2017 con respecto al 2019. Si los valores son menores indica que el nivel freático está más cerca de la superficie. Por lo tanto, existe una evidencia de las mejoras en el drenaje del suelo en el 2019 con respecto al 2016 y 2017, dado por un nivel freático más profundo en el 2019.


58

Figura 22. Profundidad del nivel freático en las semanas 7 a la 12 en el 2017 y 2019 en la hacienda Catay. En la Figura 23 se observan datos atípicos en semana 15 y 16 del 2019 en San Miguel. Dichos datos no fueron eliminados porque pertenecen a la población. En San Miguel, los pozos de observación tienen una profundad de 200 cm, por lo cual un dato atípico sería un valor superior a la profundidad. Por lo tanto, en San Miguel no se eliminaron datos atípicos y se trabajó con el 100% de los datos. También se observa que el primer y segundo cuartil y la mediana son menores en el 2017 con respecto al 2018 y 2019. Sin embargo, los cambios no son tan evidentes como si ocurre en Catay.


59

Figura 23. Profundidad del nivel freático en las semanas 8 al 16 en el 2017 al 2019 en la hacienda San Miguel.

4.1.3 Comportamiento no normal de los datos En la Figura 24 se observan las pruebas de normalidad gráfica y numérica de los datos primarios y de los datos con transformación. Los puntos representan los datos y la línea de color rojo el comportamiento normal teórico. El P-value representa el valor de probabilidad de las pruebas de SW y LF para aceptar o rechazar la hipótesis nula que indica que una muestra proviene de una distribución normal. Los datos de la profundidad del nivel freático tienen un comportamiento no normal. En la Figura 24 se observa que los puntos no siguen la tendencia de línea color rojo y se aprecian puntos alejados de la línea. Mientras, las pruebas de normalidad numéricas de SW y LF tienen un valor de probabilidad bajo, menor a 0.05. Por lo tanto, los datos y sus respectivas transformaciones no muestran un comportamiento normal. Por esta razón, el análisis de interpolación se realizó con los datos sin transformar, ya que dichas transformaciones no generaron un comportamiento normal de los datos.


60

Figura 24. Pruebas de normalidad en los datos de campo (a), datos transformados por Johnson (b) y logaritmo natural (C) correspondiente a semana 6 del 2018 en Catay. Las pruebas de normalidad y la transformación de los datos se realizaron a todos los datos correspondiente a las semanas del 8 al 16 de los años 2016 al 2019 en Catay y 2017 al 2019 en San Miguel. La causa de la no normalidad de los datos se debe a la presencia de valores repetitivos en cada semana, con valor mayor a 179 cm de profundidad. Esto corresponde a la lectura donde no se encontró el nivel freático en el pozo de observación. Por ende, valores de 180 cm no implica que el nivel freático se encontraba a esa profundidad, más bien estaba más allá de este valor. El nivel freático es un flujo continuo, cuya variación en profundidad está influenciado por muchos factores. Por ende, con mediciones hasta 180 cm de profundidad se está imponiendo un límite a una variable continua, siendo una limitante para el conjunto de datos. En la Figura 25 se observan las pruebas de normalidad gráfica y teóricas excluyendo todos los datos mayores a 179 cm de profundidad. Los datos analizados corresponden al 46% de la población, excluyéndose el 54%. Los datos tienen un comportamiento normal según la


61

prueba de SW y los puntos se acercan a la línea recta de distribución normal teórica. Los valores transformados con Johnson tienen un comportamiento normal con buen ajuste de los puntos a la línea y valores altos de probabilidad para SW y LF. Por lo tanto, los datos de nivel freático con valor menor a 179 cm tienen un comportamiento normal.

Figura 25. Pruebas de normalidad para los datos menores a 179 cm (a), datos transformados por Johnson (b) y logaritmo natural (C) correspondiente a semana 6 del 2018 en Catay. En la Tabla 1 se presenta la ocurrencia de los datos mayores a 179 cm en los diferentes años. En Catay, entre el 23% - 48% de los datos influencian el comportamiento no normal de los datos. En San Miguel, los valores son bajos en el 2017 y 2018 y alta ocurrencia en el 2019.


62

Tabla 1. Ocurrencia anual de valores cercanos a 180 cm en las mediciones del nivel freático en las haciendas.

Año 2016 2017 2018 2019

Catay San Miguel Datos > 179 cm 23% 30% 7% 45% 2% 48% 32%

Los modelos de interpolación se realizaron con el 100% de los datos. Se procedió de esta manera porque los datos mayores a 179 cm son una parte significativa en el área de estudio y si se los excluyen se obtendría una cuadrícula con pocos datos y con desuniforme distribución. También es importante, desde el punto de vista práctico elaborar un modelo de interpolación que incluye los valores de nivel freático mayores a 179 cm para evaluar la funcionalidad del drenaje en las haciendas. El comportamiento no normal de los datos da la pauta para mejorar la metodología de campo. Esto implica incrementar, tanto la cantidad de pozos de observación por área, como la profundidad de medición. 4.1.4 Comportamiento del nivel freático En la Tabla 2 se presenta una exploración general de los datos del nivel freático en semana 12 en diferentes años. La semana 12 es un período lluvioso con fuerte influencia en el nivel freático de los suelos. En el 2015 en semana 12, todos los pozos de observación tenían un nivel freático menor a 158 cm, lo cual evidencia un nivel freático poco profundo. Esto indica que los drenajes no están controlando el nivel del agua en la hacienda. En el 2016 en la misma semana, se encuentra que el 25% de los pozos de observación tienen un nivel freático igual o menor a 88 cm, siendo el mínimo 51 cm. Esto evidencia un problema crítico de mal drenaje en algunos sectores de la hacienda. El panorama mejora principalmente en los años 2018 y 2019 en los cuales el 25% de los pozos tienen nivel freático igual o menor a 154 cm y mínimo 106 y 80 cm respectivamente.


63

Tabla 2. Exploración del nivel freático en la semana 12 en diferentes años. Valores Mínimo 1st Quartil Mediana Media 3rd Quartil Máximo

Catay - Semana 12 2015

2016

2017

2018

2019

92 130 146 137 151 158

51 88 105 111 132 180

74 132 152 148 180 182

106 154 171 165 181 189

80 154 169 163 181 189

En la Tabla 3 se presenta una exploración de los datos del nivel freático en semana 16 en los años 2017 al 2019 en la hacienda San Miguel. Los años 2017 y 2018 han sido críticos en condiciones de drenaje, ya que el 25% de los pozos tienen nivel freático igual o menor a 115 cm y 94 cm respectivamente. En el 2019 se evidencian mejoras en las condiciones de drenaje de los suelos, ya que el nivel freático se encuentra a una profundidad mínima de 90 cm y el 25% de los pozos tienen nivel freático a una profundidad igual o menor a 171 cm. Tabla 3. Exploración del nivel freático en semana 16 en la hacienda San Miguel. Valores Mínimo 1st Quartil Mediana Media 3rd Quartil Máximo

San Miguel - Semana 16 2017 68 115 132 134 157 204

2018 59 94 114 120 148 171

2019 90 171 180 168 181 184

4.1.5 Comportamiento del nivel freático en Catay Las Figuras 26, 27 y 28 presentan el comportamiento del nivel freático en diferentes semanas en cuatro años de medición en la hacienda Catay. El método utilizado fue KO. El color rojo representa el nivel freático problemático donde la zona radicular está saturada con agua, el color amarillo es marginal, el color celeste es adecuado y el color azul intenso es profundo e ideal para el cultivo. Por lo tanto, se observa zonas en el 2015, 2016 y 2017 marginales, las cuales mejoraron para el 2018 y 2019.


64

Figura 26. Comportamiento del nivel freático en la semana 11 del 2015, 2017 y 2019 y semana 12 del 2016 en Catay utilizando KO.


65

Figura 27. Comportamiento del nivel freático en la semana 09 del 2016, 11 del 2017 y 10 del 2018 y 2019 en Catay utilizando KO.


66

Figura 28. Comportamiento del nivel freático en semana 12 en la hacienda Catay utilizando el interpolador KO.


67

4.1.6 Comportamiento del nivel freático en San Miguel Las Figuras 29 y 30 representa el comportamiento del nivel freático en las semanas 13 y 16 del 2017 al 2019 en la hacienda San Miguel. Se aprecian zonas marginales (61 – 100) en el 2017, las cuales mejoraron y pasaron a adecuados (101 – 140) en el 2018 y profundo (141 – 180) en el 2019.

Figura 29. Comportamiento del nivel freático en semana 13 en la hacienda San Miguel utilizando KO.


68

Figura 30. Comportamiento del nivel freático en la semana 16 del 2017 al 2019 en San Miguel empleando el interpolador KO.


69

4.1.7 Validación cruzada En la validación cruzada se compara el valor estimado con el valor observado para obtener información útil sobre los modelos de interpolación utilizados. Se comparó visualmente los mapas generados con los diferentes métodos de interpolación, se evaluó el R2 de la regresión lineal entre valores observados y estimados. Finalmente, se comparan indicadores estadísticos que resultan de la validación cruzada. 4.1.8 Validación cruzada: Catay y San Miguel En la Figura 31 se aprecia el comportamiento del nivel freático en semana 12 del 2016 en Catay utilizando cuatro métodos de interpolación. KO y KS poseen bastante similitud. En cambio, IDW presenta picos con valores extremos, siendo estos las zonas de color rojo y color amarillo y azul intenso dentro de la zona color celeste. KU presenta tendencias a generalizar la zona color celeste ocupando la mayor parte del área. En general, KO y KS generan mapas de interpolación acorde con la realidad de campo.


70

Figura 31. Comportamiento del nivel freático en semana 12 del 2016 en Catay utilizando cuatro métodos de interpolación. .


71

Figura 32. Comportamiento del nivel freático en semana 13 del 2017 en San Miguel utilizando cuatro métodos de interpolación. En la Figura 32 se aprecia el comportamiento del nivel freático en San Miguel en semana 13 del 2017. KO y KS presenta una superficie de interpolación similares y bastante cercana a la realidad. IDW presentan picos con valores extremos, siendo estos las zonas circulares color rojo y azul intenso. Por otro lado, KU presenta una tendencia con leves cambios y tiende a generalizar valores en el rango 101 – 140 cm de profundidad. Por tanto, KO y KS presentan un comportamiento del nivel freático acorde con la realidad.


72

4.1.9 Análisis de regresión entre valores observados y estimados En las Figuras 33 y 34 se presentan el análisis de regresión lineal de los valores observados y estimados por los cuatro métodos de interpolación. El coeficiente de determinación R2 es bajo en los cuatro métodos de interpolación, siendo una regresión lineal casi perfecta con R2 = 1. Los métodos de interpolación KO e IDW tienen el R2 mayor comparado con los demás métodos de interpolación, siendo levemente mayor KO. Por tanto, KO y IDW tienen un mejor ajuste del modelo a los datos, presentando una menor dispersión de los datos alrededor de la línea de regresión.

Figura 33. Regresión lineal entre valores observados y estimados con los cuatro métodos de interpolación con datos de semana 12 del 2016 en Catay.

En San Miguel, los valores de R2 son bajos e inferior a los encontrados en Catay. Si R2 es igual a 1, entonces los valores estimados serían iguales a los valores observados. KO e IDW tienen valores de R2 mayor comparado con KS y KU. Por lo tanto, KO e IDW poseen una menor dispersión de los datos alrededor de la línea de regresión.


73

Figura 34. Regresión lineal entre valores observados y estimados con los cuatro métodos de interpolación para los datos de semana 13 del 2017 en San Miguel. 4.1.10 Resumen estadístico: validación cruzada En las Tablas 4 y 5 se presenta un resumen estadístico de la validación cruzada para los cuatro métodos de interpolación. En Catay, KO tiene el valor más bajo de RMSE en semana 12 del 2016 y se mantiene entre los valores más bajos en semana 12 del 2017 y 2019. El RMSE debe ser lo más pequeño posible. El promedio de los MS en KO es cercano a cero, lo cual es deseable. KU presenta valores de MS más distantes de cero en semana 13 del 2017 y 2018. El valor de la RMSS es cercano a 1 en semana 13 del 2017 y 2019. El RMSS deseable debe ser cercano a 1 y valores mayores a 1 subestima la variabilidad en las predicciones tal como ocurre con KU en semana 12 del 2016, 2017 y 2019. Por tanto, KO presenta mejores indicadores estadísticos comparado con los demás métodos de interpolación. Tabla 4. Resumen estadístico de la validación cruzada de los diferentes métodos de interpolación correspondiente a semana 12 en hacienda Catay. Semana 12 - 2016 Semana 12 - 2017 Semana 12 - 2019 ME RMSE MS RMSS ASE ME RMSE MS RMSS ASE ME RMSE MS RMSS ASE IDW -0.02 24.43 -3.03 17.64 -0.97 21.19 K. Ordinario -0.32 24.33 -0.01 0.92 26.46 -0.73 17.92 -0.02 0.77 23.06 -0.17 20.38 0.00 0.96 21.06 K. Simple -0.59 25.62 -0.02 1.45 17.69 -1.51 17.15 -0.04 0.96 18.70 -0.55 21.17 -0.02 0.94 22.49 K. Universal 0.27 25.46 0.05 5.02 5.05 0.63 22.80 0.28 10.66 2.14 0.07 19.84 0.00 1.16 17.13 n = 48, Mean Error: ME, Root Mean Square:RMSE, Mean Standardized: MS, Root Mean Square Standardized: RMSS, Average Standard Error:ASE Método


74

En San Miguel, el RMSE es similar en KO, KS e IDW comparado con KU. El MS de KO y KS son similares y menores comparado con KU. KO tiene un valor de RMSS cercano a 1, mientras KS y KU tienen valores más alejados de 1, en las tres semanas de evaluación. El RMSS deseable debe ser cercano a 1 y valores mayores a 1 subestima la variabilidad en las predicciones tal como ocurre con KU en semana 13 del 2017 al 2019. Por lo tanto, KO presenta mejores indicadores estadísticos comparado con KU, KS e IDW. Tabla 5. Resumen de la validación cruzada de los diferentes métodos de interpolación correspondiente a semana 13 en hacienda San Miguel. Semana 13 - 2017 Semana 13 - 2018 Semana 13 - 2019 ME RMSE MS RMSS ASE ME RMSE MS RMSS ASE ME RMSE MS RMSS ASE IDW 0.48 32.81 0.25 23.07 0.58 20.83 K. Ordinario 1.13 32.75 0.03 0.94 34.90 0.68 22.50 0.03 0.99 22.60 0.51 21.20 0.02 1.10 18.81 K. Simple 0.45 33.25 0.01 0.93 35.71 0.16 22.58 0.01 1.07 21.11 0.84 21.05 0.03 0.82 25.53 K. Universal 2.06 34.01 0.08 1.41 24.24 1.17 22.50 0.07 1.25 17.96 1.20 22.40 0.12 2.30 9.73 n = 40, Mean Error: ME, Root Mean Square:RMSE, Mean Standardized: MS, Root Mean Square Standardized: RMSS, Average Standard Error:ASE Método

4.1.11 Resumen estadístico: validación La validación se realizó con un subconjunto de datos, datos de entrenamiento, para con ello estimar los datos de prueba, siendo 10 en total. Los indicadores estadísticos que se presentan en las Tablas 6 y 7 corresponden a los datos de prueba para las haciendas Catay y San Miguel respectivamente. Tabla 6. Resumen estadístico para los datos de prueba utilizados en la validación en Catay. Semana 12 - 2016 Semana 12 - 2017 Semana 12 - 2019 ME RMSE MS ASE ME RMSE MS ASE ME RMSE MS ASE IDW 16.22 23.40 -7.89 10.60 -0.80 12.43 K. Ordinario 15.42 21.97 0.59 26.61 -0.99 9.76 -0.03 25.26 -0.18 12.03 0.00 22.70 K. Simple 17.14 22.79 0.14 29.17 1.45 11.04 0.07 26.18 0.18 18.68 0.12 9.57 K. Universal 17.45 26.00 0.91 19.39 5.43 12.57 1.99 2.73 -0.49 11.76 -0.03 14.40 n = 10, Mean Error: ME, Root Mean Square:RMSE, Mean Standardized: MS, Average Standard Error:ASE Método

En semana 12 del 2016 se observa valores altos del ME, lo cual podría indicar algún sesgo en los modelos de interpolación para esa semana. En semana 12 del 2017 y 2019, los valores de ME son cercanos a cero. En todas las semanas, KU tiene los valores más altos de ME. El IDW tiene valores altos de ME en semana 12 del 2016 y 2017. En la mayoría de las semanas de medición, KO tiene los valores más bajo de RMSE, lo cual entre más bajo es mejor. El MS es bajo y cercano a cero en los tres interpoladores Kriging en todas las semanas. En síntesis, KO tiene mejores indicadores estadísticos y consistentes en las tres semanas de medición.


75

En la hacienda San Miguel, el ME es cercano a cero en semana 13 y se incrementa en semana 10 del 2018 y 14 del 2019 en los cuatro interpoladores. ME es el promedio del error entre los valores observados y estimados, por ello entre más se alejan de cero menor precisión en los valores estimados. KO e IDW presentan los valores más bajos de RMSE comparado con los otros interpoladores. KO mantiene de forma consistente el valor menor de RMSE. El MS es bajo y cercano a cero en los tres interpoladores Kriging. En resumen, KO tiene el valor más bajo de RMSE, seguido por IDW. En los demás indicadores estadísticos no se aprecian diferencias entre los métodos de interpolación. Tabla 7. Resumen estadístico para los datos de prueba de la validación en San Miguel. Semana 13 - 2017 Semana 10 - 2018 Semana 14 - 2019 ME RMSE MS ASE ME RMSE MS ASE ME RMSE MS ASE IDW -1.94 26.56 2.80 14.17 -4.75 20.38 K. Ordinario -1.23 26.81 -0.04 35.39 1.82 11.62 0.13 15.27 -5.05 20.03 -0.21 27.15 K. Simple -3.14 29.46 -0.10 30.83 0.37 16.43 0.03 19.72 -5.07 22.20 -0.22 25.58 K. Universal -0.90 25.82 -0.04 25.55 2.60 14.84 1.38 1.86 -3.51 21.21 -0.17 21.93 n = 10, Mean Error: ME, Root Mean Square:RMSE, Mean Standardized: MS, Average Standard Error:ASE Método

4.2 ANÁLISIS DE RESULTADOS 4.2.1 Comportamiento no normal de los datos Las pruebas de normalidad gráficas y numéricas indican que los datos primarios y sus respectivas transformaciones logarítmicas y de Jonhson no muestran una distribución normal. Esto es importante para los interpoladores geoestadísticos, ya que según Samira et al. (2014), los análisis geoestadísticos, como muchos procedimientos estadísticos, suponen que la distribución de los datos es normal. Para IDW no requiere algún conocimiento del comportamiento de la variable a interpolar (Frolla, Zilio, y Krüger, 2014). Por tanto, el comportamiento no normal de los datos no afecta el método de interpolación determinístico. La presencia de datos repetitivos mayores a 179 cm afecta el comportamiento normal de los datos. Los datos repetitivos representan alrededor del 45% de la población y corresponde a los valores en el cual el nivel freático no se encontró en el pozo de observación. Las pruebas de normalidad gráfica y teóricas realizadas a los valores menores


76

a 179 cm indican, que tanto los datos y sus respectivas transformaciones tienen comportamiento normal. Finalmente, se tomó la decisión de utilizar el 100% de los datos, debido a que la población de datos que se debería excluir es alta. Esto conlleva, a que los métodos geoestadísticos tienen un margen de mejorar sus predicciones al trabajar con una población de datos normales. En cambio, IDW no tiene mayores oportunidades. 4.2.2 Comportamiento del nivel freático: Catay El nivel freático en la hacienda Catay en el 2018 y 2019 se encuentra más profundo comparado con el 2015, 2016 y 2017 en las semanas de mayor precipitación. El 25% de los pozos de observación tienen un nivel freático igual o menor a 154 cm en la semana 12 del 2018 y 2019. En esa misma semana en el 2016, el 25% de los pozos de observación tenía un nivel freático igual o menor a 88 cm de profundidad. En el 2015 se aprecia un nivel freático en general poco profundo con valor máximo de 158 cm. En las Figuras del 26 al 28 se observa el comportamiento del nivel freático en diferentes años, siendo crítico en el 2015 y 2016, mientras que en el 2017 al 2019 el panorama mejora. La razón de los cambios en la profundidad del nivel freático en los años de evaluación se debe a la tecnificación del drenaje y el manejo integral del suelo. La tecnificación consistió en: o Monitorear el nivel freático con pozos de observación antes y después de las mejoras. o Profundizar drenajes terciarios y mantenerlos a profundidad constante con drenaje subterráneo. o Mejorar la tasa de infiltración del suelo con coberturas vivas. o Nivelar el suelo. Para implementar las mejoras en el drenaje se procedió a renovar la plantación con meristemo variedad Williams. En primera instancia se mejoró la infiltración del suelo mediante la siembra de cobertura vivas Kudzú (Pueraria Phaseoloides) antes de plantar el banano. Según Phillips (2016), la infiltración en suelos bananeros con cobertura de Kudzú de 4 años y 17 años establecido dentro de la plantación incrementaron la infiltración del suelo en tasas de 2.3 y 4.6 veces respectivamente comparado con suelos bananeros sin


77

cobertura a una profundidad de 0 – 30 cm. La infiltración es la mejor medida de la porosidad del suelo, ya que indica la continuidad de los poros asegurando que estos están conectados. De esta forma se evita la acumulación de agua en la superficie del suelo. El rediseño de los drenajes tuvo como primer paso realizar la altimetría de la hacienda y nivelar el terreno. Seguidamente se trabajó en los drenajes secundarios y se pasa de drenajes 1.80 m profundidad, boca variable, canales con sedimentados y talud variable hacia canales de 2.5 m profundidad, boca 5 m y base 1 m con distancias cada 100 m. En los terciarios se pasa de canales abiertos con profundidad 1.30 m hacia drenajes subterráneos con profundidad 1.70 m. Las inversiones en el drenaje se realizaron en el verano del 2015 en el 18% del área de la hacienda que corresponde a la tasa de renovación por año. Por tanto, la tecnificación en el drenaje ha permitido incrementar la profundidad del nivel freático en el 2018 y 2019, lo cual es deseable para la plantación. Los análisis de interpolación realizados en diferentes años confirman que el nivel freático se encuentra a mayor profundidad en el 2018 y 2019 comparado con el 2015, 2016 y 2017. 4.2.3 Comportamiento del nivel freático: San Miguel La hacienda San Miguel fue adquirido en el 2016 y a partir del 2017 se comenzó a monitorear el nivel freático. La hacienda ha tenido problemas históricos de mal drenaje. En el 2017 y 2018 los problemas persisten presentando el 25% de los pozos de observación niveles freáticos igual o menor a 115 y 94 cm de profundidad respectivamente. En las Figuras 29 y 30 se aprecian sitios mal drenados, zonas de color amarillo, que aún persisten en el 2019. Por tanto, se evidencia que el drenaje ha mejorado en el 2019 con respecto al 2017 y 2018, con ciertos puntos críticos que aún persisten. En la hacienda se han mejorado los drenajes en cuanto a limpieza, profundizar secundarios e instalación en el 2019 de una estación de drenaje para evacuar los excesos de agua que se acumulan en las partes bajas. Esto ha permitido mejorar el drenaje con algunos sitios críticos por corregir con nivel freático aún cercano a la zona donde se concentran la mayor cantidad de raíces del cultivo. El análisis de interpolación ha demostrado que el nivel freático en San Miguel está más profundo en el 2019 comparado con el 2017 y 2018, lo cual es deseable.


78

4.2.4 Validación de los diferentes métodos de interpolación En las Figuras 31 y 32 se observa el comportamiento del nivel freático utilizando cuatro métodos de interpolación: IDW, KO, KS y KU. KO y KS generaron una superficie de interpolación similar, tanto para Catay como San Miguel con leves diferencias. Adicionalmente, las superficies de interpolación de KS y KO son representativas de la realidad de campo. El método determinístico IDW detecta valores extremos, siendo estos en el rango de 0 – 60 cm y 141 – 180 cm, generando puntos de concentración representados por los círculos rojos y azul intenso. Los valores extremos generan cambios bruscos en la superficie de interpolación. Villatoro, Henríquez, y Sancho (2008) encontraron puntos de concentración (“ojo de buey”) en algunos sitios en la superficie de interpolación para las variables pH, Ca, CIC y P. Esto se debe al peso que se le puede dar a la variación particular del valor de un punto de muestreo sobre los que están alrededor. Una limitante es la sensibilidad del método a los valores extremos. Desde el punto de vista práctico, es una limitante ya que no se realiza correctivos por una mínima área que es problemática, cuando la mayor superficie indica buen drenaje para el cultivo. KU detecta tendencias espaciales y es el método que más se aleja de la realidad para la variable nivel freático. KU tiende a generalizar los valores en el rango de 101 – 140 cm, correspondiente a la categoría de drenaje adecuado (color celeste). Por ende, KU tiende a subestimar la variabilidad en sus predicciones. Desde esta perspectiva, KU es un método de interpolación no recomendado para estudiar el comportamiento del nivel freático en las haciendas. De acuerdo con Schmidt, Tilahun, Kedir, y Shiferaw (2011), KU supone que existe una fuerte tendencia de los datos en la región y, por lo tanto, KU solamente debe usarse cuando se conoce que existe una tendencia en los datos y se puede dar una justificación científica para describirlos. Este no es el caso del comportamiento del nivel freático en las haciendas, ya que los datos no tienen tendencia en el plano norte – sur, ni en la dirección este – oeste. KO presentó, en la mayoría de los casos, valores más bajos de RMSE en la validación cruzada con respecto a los otros métodos. El MS es más cercano a cero en KO comparado con KS y KU, lo cual indica que el modelo no está sesgado. El RMSS en KO es cercano 1 en la mayoría


79

de los casos, indicando la fiabilidad de los errores estándar de la predicción. Caso contrario, ocurre con KU que presenta valores de RMSS mayores a 1, lo cual subestima la variabilidad en sus predicciones. KS no presenta consistencia en los indicadores estadísticos, siendo en algunos casos deseables y en otros alejados de los parámetros. Por tanto, KO presenta los mejores indicadores estadísticos en la validación cruzada. El análisis de regresión con los datos observados y estimados por los cuatro métodos de interpolación presentó un coeficiente de determinación R2 bajo, entre 0.09 hasta 0.39, siendo deseable valores cercanos a 1. KO e IDW presentaron los valores más altos de R 2 con respecto a los otros métodos. Por lo tanto, presentan una menor dispersión de los datos alrededor de la línea de regresión. El ME en la validación realizada en Catay fue menor y cercano a 1, comparado con los ME obtenidos en San Miguel en los cuatro interpoladores. Esto se debió posiblemente a la mayor cantidad de datos de entrenamiento utilizados en Catay. ME es menor en KO e IDW en la mayoría de los casos con respecto a KS y KU. El RMSE fue menor en KO con respecto a los demás interpoladores. Cuanto menor es el valor, más precisa son las predicciones. La MS es menor en KS y KO y más alta en KU. Por tanto, el protocolo de decisiones es acertado para KO de acuerdo con los indicadores estadísticos de la validación.


80

CAPITULO V 5

CONCLUSIONES Y RECOMENDACIONES

5.1 CONCLUSIONES La precipitación en los últimos 10 años en la zona es de alrededor de 1430 mm anuales. En las haciendas la precipitación oscila entre 1200 a 2071 mm/año. El problema radica en la distribución, ya que alrededor del 52% de la precipitación anual cae entre 5 a 7 semanas, generando serios problemas de drenaje y en algunos casos inundaciones en la costa ecuatoriana. El estudio del comportamiento del nivel freático mediante métodos de interpolación determinístico IDW y métodos geoestadísticos se llevó a cabo en el período de mayor precipitación en las haciendas. El análisis exploratorio de los datos y los mapas de interpolación evidenciaron que el nivel freático ha mejorado en la hacienda Catay. En el 2016 en el 50% de los pozos de observación el nivel freático se encontrada igual o menor a 105 cm de profundidad y para el 2018 y 2019 el 50% de los pozos tenía un nivel freático igual o menor a 171 cm y 169 cm respectivamente. Por tanto, el rediseño del drenaje en Catay ha tenido efectos deseables con un nivel freático más profundo. En San Miguel el nivel freático ha mejorado en el 2019 con respecto al 2018 y 2017. El 50% de los pozos de observación tenía un nivel freático igual o menor a 132 cm en el 2016 y 114 cm en el 2017. El panorama ha mejorado para el 2019 con un valor igual o menor a 180 cm en el 50% de los pozos de observación. Por tanto, en San Miguel las inversiones en drenaje han logrado el efecto deseado. El método de interpolación IDW generó superficies de interpolación con cambios bruscos, considerando valores extremos. El RMSE y ME fue intermedio, no fue el menor, ni el mayor en relación con los demás métodos. El R2 en la regresión lineal entre valores observados y estimados fue uno de los más altos, siendo similar a KO. Por otro lado, IDW se sustenta en la inversa de la distancia elevada a una potencia matemática. Esto conlleva a que el comportamiento no normal de los datos no afecta el método IDW, como si pudiese afectar


81

a los métodos geoestadísticos. Por ende, se esperarían mejores resultados en la predicción. Por lo tanto, IDW no es el mejor interpolador para estudiar el comportamiento del nivel freático en las haciendas. KU es el método que más se aleja de la realidad del comportamiento del nivel freático en campo. El método tiende a generalizar valores de nivel freático en el rango de 101 – 140 cm generando superficies de interpolación con pocos cambios. El RMSE y ME fueron los más altos en la mayoría de los casos, lo cual no es deseable. El RMSS fue mayor a 1 en todos los casos, lo cual implica que el modelo subestima la variabilidad en sus predicciones. El R2 fue uno de los más bajos en el análisis de regresión. Por lo tanto, KU no es el mejor interpolador para estudiar el comportamiento del nivel freático en las haciendas. KS generó superficies de interpolación similares a KO y representativas del comportamiento del nivel freático en campo. Los valores de RMSE y ME no fueron consistentes en todos los casos. El RMSS fue cercano a 1 en la mayoría de los casos, lo cual es deseable. El R2 en la regresión lineal ocupó el segundo lugar en los valores más altos. Por lo tanto, KS es el segundo método que mejor representa el comportamiento del nivel freático en las haciendas. KO generó superficies de interpolación representativas del comportamiento del nivel freático en las haciendas. El RMSE y ME fueron los más bajos en la mayoría de los casos, lo cual es deseable. El RMSS es cercano a 1, indicando la fiabilidad de los errores estándar de la predicción. El valor de R2 en el análisis de regresión fue uno de los mayores, similar al R2 obtenido en el método IDW. Por lo tanto, KO es el método de interpolación que mejor representa el comportamiento del nivel freático en las haciendas y ratifica que el protocolo de decisiones para el modelo fue acertado.

5.2 RECOMENDACIONES El estudio del comportamiento del nivel freático mediante interpoladores se puede mejorar en la metodología de campo. En primera instancia, incrementar la profundidad de los pozos de observación, la cual podría ser de 250 cm. En segundo orden, incrementar la


82

cantidad de pozos por área. Se propone duplicar la cantidad actual. La finalidad es obtener un conjunto de datos que permitan flexibilidad para eliminar datos repetitivos y así trabajar con datos con comportamiento normal. Adicionalmente, tendría mayor cantidad de información para los datos de prueba y subconjunto de datos de entrenamiento utilizados en la validación. Con relación al aspecto metodológico en el protocolo de decisiones para los interpoladores geoestadístico se recomienda: o Realizar interpolaciones geoestadísticas con valores de nivel freático con comportamiento normal y evaluar cuanto mejoran las predicciones. o Evaluar otros tipos de modelos de variogramas como exponenciales y gaussianos y sus efectos en la predicción de los valores. o Optimizar los parámetros del vecindario de búsqueda para cada modelo geoestadístico: máximo y mínimo de vecinos, tipo de sector y peso de los vecinos por sector. El estudio aporta un protocolo de decisiones para elaborar un modelo geoestadístico que predice de mejor forma el comportamiento del nivel freático en sitios sin mediciones. Desde la perspectiva agrícola, se aportan alternativas para estudiar el comportamiento del nivel freático combinando mediciones de campo con análisis espacial. Esta variable generalmente se ha evaluado de forma empírica, excluyendo el principio que dice: “lo que no se mide, no se puede mejorar”. Otro aporte es la forma visual y fácil de entender el resultado de la interpolación para un agricultor que muchas veces no está familiarizado con los números. En este caso aplica el término que “los mapas dicen más que mil palabras”.


83

6

REFERENCIAS BIBLIOGRÁFICAS

Araujo, J., y Malan, N. (2019). Análisis de la situación económica de los pequeños productores de banano de la parroquia jesús maría del cantón naranjal, provincia del guayas durante el periodo 2015 - 2017 [Universidad Laica VICENTE ROCAFUERTE]. In Journal of Chemical Information and Modeling. Accedido el 03 de abril del 2020 en http://repositorio.ulvr.edu.ec/bitstream/44000/3231/1/T-ULVR-2828.pdf

Araya, M. (2003). Stratification and spatial distribution of the banana (Musa AAA, Cavendish Subgroup, CVS Valery and Grande naine). Sistema Radical de Banano: Hacia Un Mejor Conocimiento Para Su Manejo Productivo, 83–103.

Arias, M., y Véliz, T. (2018). Modelo de costos en producción de banano para torchusa S.A (Tesis de Pregrado). Universidad de Guayaquil, Facultad de Ciencias Administrativas. Guayaquil, Ecuador. Accedido el 03 de marzo del 2020 en http://repositorio.ug.edu.ec/bitstream/redug/27036/1/MODELO-DE-COSTOS-ENPRODUCCIÓN-DE-BANANO-PARA-TORCHUSA-S.A.-ARIAS-CARRERA-VÉLZVLLAFERTE.pdf

Cabrera, P. (2016). LECCIÓN 2 Exploración de Datos.Módulo Estadística Espacial, 17 p. UNIGIS. Quito, Ecuador.

Caruso, C., y Quarta, F. (1997). Interpolation methods comparison. Computer Math. Applic., 35(12), 109–126. https://doi.org/10.1016/0076-6879(92)10015-6

Chavasse, D. I., y Seoane, R. S. (1997). Asociación determinístico-estocástica para predicción de caudales. 4, 55–64. Accedido el 12 de diciembre del 2019 en http://www.ingenieriadelagua.com/2004/download/4-2%5Carticle6.pdf

Cordero, R. W. A. (2016). Evaluación Agronómica y Comparativa entre dos variedades de banano (Musa paradisiaca AAAA) aplicando falsa +2, falsa +3 y falsa +4 (Tesis de Pregrado).Universidad de Guayaquil, Facultada de Ciencias Agrarias. Guayaquil, Ecuador. Accedido el 30 de marzo del 2020 en http://repositorio.ug.edu.ec/bitstream/redug/9589/1/Astudillo Cordero Robert Wilian.pdf

Cuesta, R. (2019). Ley del Banano. El UNIVERSO, 1. Accedido el 23 de mayo 2020 en https://www.eluniverso.com/opinion/2019/05/23/nota/7342505/ley-banano


84

Curtarelli, M., Leão, J., Ogashawara, I., Lorenzzetti, J., y Stech, J. (2015). Assessment of spatial interpolation methods to map the bathymetry of an Amazonian hydroelectric reservoir to aid in decision making for water management. ISPRS International Journal of Geo-Information, 4(1), 220–235. https://doi.org/10.3390/ijgi4010220

Déleg, X. (2018). Determinación de la variabilidad espacial de las características físicas del suelo en la parcela Experimental Irquis (Tesis de Pregrado). Universidad de Cuenca, Facultad de Ciencias Agropecuarias. Cuenca, Ecuador. Accesidod el 30 de marzo del 2020 en https://dspace.ucuenca.edu.ec/bitstream/123456789/30227/1/Trabajo de Titulación.pdf

Elbehri, A., Calberto, G., Staver, C., Hospido, A., Roibas, L., Skully, D., Siles, P., Arguello, J., Sotomayor, I., y Bustamante, A. (2015). Cambio Climático y Sostenibilidad del Banano en el Ecuador: Evaluación de impacto y directrices de política. In Organización De Las Naciones Unidas Para la Agricultura y La Alimentación (FAO). FAO. Accedido el 03 de diciembre del 2019 en http://www.fao.org/3/a-i5116s.pdf

Emery, X. (2013). Geoestadística. Universidad de Chile. Accedido el 03 de diciembre del 2019 en https://www.ucursos.cl/usuario/f697544fb48474f4153ef2aafbe4c963/mi_blog/r/Geoestadistica.pdf

Esri, Environmental Systems Research Institute. (2009). World Imagery. Referencia espacial: 102100 (3857). Mapa actualizado el 23 de septiembre del 2020 por Esri. Créditos (atribución): Esri, Maxar, Earthstar Geographics, CNES/Airbus DS, USDA FSA, USGS, Aerogrid, IGN, IGP, and the GIS User Community. Accedido el 07 de octubre del 2020 en https://services.arcgisonline.com/ArcGIS/rest/services/World_Imagery/MapServer

Esri, Environmental Systems Research Institute. (2019). Performing cross-validation and validation. Geostatistical Analyst: Evaluating interpolation results. Guide books: extensions. Accedido el 23 de abril del 2020 en https://desktop.arcgis.com/es/arcmap/10.3/guide-books/extensions/geostatisticalanalyst/performing-cross-validation-and-validation.htm

Fernandez, E. S. (2015). Package Johnson. RE.Johnson performs Transformation to increase the normality. Publicado el 15 de abril del 2014. Documento PDF, 6 p. Accesido el 6 de enero del 2020 en https://cran.rproject.org/web/packages/Johnson/Johnson.pdf


85

Frolla, F., Zilio, J., y Krüger, H. (2014). Guía práctica para la interpolación de datos espaciales con software libre. EEA INTA Bordenave y Ministerio de Agroindustria. Buenos Aires, Argentina. Accedido el 26 de abril del 2020 en https://inta.gob.ar/sites/default/files/guia_rapida_para_interpolacion_de_datos_esp aciales_con_software_libre.pdf

Frolla, F., Zilio, P., y Kruger, H. (2015). Variabilidad espacial de la profundidad del suelo . Métodos de interpolación para el sudoeste bonaerense. RIA, 41, 309–316. Accedido el 07 de abril del 2020 en http://ria.inta.gob.ar/sites/default/files/trabajosenprensa/art.7frollavariabilidadespacial.pdf

Gauggel, C., Sierra, F., y Arévalo, G. (2003). Banana Root System: towards a better understanding for its productive management Proceedings of an international symposium. Sistema Radical del Banano: hacia un mejor conocimiento para su manejo productivoMemorias de un simposio internacional, San José, C. Proceedings of an International Symposium Held in San Jose, Costa Rica, November, 251.

Giraldo Henao, R. (2011). Introducción a la Geoestadística: Teoría y Aplicación. Universidad Nacional de Colombia: Departamento de Estadística. Bogotá, Colombia. Accedido el 31 de marzo del 2020 en https://geoinnova.org/blog-territorio/wpcontent/uploads/2015/05/LIBRO_-DE-_GEOESTADISTICA-R-Giraldo.pdf

Gomariz Castillo, F. J. (2013). Distribución Espacial:interpolación espacial. Dinámica de Poblaciones Marinas, 38. Universidad de Alicante: Estadistica Aplicada. Alicante, España. Accedido el 30 de marzo del 2020 en https://rua.ua.es/dspace/bitstream/10045/29116/1/presentaD2.pdf

Goodchild, M. (1986). Spatial autocorrelation. In Applied Geography (Vol. 9, Issue 2). University of Western Ontario. https://doi.org/10.1016/0143-6228(89)90057-x

Google Earth Pro. (2019). “Ubicación de Catay y San Miguel". Accedido el 23 de abril del 2020 en https://www.google.com/earth/

Gutiérrez-Hernández, O., Cámara-Artigas, R., Senciales-González, J. M., y García, L. V. (2015). Estimación de la superficie freática en zonas de ecotono del Parque Nacional de Doñana mediante datos piezométricos, covariables topográficas y métodos geoestadísticos. Análisis Espacial y Representación Geográfica: Innovación y


86

Aplicación, 1669–1678.

Hengl, T. (2009). A Practical Guide to Geostatiscal Mapping. In Government Publications Review. Office for Official Publications of the European Communities, Luxembourg. https://doi.org/10.1016/0277-9390(86)90082-8

Hoyos-Leyva, J. D., Jaramillo-Jiménez, P. A., Giraldo-Toro, A., Dufour, D., Sánchez, T., y Lucas-Aguirre, J. C. (2012). Caracterización fisica, morfológica y evaluación de las curvas de empastamiento de musáceas (Musa spp.). Acta Agronomica, 61(3), 214– 229. Accedido el 01 de abril del 2020 en http://www.scielo.org.co/pdf/acag/v61n3/v61n3a03.pdf

INEC, Instituto Nacional de Estadística y Censos. (2015). Encuenta de Superficie y Porducción Agropecuaria Continua. Accedido el 01 de abril del 2020 en http://www.ecuadorencifras.gob.ec/documentos/webinec/Estadisticas_agropecuaria s/espac/espac_20142015/2015/Presentacion de resultados ESPAC_2015.pdf

Jie, C., Hanting, Z., Hui, Q., Jianhua, W., y Xuedi, Z. (2013). Selecting Proper Method for Groundwater Interpolation Based on Spatial Correlation. Fourth International Conference on Digital Manufacturing & Automation, 1192–1195. https://doi.org/10.1109/ICDMA.2013.282

Kema, G. (2015). Diseminación del Mal de Panamá en banana es ocasionado por un solo clon del hongo Fusarium. Wageningen University and Research. Accedido el 01 de abril del 2020 en https://www.wur.nl/es/news/Diseminacion-del-Mal-de-Panamaen-banana-es-ocasionado-por-un-solo-clon-del-hongo-Fusarium-.htm

Lund University. (2004). Interpolation. In Advanced Course in Geographical Information Systems (GIS) (pp. 1–22). Lund University Master’s Programme in GIS (LUMA – GIS).

Marko, K., y Alamri, N. (2014). Lecture on Kriging. ResearchGate. Accedido el 01 de abril del 2020 en https://www.researchgate.net/publication/258276562_Lecture_on_Kriging

Mérida, M., y Vaquero, R. (2004). Evaluador de drenaje Agricola. Curso Riego y Drenaje. Informe final de curso, 2 p. Universidad EARTH. Guácimo, Limón, Costa Rica.


87

Mesén, R. A. (2015). Primera ley de la geografía e índices de correlación espacial. Escuela de Geografía, UCR. Accedido el 31 de marzo del 2020 en https://es.scribd.com/document/342376594/Primera-Ley-de-La-Geografia-e-Indicesde-Autocorrelacion-Espacial

Ministerio de Comercio Exterior del Ecuador. (2017). Informe Sector Bananero Ecuatoriano. In Ministerio de Comercio Exterior. Accedido el 01 de abril del 2020 en https://www.produccion.gob.ec/wp-content/uploads/2019/06/Informe-sectorbananero-espa%C3%B1ol-04dic17.pdf

Minitab. (2020). Métodos y fórmulas para la Transformación de Johnson. Soporte de Minitab 19. Minitab.com. Accedido el 15 de abril del 2020 en https://support.minitab.com/es-mx/minitab/19/help-and-how-to/quality-andprocess-improvement/quality-tools/how-to/johnson-transformation/methods-andformulas/methods-and-formulas/#fnsrc_1

Musashi, J. P., Pramoedyo, H., y Fitriani, R. (2018). Comparison of Inverse Distance Weighted and Natural Neighbor Interpolation Method at Air Temperature Data in Malang Region. CAUCHI – JURNAL MATEMATIKA MURNI DAN APLIKASI, 5(2), 48–54. https://doi.org/10.18860/ca.v5i2.4722

Parada, L. (2019). PRUEBA DE NORMALIDAD DE SHAPIRO-WILK. RPubs by RStudio. Accedido el 14 de abril del 2020 en https://www.rpubs.com/F3rnando/507482

Phillips, I. (2016). Evaluation of the effect of a cover crop on physical soil properties in banana plantations in the provinces of Guayas and Los Ríos , Ecuador (Issue May). WAGENINGEN UNIVERSITY.

Razali, N. M., y Wah, Y. B. (2011). Power comparisons of Shapiro-Wilk , KolmogorovSmirnov, Lilliefors and Anderson-Darling tests. Journal of Statistical Modeling and Analytics, 2(1), 21–33. Accedido el 12 de diciembre del 2019 en http://www.de.ufpb.br/~ulisses/disciplinas/normality_tests_comparison.pdf

Román, J. G. A. (2012). Respuesta Espacial de la Productividad al Nivel Freático de la Finca El Paso en el Cultivo de Banano (musa acuminata), Basado en el Uso de Sistemas de Información Geográfica. Universidad San Fransico de Quito.

Rossel, F., Cadier, E., y Gómez, G. (1996). Las inundaciones en la zona costera ecuatoriana:


88

causas, obras de protección existentes y previstas. Bull. Inst. Fr. Études Andines, 25(3), 399–420. Accedido el 05 de septiembre del 2019 en https://horizon.documentation.ird.fr/exl-doc/pleins_textes/divers1412/010011839.pdf

Samira, I., Ahmed, D., y Lhoussaine, M. (2014). Soil fertility mapping : comparison of three spatial interpolation techniques. International Journal of Engineering Research & Technology, 3(11), 9. Accedido el 07 de abril del 2020 en https://www.ijert.org/research/soil-fertility-mapping-comparison-of-three-spatialinterpolation-techniques-IJERTV3IS111043.pdf

Schmidt, E., Tilahun, H., Kedir, M., y Shiferaw, H. (2011). An introduction to geographical information systems. In Ethiopia Strategy Support Program II (ESSP II), Ethiopian Development Research Institute (EDRI). ESSP II / EDRI Training Manual. Accedido el 01 de abril del 2020 en http://essp.ifpri.info/files/2011/04/GIS_Training_Manual_20111221_lab11-12.pdf

Secretaria Nacional Del Agua. (2013). Proyecto Control De Inundaciones Bulubulu – Cañar. Empresa Pública del Agua. Guayaquil, Ecuador. Accedido el 01 de abril del 2020 en http://www.empresaagua.gob.ec/wp-content/uploads/downloads/2018/04/PerfilProyecto-Bulubulu-Cañar1.pdf

Siabato, W., y Guzmán-Manrique, J. (2019). La autocorrelación espacial y el desarrollo de la geografía cuantitativa. Cuadernos de Geografia: Revista Colombiana de Geografia, 28(1), 1–22. Accedido el 01 de abril del 2020 en https://doi.org/10.15446/rcdg.v28n1.76919

Smith, M., Goodchild, M., y Longley, P. (2018). Geospatial Analysis. A Compresive Guide to Principles Techniques and Software Tools (6th edition). Isue version: 2018-2. ISBN 13. Guide's website: www.spatialanalysisonline.com. Accedido el 01 de abril del 2020 en https://www.spatialanalysisonline.com/HTML/index.html?core_concepts.htm

Soto, M. (2005). Cultivo de banano. Material impreso del curso lectivo Cultivo de Banano. Universidad EARTH. Guácimo, Limón, Costa Rica.

Uyan, M. (2018). Comparison of different interpolation techniques in determining of agricultural soil index on land. International Journal of Engineering and Geosciences (IJEG), 4(1), 28–35. https://doi.org/10.26833/ijeg.422570


89

Villatoro, M., Henríquez, C., y Sancho, F. (2008). Comparación de los interpoladores IDW Y Kriging en la variación espacial de pH, Ca, CICE y P del suelo. Agronomia Costarricense, 32(1), 95–105.

Yañez-Vazquez, A., Samano-Abonce, O., Santos-Olvera, O., y Ruiz- Barcenas, L. (2018). Análisis del sistema de transformación de datos Johnson para variables aleatorias no normales de distribución beta. Revista de Análisis Cuantitativo y Estadístico, 5(14), 12–18. Accedido el 07 de abril del 2020 en http://www.ecorfan.org/bolivia/researchjournals/Analisis_Cuantitativo_y_Estadistico /vol5num14/Revista_de_Análisis_ Cuantitativo_y_Estadístico_V5_N14_3.pdf


Turn static files into dynamic content formats.

Create a flipbook
Issuu converts static files into: digital portfolios, online yearbooks, online catalogs, digital photo albums and more. Sign up and create your flipbook.