104043

Page 1

Master Thesis | Tesis de Maestría Submitted within the UNIGIS MSc programme Presentada para el Programa UNIGIS MSc At/en Interfaculty Departament of Geoinformatics – Z_GIS Departamento de Geomatica – Z_GIS University of Salzburg | Universidad de Salzburg

Análisis multicriterio en la valoración catastral en el municipio de Tabio, Colombia. Multicriteria analysis in the cadastral valuation in the municipality of Tabio, Colombia.

By/por Ingeniero Javier Orlando Leal Pardo 01423622 A thesis submitted in partial fulfilment of the requirement of the degree of Master of Science (Geographical Information Science & Systems) – Msc (GIS)

Advisor | Supervisor: Leonardo Zurita Arthos PhD

Bogotá – Colombia, 2021

1


Compromiso de ciencia

Por medio del presente documento, incluyendo mi firma personal certifico y aseguro que mi tesis es completamente el resultado de mi propio trabajo. He citado todas las fuentes que he usado en mi tesis y en todos los casos he indicado su origen.

Bogotá – Colombia. Septiembre de 2021 (Lugar, Fecha)

2


RESUMEN

Esta investigación busca perfeccionar la metodología de formación de Zonas Homogéneas Físicas y Geoeconómicas, sin la necesidad de un aumento súbito de recursos necesarios, mediante la aplicación del Proceso Analítico Jerárquico (AHP) para la definición de pesos a las variables formadoras de valor. Posteriormente se profundiza en el estudio de la viabilidad de diferentes modelos, por medio de pruebas estadísticas, para formulaciones que explican el valor del suelo a partir de los pesos de las variables formadoras de valor. Finalmente, se realizó una comparación cuantitativa de los resultados obtenidos por los modelamientos propuestos respecto a los resultados de las Zonas Homogéneas Geoeconómicas de la entidad oficial (IGAC). El área de estudio fue la zona rural del municipio de Tabio, Cundinamarca (Colombia). Como resultado final se logró establecer modelos que mejoran hasta en un 46,2% la predicción de valores.

Palabras Clave: Valoración Catastral, Zonas Homogéneas Físicas, Zonas Homogéneas Geoeconómicas, Proceso Analítico Jerárquico, Regresión Geográficamente Ponderada.

3


ABSTRACT

This research seeks to perfect the methodology of doing Homogeneous Physical and Geoeconomic Zones (Zonas Homogéneas Físicas y Geoeconómicas - ZHF y ZHG), without the need for a drastic increase in necessary resources, by applying the Analytic Hierarchy Process (AHP) for the definition of weights to the value-forming variables. Subsequently, the viability study of different models is deepened, through statistical tests, for formulations that explain the value of the soil from the weights of the value-forming variables. Finally, a quantitative comparison of the results obtained by the proposed models was made regarding the results of the Homogeneous Geoeconomic Zones of the official entity (IGAC). The study area was the rural area of Tabio municipality, Cundinamarca (Colombia). As a result, it was possible to establish models that improve the prediction of values by up to 46.2%.

Keywords: Cadastral Valuation, Homogeneous Physical Zones, Homogeneous Geoeconomic Zones, Analytic Hierarchy Process, Geographically Weighted Regression.

4


ÍNDICE DE CONTENIDO

1.

INTRODUCCIÓN ................................................................................................... 12

1.1 Problema................................................................................................................... 13 1.2 Objetivos .................................................................................................................. 14 1.2.1

Objetivo General ........................................................................................... 14

1.2.2

Objetivos Específicos .................................................................................... 14

1.3 Pregunta de Investigación ........................................................................................ 14 1.4 Hipótesis del Trabajo ............................................................................................... 14 1.5 Justificación .............................................................................................................. 14 1.5.1

Justificación Técnica ..................................................................................... 15

1.5.2

Justificación Político-Administrativa ............................................................ 17

1.5.3

Justificación Económica ................................................................................ 17

1.5.4

Justificación Social. ....................................................................................... 18

1.6 Alcances ................................................................................................................... 18

2

1.6.1

Alcance Temático .......................................................................................... 18

1.6.2

Alcance Espacial ........................................................................................... 19

REVISIÓN DE LITERATURA ............................................................................... 20

2.1 Marco Teórico .......................................................................................................... 20 2.2 Marco Histórico........................................................................................................ 22 2.3 Marco Metodológico ................................................................................................ 23 2.3.1

Métodos Multicriterio ................................................................................... 28

2.3.2

Aplicación de los Métodos de Regresión a la Valoración............................. 33 5


3

2.3.3

Métodos Mixtos............................................................................................. 36

2.3.4

Otros Métodos ............................................................................................... 38

2.3.5

Métodos de Muestreo .................................................................................... 40

2.3.6

Análisis espacial de residuales. ..................................................................... 42

METODOLOGÍA .................................................................................................... 43

3.1 Área de Estudio. ....................................................................................................... 46 3.1.1

Generalidades ................................................................................................ 46

3.1.2

Motivantes para la selección del municipio de Tabio como área de estudio. 48

3.1.3

Características de Influencia en el Valor en el Área de Estudio ................... 50

3.2 Identificación de las variables formadoras de valor. ................................................ 53 3.2.1

Variable Normativa ....................................................................................... 53

3.2.2

Variable Densidad ......................................................................................... 55

3.2.3

Variable Capacidad de uso del suelo............................................................. 57

3.2.4

Variable Vías ................................................................................................. 59

3.2.5

Variable Disponibilidad de aguas.................................................................. 61

3.2.6

Variable Uso actual del suelo ........................................................................ 62

3.3 Zonas Homogéneas Físicas ...................................................................................... 66 3.4 Datos de Mercado Inmobiliario................................................................................ 68 3.5 Estructuracion DEL PROCESO Analitico Jerarquico ............................................. 71 3.6 Definición de la Muestra .......................................................................................... 76 3.7 Zonas homogeneas geoeconomicas IGAC ............................................................... 77 3.8 Estadísticos para la Comparación de Resultados ..................................................... 78 3.8.1

Distancia Manhattan. ..................................................................................... 78 6


4

3.8.2

Índice de Adecuación .................................................................................... 78

3.8.3

Error Medio Cuadrático (RMS) .................................................................... 79

3.8.4

Coeficiente de correlación Pearson ............................................................... 79

3.8.5

Error típico .................................................................................................... 80

3.8.6

Selección del Muestreo proporcional según AHP ......................................... 80

RESULTADOS ........................................................................................................ 82

4.1 Analisis de modelos ................................................................................................. 82 4.2 Análisis Espacial de Residuales y Valores ............................................................... 86 4.3 Evaluación de Aplicabilidad y Adaptabilidad .......................................................... 95 4.4 Análisis y discusión de resultados ............................................................................ 98 5

CONCLUSIONES Y RECOMENDACIONES ..................................................... 102

BIBLIOGRAFÍA ........................................................................................................... 105

7


ÍNDICE DE ILUSTRACIONES ILUSTRACIÓN 1: DIAGRAMA GENERAL DE PROCESOS. .......................................................... 45 ILUSTRACIÓN 2 UBICACIÓN MUNICIPIO DE TABIO................................................................ 47 ILUSTRACIÓN 3: DIVISIÓN POLÍTICA. .................................................................................... 47 ILUSTRACIÓN 4: VARIABLE NORMA DE USO DEL SUELO....................................................... 55 ILUSTRACIÓN 5: VARIABLE DENSIDAD................................................................................. 57 ILUSTRACIÓN 6: VARIABLE CAPACIDAD DEL SUELO ............................................................ 59 ILUSTRACIÓN 7: VARIABLE INFLUENCIA DE LAS VÍAS .......................................................... 60 ILUSTRACIÓN 8: VARIABLE DISPONIBILIDAD DE AGUAS....................................................... 62 ILUSTRACIÓN 9: IMAGEN SATELITAL DEL MUNICIPIO DE TABIO............................................ 63 ILUSTRACIÓN 10: EJEMPLO DE SECTOR CON RESOLUCIÓN ESPACIAL DE 10 METROS ............. 64 ILUSTRACIÓN 11: VISTA GENERAL IMAGEN DESPUÉS DE ANÁLISIS DE COMPONENTES PRINCIPALES. ................................................................................................................. 65

ILUSTRACIÓN 12: VARIABLE USO ACTUAL DEL SUELO ........................................................ 66 ILUSTRACIÓN 13: ZONAS HOMOGÉNEAS FÍSICAS ................................................................. 68 ILUSTRACIÓN 14: RECONOCIMIENTO EN CAMPO(2020) ........................................................ 69 ILUSTRACIÓN 15: UBICACIÓN DE LAS OFERTAS .................................................................... 71 ILUSTRACIÓN 16: CATEGORIZACIÓN DE LAS VARIABLES FORMADORAS DE VALOR. ............. 73 ILUSTRACIÓN 17: MAPA DE CALOR AHP.............................................................................. 75 ILUSTRACIÓN 18: ZHG MUNICIPIO DE TABIO ...................................................................... 77 ILUSTRACIÓN 19: UBICACIÓN DE LOS PREDIOS MUESTRA ..................................................... 81 ILUSTRACIÓN 20: MODELO DESARROLLADOS. ..................................................................... 82 ILUSTRACIÓN 21: RESIDUALES MODELO BASE

Y MODELO 1............................................... 87

ILUSTRACIÓN 22: RESIDUALES MODELO 2 Y MODELO 3. ..................................................... 88 ILUSTRACIÓN 23: RESIDUALES MODELO 4 Y MODELO 5. ..................................................... 89 ILUSTRACIÓN 24: RESIDUALES MODELO 6 Y MODELO 7. ..................................................... 90 ILUSTRACIÓN 25: RESIDUALES MODELO 8 Y MODELO 9. ..................................................... 91 ILUSTRACIÓN 26: RESIDUALES MODELO 10 Y MODELO 11. ................................................. 92 ILUSTRACIÓN 27: RESIDUALES MODELO 12 Y MODELO 13. ................................................. 93 ILUSTRACIÓN 28: RESIDUALES MODELO 14. ........................................................................ 94 ILUSTRACIÓN 29: VALORES PREDICHOS POR LOS MODELOS 11 Y 14. .................................... 95 ILUSTRACIÓN 30: VALORES M2 DE TERRENO MODELO FINAL ADOPTADO. ............................ 99

8


ÍNDICE DE TABLAS TABLA 1. RESUMEN DE LA NORMATIVA DE USO DEL SUELO PARA EL MUNICIPIO DE TABIO. 51 TABLA 2 CARACTERIZACIÓN Y CLASIFICACIÓN DE LAS VÍAS ................................................ 60 TABLA 3 INFORMACIÓN DE LAS IMÁGENES SATELITALES EN BRUTO ..................................... 64 TABLA 4: CÓDIGOS PARA LAS ZHF ...................................................................................... 67 TABLA 5: CODIFICACIÓN PARA LA VARIABLE NORMA.......................................................... 67 TABLA 6: CODIFICACIÓN VARIABLE DENSIDAD PREDIAL ..................................................... 67 TABLA 7: CODIFICACIÓN VARIABLE VÍAS ............................................................................ 67 TABLA 8: CODIFICACIÓN VARIABLE USO ACTUAL DEL SUELO .............................................. 67 TABLA 9 :CODIFICACIÓN VARIABLE CAPACIDAD USO DEL SUELO ........................................ 67 TABLA 10: CODIFICACIÓN VARIABLE DISPONIBILIDAD DE AGUAS........................................ 68 TABLA 11: VECTOR CATEGORÍA VARIABLES ........................................................................ 73 TABLA 12: VECTOR SUBCATEGORÍA NORMA ........................................................................ 74 TABLA 13: VECTOR SUBCATEGORÍA VÍAS ............................................................................ 74 TABLA 14: VECTOR SUBCATEGORÍA DISPONIBILIDAD DE AGUAS .......................................... 74 TABLA 15: VECTOR SUBCATEGORÍA CAPACIDAD DEL SUELO ............................................... 74 TABLA 16: VECTOR SUBCATEGORÍA USO ACTUAL DEL SUELO .............................................. 74 TABLA 17: VECTOR SUBCATEGORÍA DENSIDAD ................................................................... 75 TABLA 18 TAMAÑOS DE LA MUESTRA .................................................................................. 76 TABLA 19: RESUMEN DE LOS ESTADÍSTICOS DE LOS MODELOS LINEALES. ............................ 83 TABLA 20: COMPARATIVO MODELOS................................................................................... 84 TABLA 21 :APLICABILIDAD DE LOS MODELOS DE REGRESIÓN ............................................. 96 TABLA 22. ADAPTABILIDAD DE LOS MODELOS DE REGRESIÓN ............................................ 97 TABLA 23 APLICABILIDAD Y ADAPTABILIDAD DE LOS MODELOS DE WGP.......................... 97 TABLA 24 APLICABILIDAD Y ADAPTABILIDAD DE LOS MODELOS DE GWR ......................... 98

9


LISTA DE ACRÓNIMOS AHP: Analytic Hierarchy Process (Proceso Analítico Jerárquico). CONPES: Consejo Nacional de Política Económica y Social. DANE: Departamento Administrativo Nacional de Estadística. DIVIPOLA: Sistema de División Político-Administrativa de Colombia. DNP: Departamento Nacional de Planeación. EOT: Esquema de Ordenamiento Territorial. ESRI: Environmental Systems Research Institute (Instituto de Investigación de Sistemas Ambientales) GWR: Geographically Weighted Regression (Regresión Geográficamente Ponderada). IDW: Inverse Distance Weighting (Distancia Inversa Ponderada). IVP: Índice de valoración predial. IDEAM: Instituto de Hidrología, Meteorología y Estudios Ambientales. IGAC: Instituto Geográfico Agustín Codazzi. GMC: Instituto Geográfico Militar y Catastra. MAVAM: Multicriteria Valuation Method (Método de Valuación Multicriterio). MAS: Muestreo Aleatorio Simple. POT: Plan de Ordenamiento Territorial. RAA: Registro Abierto de Avaluadores. RMS: Error Medio Cuadrático SIG: Sistemas de Información Geográfica. SIGAGRO: Sistema de Información Geográfica y Agropecuaria del Ministerio de Agricultura, Ganadería, Acuacultura y Pesca SIGAGRO de Ecuador. SRTM: Shuttle Radar Topography Mission.( Misión topográfica de Radar Shuttle) 10


TGRT: Teoría General de la Renta de la Tierra. VP: Valor Potencial. USDA: United States Department of Agriculture (Departamento de Agricultura de Estados Unidos). USGS: United States Geological Survey (Servicio Geológico de Estados Unidos). WGP: Weighted Goal Programing (Programación de objetivos ponderados). ZHF: Zonas Homogéneas Físicas. ZHG: Zonas Homogéneas Geoeconómicas.

11


1. INTRODUCCIÓN La adecuada valoración masiva de las áreas rurales, especialmente en Colombia, es uno de los elementos esenciales para visibilizar la importancia económica del sector agropecuario. La valoración del recurso suelo también es relevante para procesos actuales del país como la implementación de los acuerdos de paz y la implementación del catastro multipropósito. La metodología de valoración de las zonas rurales adelantada por las entidades territoriales y autoridades catastrales de Colombia han sido las zonas homogéneas, metodología multicriterio que establece el valor comercial de los terrenos de manera masiva, estableciendo Zona Homogéneas Físicas (ZHF) para la clasificación del posible aprovechamiento de los terrenos y, con el sustento de un estudio de mercado inmobiliario o avalúos, define las Zonas Homogéneas Geoeconómicas (ZHG). Sin embargo, en una revisión a detalle de esta metodología se pueden detectar aspectos susceptibles de mejora, como la estimación de los pesos de cada una de las variables en la definición de ZHF y criterios para la unificación que deriva en las ZHG. Si bien existen diferentes metodologías que podrían mejorar la que hoy se aplica en el país, se tiene una limitación de recursos por parte de las entidades, situación que restringe la aplicación de estas metodologías. La presente investigación es una propuesta para el desarrollo de mejoras a la metodología de ZHF y ZHG sin recurrir a un abrupto aumento de recursos. Esto es mediante la aplicación del Analytic Hierarchy Process o Proceso Analítico Jerárquico (AHP por sus siglas en inglés) para definir pesos de participación de las variables, dando una calificación más precisa a las ZHF y permitiendo una mejor aproximación en la formación de ZHG. Para investigar profundamente la aplicación del AHP en la valoración masiva, se exploran propuestas para mejorar las estimaciones masivas de valor de terreno mediante modelación de variables puras, variables logarítmicas y ponderaciones geográficas. Como área de estudio se toma el área rural del municipio de Tabio, Cundinamarca (Colombia), por las características que reúne el municipio en cuanto a topografía, vías, áreas de protección, usos agrícolas tradicionales y de producción intensiva rural; lo cual refleja la diversidad típica del departamento, así como la caracterización propia de los suelos de Colombia.

12


En la primera parte, se realiza una identificación y calificación de las variables formadoras de valor mediante la ponderación de criterios de expertos, variables que pasan a ser cartografiadas, obteniendo de esta manera una zonificación de características, correspondiente a ZHF, con la ventaja de asumir una puntuación a partir de la ya señalada calificación de expertos. Esta misma calificación permite desarrollar de una manera más racional el agrupamiento de zonas con potencial semejante, directamente relacionado con la formación de ZHG. Seguido, se desarrolla una evaluación de 15 modelamientos, en búsqueda de señalar la viabilidad que tienen diferentes formulaciones para explicar el valor del suelo a partir de las variables calificadas mediante el AHP. Posteriormente, se desarrollan los diferentes modelamientos del valor de terreno, es decir, se calcula el valor de terreno que estima cada modelo. La construcción de conclusiones se da a partir de la comparación cuantitativa de los pronósticos de valor de terreno de los modelos planteados frente a los valores de referencia indicados por las ZHG de la autoridad catastral del país. 1.1 PROBLEMA El problema que se aborda en este trabajo va dirigido a la valoración masiva de los terrenos rurales, situación que en el caso colombiano fue abordado hace ya varios años, a partir de la metodología de zonas homogéneas (Castellanos, 2007), donde se plasmaban y superponían las variables formadoras de valor, antiguamente en acetatos y actualmente con ayuda de los Sistemas de Información Geográfica (SIG) sobre la cartografía escala 25,000 o 50,000, para que posteriormente, en una análisis espacial el investigador determinara las zonas de mejores condiciones y pueda definir el valor de los terrenos a partir de puntos de investigación. Esta metodológica que parte de bases multicriterio, es altamente flexible y mejorable con procedimientos adicionales, como es el caso de la aplicación de técnicas multicriterio soportado en el AHP, modelos econométricos de ajuste o el modelamiento por precios hedónicos; metodologías que logran un alto nivel de estimación debido al poder predictivo que tienen (Aznar y Guijarro, 2015). En términos generales, todos los modelos parten conceptualmente de la base que las variables escogidas están geoespacializadas y relacionadas con el precio. Es en este sentido que resulta de gran utilidad para el análisis la incorporación de enfoques espaciales multicriterio dadas las ventajas que ofrecen para el manejo de la información. 13


Gran parte de la problemática que aborda este trabajo, parte del método planteado por el Instituto Geografico Agustin Codazzi (IGAC) en su manual de Zonas Homogeneas, el cual, dado el contexto tecnológico y económico actual, puede ser mejorable en aspectos como ponderación de variables, y métodos de interpolación y pronostico; siendo posible evolucionar hacia técnicas de valoración masiva de mayor precisión, a un costo razonable. 1.2 OBJETIVOS 1.2.1

Objetivo General Explorar alternativas de mejoras en las estimaciones de valoración masiva de terreno mediante métodos multicriterio en la zona rural del municipio de Tabio, Cundinamarca, Colombia.

1.2.2 •

Objetivos Específicos Identificar las variables formadoras de valor en el municipio de Tabio, Cundinamarca.

Evaluar las diferentes técnicas y procedimientos multicriterio para el cálculo del valor de los terrenos enfocándose en la aplicabilidad y adaptación a la valoración masiva.

Comparar cuantitativamente los resultados de los modelos experimentados contra el método de Zonas Homogéneas Geoeconómicas.

1.3 PREGUNTA DE INVESTIGACIÓN ¿Cuáles son las diferencias, ventajas y desventajas que se pueden detectar a partir del caso de estudio del municipio de Tabio - Cundinamarca, en la valoración masiva del suelo mediante la implementación de métodos multicriterio respecto a la metodología de ZHG clásico en Colombia? 1.4 HIPÓTESIS DEL TRABAJO El método de zonas homogéneas es susceptible de complementarse con otras técnicas predictivas o de toma de decisión mejorando los procesos catastrales de valoración. 1.5 JUSTIFICACIÓN La adecuada valoración masiva de los predios rurales en el país coincide con la necesidad de considerar la importancia económica del sector agropecuario, su relevancia para la 14


implementación de los acuerdos de paz y la implementación del catastro multipropósito por parte de las autoridades municipales y nacionales. A continuación, se profundiza en la justificación Técnica, Político-Administrativa, Económica y Social por innovar en la disciplina de la valoración masiva. 1.5.1

Justificación Técnica

Como se ha mencionado anteriormente, en una revisión profunda de la metodología actualmente desarrollada por el IGAC para la construcción de zonas homogéneas, se puede señalar puntos que pueden ser reforzados. En primera medida se puede citar el documento del Consejo Nacional de Política Económica y Social (CONPES) número 3859 del año 2016, en el que se plantean políticas para la adopción e implementación de un catastro multipropósito, siendo una radiografía al desarrollo catastral del país de las últimas dos décadas. En dicho CONPES se dice sobre las ZHF y ZHG que: “Esta metodología de valoración masiva considera aspectos técnicamente válidos, pero evidencia algunas debilidades en cuanto a su aplicación y actualización. Con respecto a su aplicación, la metodología no es flexible en la incorporación de aspectos diferenciadores según la zona del país, ya que no existe un estudio detallado de los determinantes del mercado inmobiliario por región. Esto impide diferenciar la valuación en zonas rurales, perimetrales (rurales con comportamiento urbano y urbanas con comportamiento rural), y zonas especiales (suelos de valor ambiental como ecosistemas de interés estratégico como páramos, humedales, bosques y Sistema Nacional de Áreas Protegidas). Aspecto en el que también se evidencian falencias metodológicas que impactan el nivel de confiabilidad. […] Adicionalmente, no existe una metodología especializada para la valoración de predios conservados ambientalmente, lo que desincentiva la protección o conservación de zonas estratégicas […] porque actualmente es más rentable desarrollar una actividad productiva que conservar terrenos que no tienen ningún valor económico transable” (CONPES, 2016, págs. 22-23) .

La anterior cita indica dos grandes falencias en la metodología actual de la valoración masiva: la poca aplicación que tiene en áreas de alto valor ecosistémico pero bajo valor mercantil, situación que se ha estudiado en la valoración ambiental; y por otra parte se tiene la excesiva generalización que presenta la metodología para estimaciones en todo el país, y es sobre esta segunda falencia que se desarrolla el presente trabajo junto a muchos otros autores que han buscado la innovación de la valoración masiva. 15


Y es importante resaltar que se trata de mejorar un modelo de valoración que ha sido crucial en el desarrollo del catastro hasta el punto en el que se encuentra hoy, como lo indica la Contraloría General de la Republica en el boletín macro sectorial No 10 (2017) sobre el mismo CONPES 3859, anotando que: “El documento CONPES 3859 de 2016 señala que una deficiencia del catastro actual es que este tiene como único propósito el fiscal, lo cual desconoce que los catastros avanzados (Países Bajos, Suiza, Francia, etc.) se iniciaron con un propósito netamente fiscal y después de consolidarlo y de tener claridad jurídica sobre la tenencia de los predios, se destinaron a otros propósitos, como la planificación del territorio. Por lo tanto, no hay que desconocer la importancia del recaudo fiscal en la orientación del catastro, sólo hay que ampliar esta perspectiva de carácter netamente fiscal que se ha establecido por parte de las entidades territoriales, extendiéndola a otros propósitos” (Contraloría de la Republica, 2017, págs. 2-3).

Con esto se resalta la importancia que tiene el periodo actual de transición que se tiene entre el catastro convencional de propósito tributario, frente a la propuesta de catastro multifinalitario. Como punto adicional en esta justificación técnica, se señala una limitación presente en el modelo de zonas homogéneas el cual, si bien se puede considerar como multicriterio al superponer las variables formadoras de valor, lo hace de manera de check list, sin categorizar o ponderar las variables. Es decir, no utiliza un indicador de calificación de condiciones, dado que solo genera una descripción cualitativa de las condiciones y no un “Scoring” o puntuación que permite realizar análisis de sensibilidad. Trabajos como los de Reyna (2016) y del Sistema de Información Geográfica y Agropecuaria del Ministerio de Agricultura, Ganadería, Acuacultura y Pesca SIGAGRO de Ecuador (2008) muestran posibilidades de mejora al incluir las ponderaciones de variables al modelo, ya que esto permite una migración de variable netamente cualitativas, a variables cuantitativas. Esta calificación de variables es muy limitada en la metodología actual, pues simplemente señala una codificación en el orden de importancia que los desarrolladores consideren de las variables, sin tener un criterio de decisión más formal en cuanto a la clasificación de variable y, por ende, la clasificación de zonas de un territorio, que se torna exponencialmente más difícil en cuanto más detallado es el análisis de variables.

16


Trabajos de valoración masiva tanto rural como urbana desarrollados por Matos y Salado (2018); Monzani, Montenegro, Piumetto, Cordoba, y Salomón (2018) y Pardo (2005) muestran la ventaja de trabajar con variables cuantitativas en valoración, específicamente en modelo de regresión lineal, regresión geográficamente ponderada, o métodos geoestadísticos. 1.5.2

Justificación Político-Administrativa

La situación actual del catastro en Colombia se encuentra enmarcado en un atraso sustancial, donde el 66% del catastro en el territorio colombiano se encuentra desactualizado (CONPES, 2019), esto derivado de las políticas de baja inversión en la principal entidad encargada de la formación, actualización y conservación catastral como es el IGAC. Estas falencias del catastro impactan a los municipios y gobiernos locales, ya que las bases de precios e inventarios catastrales tiene una desactualización promedio de 12.2 años (CONPES, 2019). A finales de 2019 y principios del 2020 el estado colombiano ha dado los primeros pasos hacia la implementación del catastro multipropósito, donde se fijan como metas lograr unos avances del 60% para el 2022 y el 100% de actualización para el 2025. Para lo cual en el CONPES 3958 de 2019 se define que la gestión catastral será prestada por los gestores catastrales, los cuales a su vez pueden realizar los procedimientos a través de los operadores catastrales. Es en este punto donde, a través de los SIG, los nuevos métodos de valoración y la implementación de estos, es posible mejorar la precisión de las zonas de valoración masiva, haciendo del catastro multipropósito una herramienta más eficiente que soporte la toma de decisiones de los gobiernos municipales, regionales, departamentales y nacionales. 1.5.3

Justificación Económica

Ahora bien, la tributación ha sido el foco de catastro hasta el presente, y en el desarrollo del catastro multipropósito no se debe perder esta función principal, al contrario, puede ser reforzada dada la importancia de la actividad de recaudo, una de las más sobresalientes fuentes de las arcas locales, no obstante, la valoración masiva deriva en los avalúos base de los inmuebles (denominados avalúos catastrales) y por ende en los cobros de impuestos por finca raíz a los propietarios (denominado impuesto predial unificado). Este recaudo es decisorio en el desarrollo y en la administración pública que los gobiernos municipales frente a la atención de las necesidades de la población.

17


Es evidente entonces que una mayor precisión en la formación de áreas homogéneas de valor conllevara a una valoración estatal de los inmuebles más precisa y a un recaudo fiscal más justo. 1.5.4

Justificación Social.

La metodología colombiana por la cual se clasifican de manera social los inmuebles según sus características físicas y productivas es la estratificación socioeconómica, para las áreas rurales del país, tiene como uno de los principales insumos a las ZHF y ZHG. Es decir, que el desarrollo más preciso de zonas homogéneas repercutiría de manera directa sobre la categorización de los predios de las áreas rurales, clasificación que está directamente ligada al cobro de servicios públicos domiciliarios, así como la asignación de subsidios y el cobro de contribuciones de estos, además de orientar la inversión del gasto público. Una formación más precisa de ZHF y ZHG tendrá como consecuencia en el mediano plazo una estratificación más justa, haciendo cobros, subsidios y contribuciones más racionales a la población, y contribuyendo a una inversión más eficiente de los recursos gubernamentales. 1.6 ALCANCES 1.6.1

Alcance Temático

El presente trabajo se enfoca a la realización de un análisis comparativo entre la definición de los valores de terreno a partir de las técnicas de valoración masiva aplicando métodos multicriterio que den peso ponderado a las variables mediante un proceso de AHP y el método de zonas homogéneas que es actualmente usado para la valoración masiva en Colombia. Se busca mejorar el procedimiento, ofreciendo así una metodología más eficiente y de posible manejo para las entidades que ejerzan actividades de gestión catastral, gestión predial para obras del estado y en general valoración masiva de terrenos rurales. El grado de análisis que se desarrolla es profundo, pues se despliega la propuesta de mejora de valoración hasta la estimación de valores de terreno, es decir, se llega a establecer los resultados aplicables del método. Para el manejo de información espacial, se trabajó con escala 1:20,000, cobertura propicia para el cubrimiento y representación del municipio de Tabio, anotando que esta escala deriva de la información espacial de los insumos.

18


Los beneficios de mejora se concentran en un menor margen de error en la formación de ZHG. Es importante señalar que la precisión espacial de las zonas seguirá dependiendo de la información base, es decir, del levantamiento de la información de las variables formadoras de valor, sin embargo, la propuesta aquí presentada busca mejorar la agrupación de zonas físicas, el número de muestras necesarias y la estimación de los valores comerciales. Como se mencionó anteriormente, la nueva legislación colombiana impulsara los procesos de actualización catastral, proyectada inicialmente a ser ejecutada únicamente por el IGAC pero posteriormente se dio la posibilidad de que también sea cedida a los gestores catastrales, correspondientes a una o varias unidades territoriales (municipios, áreas metropolitanas, etc.), las cuales pueden autónomamente realizar los procesos catastrales o contratar a empresas privadas que cuenten con la capacidad técnica y tecnológica para realizar estas tareas, estando siempre bajo el seguimiento de protocolos definidos por el IGAC. En este sentido, la búsqueda de procesos de análisis geográfico que sean más certeros en la conformación de los valores comerciales de los terrenos ayuda no solo a las entidades públicas sino también a las empresas privadas. 1.6.2

Alcance Espacial

El área de estudio del presente trabajo es la zona rural del municipio de Tabio, Cundinamarca (Colombia). La decisión de tratar únicamente el área rural se establece a partir de la diferencia sustancial que presenta el suelo rural frente al suelo urbano, esto en cuanto a las actividades productivas, normativa, calidad de vida, entre otras variables que influyen en su valoración, tal como lo indica la teoría clásica de la renta del suelo. 1.7 Alcance Temporal La información económica disponible para la zona de estudio corresponde a avalúos y estudios de mercado llevados a cabo en el año 2020.

19


2

REVISIÓN DE LITERATURA

2.1 MARCO TEÓRICO Es bien conocido que la corriente de pensamiento racionalista positiva ha sido el paradigma del conocimiento en la actualidad. Lo que socialmente se acepta (mayoritariamente) como descripción de la realidad es producto del razonamiento soportado en el método científico. En este sentido, la valoración masiva de terreno se desprende del concepto de valor del suelo, termino definido de diferentes maneras por autores y corrientes de pensamiento, pero globalmente el valor del suelo es entendido como la estimación de los montos monetarios por los que se podría transar la propiedad privada de la superficie terrestre en condiciones normales de mercado (Llano Elcid, 2007). La valoración del suelo no es la excepción al paradigma científico de la sociedad, pues busca soportar esta estimación en argumentos racionales. Sin embargo, la valoración del suelo presenta puntos de vista que inclusive en la actualidad son discutidos y reinterpretados, dada la naturaleza compleja del aprovechamiento del territorio, haciendo que las teorías del valor del suelo y las técnicas de valoración se encuentre en constante reconstrucción. Entre esto, se puede tener como punto de partida la Teoría General de la Renta de la Tierra (TGRT) de Marx, una de las bases teóricas más fuertes en la valoración del suelo. Sin entrar en detalles conceptuales, se puede revisar los aportes de Samuel Jaramillo a la TGRT, que, con enfoque Marxista, da un valioso aporte académico con su obra Hacia una Teoría de la renta del Suelo Urbano, aclarando nociones fundamentales y reformulando algos aspectos de la teoría de Marx, (Parias, 2010). En dicha obra, los dos primeros capítulos exponen el caso de los terrenos rurales, de interés en este trabajo, ya que ayudan a comprender las variables formadoras de valor. Vale señalar que la teoría Neoclásica “ha desarrollado una larga reflexión que intenta aprehender la dinámica de los precios del suelo […] a partir de las opciones de los individuos en el mercado” (Jaramillo, 1994, pág. XIX), es decir, la corriente neoclásica señala las dinámicas de oferta y demanda como principales definidores del valor del suelo o en otras palabras, se restringe como “una apología del mercado” para explicar el valor del suelo (Parias, 2010).

20


A diferencia de lo anterior, la TGRT busca identificar la manera en la que a partir de la Teoría del Valor se llega a los precios del suelo, o en una idea más global, busca “interpretar la existencia social de la propiedad territorial en el capitalismo” (Jaramillo, 1994, pág. 32). Se señala entonces que el precio del suelo se origina en la renta, es decir, el cobro que hace el terrateniente propietario del terreno al inversor capitalista, que produce y comercializa un producto, generando una plusvalía, de la cual se sustrae la ganancia media del mercado para el capitalista inversionista y lo restante es percibido como renta por parte del terrateniente. Se resalta que esto es apenas un comentario del andamiaje teórico de Marx y Jaramillo. También vale resaltar las diferentes modalidades de la renta señalada por los autores para el sector agrícola, tales como la Renta Diferencial o Ricardiana, basadas en las diferentes características productivas de los suelos, beneficiando la producción que tenga lugar en los mejores terrenos. Por otra parte, se tienen la Rentas de Localización o de Von Thünen, en función de las distancias a los centros de acopio y ligada a los costos de trasporte. Adicionalmente, la Renta Absoluta, ligada a la mera propiedad del terreno en referencia al impacto en el mercado que tendría el retiro de estos suelos de las actividades productivas; y la Renta de Monopolio, como la mayor generación de plusvalía en la producción al tratarse de terrenos especialmente buenos y escasos (Jaramillo, 1994). Es entonces en este punto donde es posible relacionar geográficamente esa renta, a partir de variables geográficas que se enfoquen en contener las rentas definidas por Marx y Jaramillo. Si bien no es indispensable manejar los conceptos de la teoría de Marx o los ajustes señalados por Jaramillo para la lectura del presente trabajo, si se resalta la importancia de las bases teóricas y su dominio para una mejor comprensión general de la valoración del suelo y como estas se transforman en variables geográficas. Los desarrollos teóricos y prácticos por el ejercicio de la valoración hacen parte de las ciencias económicas, pero requieren de un pleno conocimiento del aprovechamiento y la productividad del recurso suelo, condiciones sujetas a la administración política que tenga el territorio (Pérez, 2015) . Como se indicó anteriormente, la valoración del suelo depende estructuralmente de la propiedad privada (que en el caso colombiano se consagra en el artículo 58 de la constitución política) pero la regulación de los precios depende del mercado, que a su vez es influenciado por actuaciones de tipo político. En cuanto a la valoración masiva, se tienen propuestas como los mapas de isovalores, que se relacionan a la escuela neoclásica, pues es la proyección de valores a partir de los datos 21


de mercado inmobiliario, es decir, el valor explicado únicamente a partir del mercado, para lo cual es muy común utilizar técnicas de interpolación como el Inverse Distance Weighting Ponderación de Distancia Inversa (IDW) y Kriging. Estas metodologías tienen críticas al no tener en cuenta las limitantes geográficas y delimitaciones político administrativos, cruciales en la valoración (Castellanos, 2007). Por otra parte, se tiene el desarrollo de la base conceptual de lo que hoy se denomina ZHF y ZHG; metodología que se desarrolla con la selección de variables formadoras de valor, cartografiadas y analizadas que, junto a un análisis económico, pronostica de manera masiva los valores de los inmuebles (Castellanos, 2007). 2.2 MARCO HISTÓRICO Repasando la aplicación de metodologías de valoración masiva y su regulación en la legislación colombiana, se tiene como punto de partida del catastro el año de 1930, con la Misión Kemmerer, que buscaba modernizar el catastro y la tributación en Colombia, haciendo del catastro una actividad de competencia nacional con un marcado enfoque fiscal. En 1935 se da un avance institucional al definir la “declaración del valor de los bienes raíces por parte del propietario o, en su defecto, la estimación por parte del funcionario de catastro” (Ebra, 2008, pág. 131). En ese mismo año se creó el Instituto Geográfico Militar y Catastral (IGMC), como entidad militar dedicada a los levantamientos catastrales, institución que tendría un aumento en sus responsabilidades en 1939 pues se encargaría de determinar los factores para la formación de avalúos de inmuebles. En 1957 pasa a ser el IGAC, siendo desde entonces una institución civil (Ebra, 2008). En la década de los años ochenta el IGAC define una metodología de ZHF y ZHG, con una serie de instructivos publicados en 1987, dándole fuerza normativa un año más tarde con la Resolución 2555 de 1988, con la que se comenzó a utilizar esta metodología para la determinación de los valores de los terrenos urbanos y rurales, con el fin de establecer la base sobre las cuales liquidaba el impuesto a las propiedades (Castellanos, 2007; Muñoz Mora y Cardona Jaramillo, 2013). Esta última norma fue derogada por la resolución 70 de 2011, en el que se establece la definición actual de ZHF y ZHG. En mayo de 2017 se expide la versión vigente de la metodología para la formación de ZHF y ZHG (IGAC, 2011). El campo de la valoración masiva está en desarrollo, con constantes propuesta de múltiples autores en cuanto a la valoración de casos puntuales como las áreas de protección y de 22


importancia medioambiental, así como el uso de técnicas y nuevos enfoques de determinación de variables formadoras de valor del suelo en un sentido más amplio. 2.3 MARCO METODOLÓGICO Como ya se señaló, la metodología de zonas homogéneas, según Castellanos (2007), comienza a aplicarse en Colombia como un método de valoración masiva en el año 1983, cuando por efectos de la expedición de la Ley 14 de 1983 (Congreso de la Republica de Colombia, 1983), se buscaba modificar el sistema catastral con el fin de fortalecer a los fiscos municipales, los cuales para la época sufrían de un déficit importante, derivado en parte por la crisis financiera de los años 80 que sacudió a América Latina, que se sumaba a la desactualización del catastro Colombiano que según Castellanos (2007), tenía una desactualización de 8 años o más. La metodología por la cual se realizaban estimaciones masivas de terreno en aquel entonces correspondía a las curvas de isoprecios, las cuales se obtenían a partir de realizar una muestra para el municipio. Dado que estos precios encontrados hacían referencia a las condiciones propias de los inmuebles muestreados, era necesario llevarlos a las condiciones predominantes de los suelos del municipio por medio de coeficientes. Los más comunes eran la explotación, tamaño y de clase de tierras, el cual hacía referencia a una clasificación de tierras por capacidad productiva y tenía en cuenta los estudios agrologicos previos con que se contara (Borrero, 2005). Después de esta homogenización se creaban las curvas que unían puntos con igual valor. Para saber el valor de un predio se tomaba el valor que la curva de isoprecios arrojaba y se multiplicaba nuevamente de regreso por los coeficientes. El problema recaía en el cálculo de dichos coeficientes y la selección de estos. Las curvas de isoprecios consideran un espacio continuo, lo cual es aplicable cuando las condiciones no presentan una alta variabilidad, pero cuando existe una condición que rompen drásticamente los valores el espacio las curvas de isoprecios no resaltan estas variabilidades. Por lo anterior, fue necesario plantear una nueva metodología para el cálculo que permitiese reducir tiempos y costos en la formación catastral, además de que fuese de fácil compresión y aplicación, con lo cual no se requería de personal altamente calificado.

23


Es así como a partir de la teoría de la formación de precios del suelo, con base en las rentas y de una mirada global del territorio, se formulan las características de una zona que a su vez están relacionadas con la definición de valor. Como bien lo menciona Castellanos (2007) a pesar de la aparente sencillez del método de elaboración de las zonas homogéneas, la carencia de información tanto cartográfica como de estudios previos que existía para la época, hizo necesario realizar generalizaciones en la información o excluir variables relevantes que resultaban de difícil medición en ese momento. Otra condición importante es que el modelo se apoya en datos de mercado o muestra para la determinación de los valores de cada zona obtenida, condición a la que ya desde los modelos de isoprecios estaba acostumbrado el investigador y los cuales eran obtenidos a partir de avalúos. Con la evolución de los sistemas informáticos, los sistemas de información geografía y el internet en los años 1990 y 2000 se ha facilitado el manejo de información espacial. La precisión en la espacialización de variables ha aumentado gracias a la incorporación de análisis geográficos a partir de imágenes de satélite para la definición de los usos y coberturas, extracción y clasificación de vías, modelos digitales de terreno para el caso de topografía o análisis de clasificación de tierras con fines catastrales, o la digitalización de los estudios generales y detallados de suelos o en general involucrar más variables al modelo (Hidalgo, 1993). En cuanto a la formación de zonas homogéneas, se podrían clasificar como un método multicriterio, ya que se basa en la combinación de variables como vías, suelos, topografía, disponibilidad de aguas, norma de uso del suelo, ente otras; pero a través del tiempo no se ha resuelto la problemática que supone darle peso a las variables, como lo demuestra la última revisión de la metodología de zonas homogéneas físicas (IGAC, 2017), donde no se vincula puntaje alguno de las variables, sino que a cada zona física resultante con características similares de acuerdo al estudio de variables realizado se le asigna un código en números arábigos de dos dígitos en orden ascendente desde 01 hasta 99 de manera consecutiva sin saltos de numeración. La zona 01 será la que reúne las mejores condiciones agronómicas de acuerdo con las áreas homogéneas de tierra, norma de uso del suelo, uso actual del suelo, influencia de las vías y disponibilidad de aguas superficiales permanentes.

24


La zona 02, la que sigue en importancia y así sucesivamente (IGAC, 2017), siendo a criterio de investigado la ordenación de variables y zonas físicas. Con las mejoras en los levantamientos de variables, la cartografía se vuelve cada vez más precisa, logrando mayor detalle y reduciendo las generalizaciones (Hidalgo, 1993). Sin embargo, la precisión introducida en las variables refleja una microzonificación derivada de la sobreposición de las variables, las cuales, por el efecto multiplicativo aumentan el número de zonas y con ello el número necesario de muestras o avalúos. Se considera, por ejemplo, un análisis espacial con 2 variables, Vías (Buenas y Malas) y Aguas (Suficientes y Escasa), de las que matemáticamente resultarían 4 zonas, las cuales se debe muestrear cada una para averiguar su valor. Pero si como investigadores se decide aumentar la precisión de las variables, incrementado a 3 las categorías y adicionalmente agregando la variable pendiente, las zonas posibles se aumentan a (3x3x3) 27, áreas que se debe muestrear, lo cual supone un esfuerzo mayor. Algunas mejoras al problema del muestreo y a la ponderación son señaladas por el Ministerio de Agricultura, Ganadería y Acuacultura y Pesca de Ecuador en su Propuesta de Metodología de Valoración de tierras Rurales del año 2008 (SIGAGRO, 2008), el cual tiene como premisa el considera el territorio rural como fuente de riqueza, por lo que su propuesta se centra en las variables y procesos para la obtención de los valores reales del territorio. Este análisis contempla las siguientes variables: Aptitud agropecuaria y forestal, Susceptibilidad a movimientos en masa, Peligro volcánico, Susceptibilidad a erosión, Susceptibilidad a inundación, Susceptibilidad a heladas, Tendencia a las crecidas, Necesidad de riego, Conservación de la cuenca hidrográfica, Integridad de paisaje, Demanda sobre el recurso tierra, Accesibilidad vial, Accesibilidad a servicios sociales, Disponibilidad de servicios básicos y Accesibilidad al área urbana; las mismas que se agruparon en cuatro Unidades Estructurales: Biogeoestructural, Tecnoestructural, Hidroestructural y Ambiental. Este documento es un fuerte referente en Latinoamérica ya que realiza un compendio sobre el geoprocesamiento para la obtención de cada variable, así como la estructuración de la base de datos y los cálculos respectivos. Este modelo de valoración (SIGAGRO, 2008), también multicriterio y multiobjetivo, a diferencia de las zonas homogéneas del IGAC, vincula unos pesos para cada una de las variables. El documento en su página 29, menciona que para la asignación de pesos se considera una escala de los enteros positivos, debido a que es necesario una correlación serial 25


entre variables. La asignación de pesos resultó del consenso de profesionales con experiencia en el tratamiento de cada una de las variables. En algunos casos se probó valores una y otra vez hasta obtener una ponderación que permita reflejar la realidad. El resultado fue la asignación de pesos de la forma 2 a la n-esima potencia (2, 4, 8, 16, 32, 64, 128, 256, etc.) sin que resulte claro la forma de asignación. En un desarrollo más abierto de la ponderación de variables, Reyna (2016) en el trabajo de grado titulado “Modelamiento de un sistema de valoración multicriterio del suelo para catastro rural empleando el Proceso Analítico Jerárquico”, muestra un ejercicio aplicativo de la metodología de AHP a la valoración de 37 predios de la Comunidad del Marco, para lo cual toma 8 variables explicativas. Para la determinación de los pesos, lo cual es fundamental para el modelo AHP, utiliza la encuesta a 3 expertos diferentes. El anterior trabajo se fundamenta en los estudios realizados por Aznar y Guijarro (2015), los cuales desarrollan una manera de ponderación de las variables utilizadas en valoración de inmuebles para poder realizar un análisis de sensibilidad completo en un modelo multicriterio. Esto último en respuesta a la principal falencia de los modelos de valoración de tierras: la posibilidad de contener un gran número de variables cualitativas, las cuales suponen una dificultada matemática para su manejo. Por otra parte, el crecimiento de datos de ofertas comerciales o de inmuebles que se oferten para la venta, además del acceso a los mismos, ha aumentado, gracias a la proliferación de portales inmobiliarios donde se realizan un gran número de publicaciones, lo cual permite organizar una base de datos más robusta y depurada. Sin embargo, este mayor número de ofertas disponibles se concentran en las zonas urbanas, mientras que para la parte rural la disponibilidad de ofertas sigue siendo escasa. Como ejemplo de lo anterior, en una revisión para julio de 2020 el portal Finca Raíz presenta una contabilización de 17,775 inmuebles rurales en venta para todo Colombia, contra 215,441 inmuebles urbanos, es decir, que el 92% de las publicaciones de venta de inmuebles en el portal web son urbanas. Esto conlleva a que, si bien se puede modelar espacialmente un buen número de variables, para las zonas rurales, los análisis se ven restringidos por los datos con que se cuente, dadas las significancias estadísticas. Teniendo una mayor disponibilidad de datos, autores como Pardo (2005) aplican métodos econométricos, específicamente modelos Box Cox no restringido, y un modelo de precios 26


hedónicos para realizar la valoración económica de predios agropecuarios en paisajes de lomerío, utilizando cerca de 391 muestras de predios. Otro caso como el de Monzani, et al (2018) aplican técnicas de Kriging con regresión para estimar a nivel masivo el valor de los terrenos en la zona urbana de Rico Cuarto, utilizando 283 datos para el estudio. Según Mora (2008), los métodos de predicción más utilizados en valoración masiva son: redes neuronales, análisis de multinivel, coeficientes de variación espacial, regresiones con pesos geográficos, métodos geoestadísticos, entre otros. Algunas de estas técnicas incorporan la información espacial en el análisis; otras, las relaciones no lineales. Se denota que la aplicación de estos métodos requiere de mayores recursos tanto técnicos (personal especializado), de información (requieren más datos), de tiempo (los análisis requieren mayor tiempo de procesamiento), así como un análisis detallado de las variables y su comportamiento espacial. Si bien es completamente posible desde la teoría disponer de estos insumos, se tienen limitaciones en la disposición de inversiones. La generación de información base, lo devengado por personal especializado, la infraestructura necesaria, los tiempos y la toma de muestras (con avalúos); demandan una cantidad de recursos importantes que puede no estar disponibles. Es por lo anterior que las propuestas de mejora al método de zonas homogéneas del IGAC debe mantener un equilibrio costo-beneficio dadas las limitaciones de presupuesto que tiene la entidad. A pesar de lo anterior, la problemática política, social y económica, especialmente en el área rural del país, según lo señalan Molina y Barreto (2018) generó la necesidad de tener un inventario de inmuebles al igual que el valor de cada uno de ellos, con el fin de ampliar la finalidad netamente fiscal que tenía el catastro hasta ese momento, bajo esta premisa, se hace necesario actualizar la información en términos de uso, ubicación, valor y ocupación, con el fin de formar un catastro mucho más integral. Para lograr los objetivos propuestos, la revisión de la literatura se profundiza tanto en el modelo de cálculo actual que utiliza el país (ZHF y ZHG), así como en los modelos matemáticos que han sido adaptados para la valoración masiva en países como España y Estados Unidos. Igualmente revisando las diferentes revistas científicas donde plantean modelos alternos o técnicas mixtas. A continuación, se enlistan y analizan algunas de las principales.

27


2.3.1

Métodos Multicriterio

2.3.1.1

Metodología Convencional de Formación de Zonas Homogéneas

Esta metodología ha sido formulada por el Instituto Geográfico Agustín Codazzi mediante la Resolución 070 del 4 de febrero del 2011, Por la cual se reglamenta técnicamente la formación catastral, la actualización de la formación catastral y la conservación catastral; el Artículo 51 define las ZHF como espacios geográficos con características similares en cuanto a vías, topografía, servicios públicos, uso actual del suelo, norma de uso del suelo, tipificación de las construcciones y/o edificaciones, áreas homogéneas de tierra, disponibilidad de aguas superficiales permanentes u otras variables que permitan diferenciar estas áreas de las adyacentes; por otra parte, en el Artículo 52 se definen las ZHG como los espacios geográficos determinados a partir de ZHF con valores unitarios similares en cuanto a su precio, según las condiciones del mercado inmobiliario (IGAC, 2011). Con el fin de estandarizar la construcción de las zonas, el IGAC emitió el manual donde se especifica la metodología para la elaboración del estudio de ZHF y ZHG para las áreas urbanas y rurales y la determinación del valor unitario por tipo de construcción (IGAC, 2017). Una vez definidas las variables generadoras de valor y estas han sido cartografiadas, la técnica de zonas homogéneas goza de ser bastante sencilla tanto en el tratamiento de la información espacial como en los procesos estadísticos, pues se basa en un proceso simple de superposición de las variables formadoras de valor, dividiendo el territorio en una seria de polígonos, para luego espacializar los datos de mercado inmobiliario encontrado. Sin embargo, esa aparente facilidad se torna adversa en el momento de determinar los agrupamientos de polígonos donde se pude considerar que el valor es homogéneo, pues se basa en un orden incierto de zonas físicas a partir de la experticia del investigador. La relativa simpleza de no definir peso ponderado (o de asumir un mismo peso) para las variables formadoras de valor conlleva una mayor incertidumbre en el proceso de formación de ZHG, restringe su precisión. 2.3.1.1.1

Elaboración de ZHF (IGAC)

De acuerdo con la metodología planteada por el IGAC en el manual de elaboración del estudio de zonas físicas y geoeconómicas se contemplan las etapas y actividades para la realización de las zonas (IGAC, 2017).

28


Para la elaboración de ZHF según el IGAC se debe hacer la recolección de las variables físicas que se determinen en la etapa preliminar de los estudios, el IGAC recomienda las siguientes variables físicas para las zonas rurales: •

Áreas Homogéneas de Tierra: la cual se define como espacios de la superficie terrestre que presentan características o cualidades similares en cuanto a las condiciones de clima, relieve, material litológico superficial o depósitos superficiales y de las características internas de los suelos, condiciones que expresan la capacidad productiva de las tierras lo que se representa mediante un valor numérico denominado Valor Potencial (VP), esta variable dimensiona las mismas características que contiene la clasificación agrológica del Departamento de Agricultura de Estados Unidos (USDA), por lo que el uso de una u otra clasificación no genera ningún tipo de diferencias cartográficas a la hora de categorizar el terreno, por tanto se considera igualmente válido utilizar la clasificación USDA que es utilizada en el presente trabajo.

Norma de uso del Suelo: Son los usos permitidos por la secretaria de planeación municipal de Tabio, los cuales determinan las rentas que generará cada terreno de acuerdo con las actividades que se realicen en él, se considera una de las variables de mayor importancia.

Uso actual del suelo: Define las actividades que se llevan a cabo en el terreno. Esta variable puede ir en contravención de la variable anterior lo cual se conoce como un conflicto de uso del suelo y se da porque lo suelos por sus capacidades pueden ser mejor aprovechados en una actividad determinada, sin embargo, se desarrolla una distinta.

Influencia de las vías: Tener acceso desde las vías principales del municipio es muy relevante ya que minimiza los costos de transporte de los productos que se puedan generar en cada uno de los predios.

Disponibilidad de aguas superficiales permanentes: El agua es de vital importancia en los procesos productivos en las áreas rurales y ya sea mediante un acueducto veredal o cuerpos de agua naturales, el contar con alguna de estas situaciones eleva la demanda de un inmueble, razón por la cual esta variable se hace importante.

29


2.3.1.1.2

Elaboración de ZHG (IGAC)

Los insumos iniciales para la elaboración de ZHG son las ZHF las cuales representarían los polígonos de las zonas que tienen las mismas características de aquellas variables que se considera tienen un efecto en el valor del terreno (IGAC, 2017). Sin embargo, éstas no son suficientes para estimar el valor, por lo que se debe realizar una toma de puntos de investigación en los que se tomarán ofertas de mercado y así se exprese las dinámicas económicas actuales en las transacciones de los inmuebles y se determine una espacialización de valores la cual servirá como referencia y para estimar el valor de cada una de las zonas geoeconómicas. Para la estimación de valor de las zonas se toman los puntos que investigación que se encuentren dentro de la misma zona física y se establece una tabla de estadísticas donde se capturen el valor promedio, la desviación estándar y el coeficiente de variación de los datos encontrados y con ellos se establece un valor para la zona el cual no puede tener una variación mayor a la del coeficiente de variación con respecto al valor medio. En ningún caso el coeficiente de variación puede ser mayor al 7.5%, en consonancia con la legislación colombiana de avalúos, específicamente en la Resolución 620 de 2008, IGAC. 2.3.1.2

Proceso Analítico Jerárquico

Como fuente principal para la realización de este trabajo se parte del desarrollo llevado a cabo por el profesor Thomas L. Saaty (1980), como respuesta a los problemas concretos de toma de decisiones en el Departamento de Defensa de los EE. UU., donde se crea el Proceso Analítico Jerárquico (Analytic Hierarchy Process, AHP), considerado actualmente como un clásico en el mundo para la toma de decisiones con cierto grado de complejidad. Esta metodología propone como primera medida, descomponer el Problema de Decisión en una jerarquía de elementos interrelacionados, identificando: 1. La Meta General 2. Los Criterios 3. Las Alternativas Posibles La aplicación del AHP tiene como ventaja la simplicidad en su construcción, permite realizar mediciones de factores tanto subjetivos como objetivos a partir de estimaciones numéricas, verbales o gráficas, lo cual le provee una gran flexibilidad, permitiendo de esta manera la 30


utilización de variables espaciales y la aplicación a los temas geográficos, también se caracteriza por ser adaptable a las decisiones individuales y en grupo dada la posibilidad de realizar la agregación de preferencias de un grupo homogéneo de expertos o la agregación de juicios individuales, lo que demuestra que su funcionamiento está orientado al consenso de los expertos. Este método es adaptado a la valoración (Aznar y Guijarro, 2015), partiendo de la base de tener varios activos comparables a él bien objeto de valoración (ejemplo 4 fincas rurales de tamaño similar, uso y fertilidad comparable a una finca de la cual se pretende encontrar su valor). Estos activos y el bien objeto de valoración entrarán al Modelo AHP como las alternativas y, por otra parte, las variables explicativas del precio (área, topografía, fertilidad, disponibilidad de vías, etc.) serán tomados como los criterios de comparación. Como se observa en los trabajos realizados por anteriores autores, dichas valoraciones se enfocan en realizar una valoración puntual, de un bien a partir de varios comparables de mercado (Aznar y Guijarro, 2015), situación que puede también adaptase al proceso de valoración masiva, es decir extrapolar los valores. En principio se espera lograr extrapolar espacialmente los valores de terreno a partir del análisis de los referentes de mercado y sus características espaciales que dan valor a los terrenos. En consideración a las Zonas homogéneas físicas y geoeconómicas, este método permite transformar variables cualitativas en variables cuantitativas, encontrado de esta manera un índice o vector de ponderación que le permite al investigador relacionarlo geográficamente con zonas de mejores o peores condiciones, y estas a su vez se pueden relacionar con los datos de mercado encontrados. El pasar de variables cualitativas a cuantitativas permite el tratamiento estadístico de los datos de mercado recolectados y asociarlos a características espaciales. Ahora bien, como mencionan Aznar y Guijarro (2015) el AHP presenta inconvenientes importantes que vale la pena mencionar y tener en cuenta. Uno de los más significativos es el problema de cambio de rango, el cual consiste en la posibilidad de cambio de la ordenación inicial obtenida para las alternativas consideradas, al añadir o eliminar alguna alternativa “irrelevante” (copia o cuasi-copia), es decir, el modelo es muy sensible al cambio de variables o criterios. La justificación de la independencia exigida en la modelización 31


jerárquica, nace del supuesto de que cada uno de los criterios bajo los cuales se evalúan las alternativas son independientes y no tienen incidencia sobre el otro, sin embargo existen casos donde una alta ponderación de algún criterio influya sobre una alta ponderación de otro, esta condición es resuelta por el profesor Saaty a partir del proceso Analítico Jerárquico en Red, sin embargo, este posee una mayor complejidad en su formulación, no obstante como investigadores se debe garantizar en la formulación de los criterios la independencia de los mismos. Otra de las detracciones que existe sobre el AHP tiene que ver sobre la escala fundamental usada para expresar los juicios relativos a las comparaciones pareadas, dado que los resultados varían si se realiza un cambio de escala, la misma es considerada como un dogma dentro de la formulación del modelo, aunque, de acuerdo con lo expuesto por Aznar y Guijarro (2015, pág. 126): El origen de la escala propuesta por Saaty está en los trabajos de Weber y Fechner. La Ley de Weber (1846) dice que el cerebro humano percibe una modificación o cambio en un estímulo a partir de que este estimulo supere el estado inicial en un porcentaje determinado. En 1860, Fechner basándose en las teorías de Weber establece que mientras los estímulos crecen geométricamente, las sensaciones lo hacen aritméticamente y plantea una escala fundamental del 1 al 9. Esta escala además al no considerar el cero y el infinito eliminan los dos puntos de mayor complejidad para el ser humano en procesos comparativos, así como se adapta a la forma más elemental de contar que son los dedos. Por otra parte, la validez de esta escala ha sido comprobada empíricamente aplicándola a situaciones muy diversas en situaciones reales. Otra crítica al modelo tiene que ver con la interpretación de las prioridades totales obtenidas en el procedimiento, dado que la misma es adimensional, por consiguiente, no es claro que una ponderación por ejemplo de 20 para la alternativa 1 contra una ponderación de 10 de la alternativa 2, signifique que la alternativa 1 es doblemente mejor que la alternativa 2; por lo que se debe tener especial cuidado, dado que los investigadores están muy familiarizados a los modelos de regresión lineal o modelos multivariados lo que puede llevar a confusiones en la interpretación de resultados obtenidos por el modelo AHP. Por último, autores como Jiménez en el proceso analítico jerárquico (AHP) Fundamentos, metodología y Aplicaciones (2001), se han referido al cuidado que debe tenerse al trabajar 32


con un número elevado de variables, para lo cual es recomendable agregar criterios en “metacriterios”, o sencillamente simplificar los criterios de selección que no se consideren relevantes. Por otra parte, dado que la formulación jerárquica del modelo depende a su vez de los juicios dados por expertos, la capacidad humana de diferenciar decae con relación al número de alternativas o posibilidades que sean presentadas, para la elección del número de variables o agrupaciones se recomienda un valor cercano al número mágico de Miller 7+-2 (Miller, 1956). 2.3.1.3

Weighted Goal Programming (WGP)

Es una extensión de la programación lineal y parte de la base que el decisor ante la dificultad de alcanzar unos objetivos determinados opta por acercarse lo más posible a las metas fijadas, minimizando las variables de desviación máxima y mínima que se fijan en el modelo. Se enmarca en las técnicas que buscan la satisfacción que no necesariamente es la optimización, puesto que, por lo general los objetivos están en conflicto ente si (Aznar y Guijarro, 2015). Para este método existen varios enfoques, cuando se persigue minimizar la suma ponderada de las desviaciones a cada una de las metas se denomina Programación por metas ponderadas. Por otra parte, es denominado Programación por metas Min Max cuando se pretende minimizar la desviación máxima y por último se denomina la programación por metas extendido cuando se ejecuta tanto la minimización de la desviación máxima, como la minimización de la suma ponderada de cada una de las metas (Aznar y Guijarro, 2015). En cada uno de los 3 casos se obtiene una ecuación que cumple con las restricciones impuestas y se utiliza en la valoración masiva como ecuación de pronóstico del modelo. Este método requiere del conocimiento de paquetes estadísticos especiales, de los cuales (Aznar y Guijarro, 2015), muestran el procedimiento a través del software LINGO, sin embargo, para el presente trabajo se ha utilizado los paquetes estadísticos de R para llevar a cabo el desarrollo del algebra. 2.3.2

Aplicación de los Métodos de Regresión a la Valoración.

Parten de la base del precio de los terrenos puede ser explicado a través de una amplia gama de factores que afectan al precio del bien, autores como (Ballestero Pareja, 1994) aborda el tema desde los modelos de regresión aplicados a modelación de capitalización de rentas, donde estimaba los valores de mercado, partiendo de muestras de fincas, para las que se han 33


investigado el precios de mercado ( variable endógena) y diversas variables exógenas (renta, externalidades, riesgo) otros como (Muñoz Mora y Cardona Jaramillo, 2013) le dan una especial relevancia los modelos de precios hedónicos y resaltan los trabajos de (Rosen, 1974) quien estableció las bases teóricas incorporando el método dentro del marco conceptual de la teoría económica neoclásica (Donoso y Vicente, 2001). El modelo de Rosen asume que el precio de un predio rural puede estar determinado por dos componentes: un vector de n características mercadeables y no-mercadeables Z, donde Z = (Z1, Z2, … , Zn), asociadas a las características propias del bien; y un vector de características exteriores A, donde A = (A1, A2, … , An), que incluyen aspectos como la calidad del aire, localización, ruido, características visuales, entre otros. Así, la función hedónica para el precio del predio rural estará dada por P = P(Z, A). Investigaciones como las de Pardo (2005) muestran como la localización del bien inmueble es el valor fundamental y de máxima influencia; de hecho, son muchos los factores determinantes que influyen en la formación de precios del bien inmueble: tipo, calidad y nivel de los elementos físicos, de entorno y estéticos; la presencia de bienes y servicios públicos; las políticas de los gobiernos locales (impuestos e incentivos fiscales); las interacciones sociales (Cervelló, 2008), entre otros. El investigador debe construir una base de datos que englobe las características, tomando variables como influencia de vías, tipo de vías del sector, disponibilidad de escuelas, hospitales, colegios, servicios públicos, tiempo de distancia a polos de desarrollo, zonas de comercio agrupado o zonas de trabajo (sectores empresariales) (Cervelló, 2008). Desde el punto de vista de los SIG es posible geoespacializar algunas de las variables con las que el modelo va a trabajar. (Cadena Cepeda, 2001). Siguiendo con el método, es necesario realizar el análisis de regresión y cumplir con los supuestos del modelo como lo son homocedasticidad, normalidad en los errores, no correlación en los errores y correcta especificación del modelo (Gujarati, 2009); lo anterior involucra un trabajo personal con conocimientos estadísticos. Por otra parte, este tipo de modelos presenta problemas cuando en la zona de estudio no se cuentan con suficientes datos para que el modelo sea significativo, pues se debe comenzar a excluir variables que consumen grados de libertad e invertir recursos en la consecución de la información (Gujarati, 2009).

34


2.3.2.1

Regresión Simple

Regresión simple hace referencia al uso de una única variable independiente (Tusell, 2011). Este método estadístico es poco usado para la valoración del suelo puesto que no es posible englobar en una sola variable las relaciones entre el precio y las variables que lo forman. La formulación matemática es la siguiente: 𝑦 = 𝛽0 + 𝛽1 𝑥 + 𝜀 Siendo 𝑦 → Variable dependiente 𝛽0 → Constante Beta 𝛽1 → Sensibilidad 𝑥 → Variable independiente 𝜀 → Error 2.3.2.2

Regresión Múltiple

En paralelo, los modelos de Regresión Múltiple relacionan múltiples variables independientes (Tusell, 2011), lo cual se ajusta más a lo que se espera en cuando al valor del suelo. Su formulación está dada de la siguiente manera: 𝑦 = 𝛽0 + 𝛽1 𝑥 + 𝛽2 𝑥 + ⋯ + 𝛽𝑛 𝑥 + 𝜀 2.3.2.3

Regresión Geográficamente Ponderada. (GWR)

Existe un tipo de regresiones donde el concepto espacial y la aplicabilidad a partir de los sistemas de Información geográfica es de vital importancia, conocido como Geographically Weighted Regression o Regresión Geográficamente Ponderada, esta parte del principio que existen correlaciones espaciales de las variables, por ejemplo, terrenos rurales de mayor valor tienden a estar ubicados hacia ciertos sectores o zonas de viviendas de altos valores, agrupándose en ciertos lugares, lo cual se traduce en que los coeficientes obtenidos en el modelo son inestables en el espacio según Duque, Velásquez, y Agudelo (2011). Para el geógrafo o analista de SIG, la auto correlación espacial es evidencia de procesos espaciales subyacentes importantes en el trabajo; es un componente integral de los datos; al quitar espacio, se quitan los datos de su contexto espacial; es como obtener sólo la mitad de la historia. Los procesos y las relaciones espaciales evidentes en los datos son un interés 35


principal y una de las razones por las que los usuarios de SIG se entusiasman con el análisis de datos espaciales. Sin embargo, para evitar un tipo de influencia que cuente más en su modelo, debe identificar el conjunto completo de variables explicativas que efectivamente capturen la estructura espacial inherente en su variable dependiente. Si no puede identificar todas estas variables, probablemente verá la auto correlación espacial estadísticamente significativa en los residuales del modelo. Lamentablemente, los resultados de regresión no serán confiables hasta que esto se solucione (ESRI, 2016). En su obra, Duque et al. (2011) muestran un ejemplo de cómo aplicar la regresión geográficamente ponderada en un caso de estudio del barrio San Javier en el Municipio de Medellín, ellos utilizan un total de 89 datos de precios de mercado de vivienda, ubicadas en los alrededores de la estación del metro de San Javier. Concluyen así un poder predictivo de las ecuaciones de 86.7%-91.9%, modelo que es mucho mejor en comparación con los resultados obtenidos por los modelos con rezago o error espacial, contra los que los autores hicieron el comparativo en el estudio. Asimismo, Matos y Salado (2018) realizaron un estudio en el municipio de Caguas en Puerto Rico, este estudio buscaba realizar una comparación entre dos tipos de regresión, por un lado la regresión por mínimos cuadrados y por el otro la regresión geográficamente ponderada; para el estudio se incluyeron un total de 2,313 datos correspondientes a las ventas de bienes inmuebles en un periodo de 4 años y la definición de 9 variables, una vez aplicados los modelos se demuestra un desempeño superior en la regresión geográficamente ponderada, explicando en un mayor nivel el valor de venta de los inmuebles. 2.3.3 2.3.3.1

Métodos Mixtos Multicriteria Valuation Method - MAVAM

Este modelo combina las ponderaciones de las variables obtenidas a partir del AHP las cuales se utilizan como datos de entrada en las ecuaciones de WGP. El WGP persigue minimizar la suma ponderada de las desviaciones de cada una de las metas. Este método fue planteado por Aznar y Guijarro (2015).

36


Su formulación algebraica es 𝑄

𝑀𝑖𝑛 ∑(𝑢𝑖 𝑛𝑖 + 𝑣𝑖 𝑝𝑖 ) 𝑖=1

s.a 𝑓𝑖 (𝑥 ) + 𝑛𝑖 − 𝑝𝑖 = 𝑏𝑖

𝑖 = 1 ....𝑄

𝑛𝑖 ≥ 0; 𝑝𝑖 ≥ 0 Siendo: 𝑓𝑖 (𝑥 ) una función lineal de 𝑥, esto es, 𝑘

𝑓𝑖 (𝑥 ) = ∑ 𝑎𝑖𝑗 𝑥𝑖𝑗 𝑗=1

con 𝑘 el número de variables 𝐵𝑖 la meta o goal. 𝑛𝑖 𝑦 𝑝𝑖 representan las desviaciones negativas y positivas, respectivamente, respecto a la meta. 𝑢𝑖 𝑦 𝑣𝑖 son los pesos o ponderaciones de las desviaciones. Para analizar el componente espacial en las ecuaciones, se vincula en las restricciones la función lineal el valor de la coordenada Xi y Yi. En cuyo caso específico la formulación algebraica quedaría 𝑛

𝑀𝑖𝑛 ∑(𝑛𝑖 + 𝑝𝑖 ) 𝑖=1

s.a 𝐴𝐻𝑃𝑖 𝑥1 + 𝑛𝑖 − 𝑝𝑖 − 𝑃𝑟𝑒𝑐𝑖𝑜𝑖 = 0 La solución de esta ecuación junto con la integración de RGui y Python en ArcGIS permite la realización del mapa de valores ponderados a partir de la ecuación. 𝑉𝑎𝑙𝑜𝑟(𝑥,𝑦) = 𝛽1 𝐴𝐻𝑃(𝑥,𝑦)

37


2.3.3.2

AHP + Regresión Lineal

El enfoque de este método es la realización de un modelo de regresión lineal a partir de los vectores de ponderación individual de cada uno de los criterios o variables formadoras de valor como vías, capacidad de uso del suelo, norma de uso, disponibilidad de aguas, densidad predial y uso actual del suelo. Entre otras, para lograr el modelo de mejor ajuste. Se parte de la ecuación de valor 𝑉𝑎𝑙𝑜𝑟(𝑥,𝑦) = 𝛽0 + 𝛽1 𝐴𝐻𝑃𝑣𝑎𝑟1

(𝑥,𝑦)

+ … . +𝛽𝑛 𝐴𝐻𝑃𝑣𝑎𝑟𝑛 (𝑥,𝑦)

Donde

𝐴𝐻𝑃𝑣𝑎𝑟𝑛(𝑥,𝑦) corresponde al valor del vector de ponderación obtenido a partir de AHP para la variable formadora de valor n en el punto (x, y). Dado que el comportamiento de los valores de los suelos no se comporta de manera estrechamente lineal se espera realizar pruebas utilizando funciones exponenciales de la forma. 𝑉𝑎𝑙𝑜𝑟(𝑥,𝑦) = 𝑒 (𝐴𝐻𝑃𝑉𝑎𝑟1(𝑥,𝑦)+..

..+𝐴𝐻𝑃𝑉𝑎𝑟𝑛(𝑥,𝑦) )

La cual una vez linealizada para la aplicación del método de regresión quedaría 𝐿𝑛(𝑉𝑎𝑙𝑜𝑟(𝑥,𝑦) ) = 𝛽0 + 𝛽1 𝐴𝐻𝑃𝑉𝑎𝑟1(𝑥,𝑦) +.. . . +𝛽𝑛 𝐴𝐻𝑃𝑉𝑎𝑟𝑛(𝑥,𝑦) Es muy importante la verificación de temas de consistencia del modelo y selección de variables, auto correlación, residuales y normalidad se podrá obtener el mapa de valor, para lo cual es de mucha utilidad lo indicado por Gujarati (2009). 2.3.4

Otros Métodos

Es igualmente sobresalienta la revisión de otros dos tipos de modelos, tales como el Kriging, al tratarse de una técnica de Extrapolación Geoestadística y los Sistemas de Redes Neuronales clasificado como un Sistema Conexionista. Sin embargo, desde la revisión de la literatura se perciben factores que supondrían la poca conveniencia de la aplicación de estos dos métodos, por una parte, la metodología de Krigring evidencia similitud con el modelamiento de GWR, pues ambos métodos se basan

38


en la correlación espacial que presentan las variables. En cuanto a las Redes Neuronales, como se profundizará más adelante, estas requieren de un entrenamiento de algoritmos por medio de considerables cantidades de datos, que para el caso de la valoración del suelo serian avalúos u ofertas y como se ha indicado, esto demandaría una cantidad de recursos insostenible para las instituciones encargadas de la valoración masiva en el país. 2.3.4.1

Método de Kriging

Con este nombre se conoce la técnica geoestadística de interpolación que parte de la premisa que la variación espacial continua en el mismo patrón. Como aplicaciones dentro del campo de valoración masiva, Cervelló (2008) menciona el caso práctico presentado por Chica y Cano (1992) en donde formulan la parte matemática del Kriging residual Iterativo, el cual conecta el método Geo-econométrico que convino la regresión y krigeaje. Este último autor desarrolla el modelo sobre una primera muestra de 298 viviendas de las que se obtuvo el valor del suelo en términos de valor catastral y otra muestra de 215 viviendas que corresponde a tasaciones puntuales desarrolladas entre 1990 y 1992. Con relación al modelo desarrollado con los valores catastrales se logra obtener un R cuadrado = del 71% y con las tasaciones puntuales llegan a un R cuadrado de 47%, es decir el modelo propuesto ajusta los valores catastrales en una buena parte, pero tiene el problema que genera un menor ajuste para los datos de avalos puntuales. 2.3.4.2

Redes Neuronales

Se conoce así al tipo de inteligencia artificial basado en la estructura y funcionamiento del sistema nervioso, donde un conjunto de elementos de información se interconecta y forma un sistema para ajuste de modelos no lineales. De acuerdo con lo expuesto por Nuñez, Rey y Caridad (2016) el uso de la inteligencia artificial en la valoración de inmuebles tiene sus primeros registros en la década de los 90, con los trabajos realizados por Bortz. Actualmente las redes neuronales que modelan el mercado inmobiliario son de tipo Feed-Forward compuesto por tres capas como lo indica Mora (2008), donde el proceso inicia recibiendo y creando neuronas por cada variable de operación. Posterior a esto, la segunda capa se encarga de realizar todo el proceso para finalmente transferir la información a la última capa, la cual arroja el valor del inmueble; este proceso debe ser llevado a cabo varias veces, con el fin de entrenar la red hasta lograr que el error sea insignificante. En cuanto al uso de las redes neuronales para la estimación de valor en suelos rurales, se pueden hacer las siguientes reflexiones: En primer lugar, es bien sabido que esta forma de 39


inteligencia artificial depende ampliamente del entrenamiento que se le haga, por lo que, para obtener un análisis eficiente mediante esta técnica, es de vital importancia contar con datos verídicos y vigentes, para posteriormente pasarlo por un proceso de análisis definido anteriormente; si bien no se cuestiona la eficiencia de la metodología de las redes neuronales, la cual ha demostrado ser una herramienta excepcional en otros campos de acción, para el caso de la valoración masiva puede no ser la herramienta indicada, dada la escasez de información básica con la que cuenta el investigador para definir los valores del suelo, lo que conlleva a que el análisis sea propenso a presentar resultados poco satisfactorios. 2.3.5

Métodos de Muestreo

En la literatura sobre estadística es común encontrar varios métodos de muestreo cuya finalidad es seleccionar un conjunto de elementos que representen lo mejor posible a la población. A continuación, se describen algunos métodos de muestreo con base en lo expuesto en el libro ‘Estadística y Muestreo de Ciro Martínez (2012). y el libro Introducción a la probabilidad y estadística’ de Mendenhall, Beaver y Beaver (2010) 2.3.5.1

Muestreo Aleatorio Simple (MAS)

El muestreo aleatorio simple (MAS) consiste en la selección completamente aleatoria de elementos, por lo que se tiene que cada elemento de la población tiene la misma probabilidad de ser parte de la muestra. Este muestreo se aplica en los casos en que la población es homogénea y se desconoce qué elementos de la población tendrán valores altos (Martinez, 2012). 2.3.5.2

Muestreo estratificado

Para este método se tiene en cuenta alguna característica de la población, por lo que se definen categorías o estratos en los que cada elemento de la población debe ser asignado, es decir, que todos los elementos deben tener una y solo una clasificación (Martinez, 2012). Posteriormente se establecen los tamaños de muestra para cada estrato, que en conjunto deben sumar el tamaño de muestra del universo defino. Esta distribución puede ser proporcional a tamaño de los estratos, teniendo que, si uno de estos reúne el 20% de la población total, le corresponderá la misma participación en el tamaño de la muestra. Si es conocida la varianza (por ende, la desviación típica) de la característica que se desea estudiar en la población de los estratos, es posible hacer la distribución de la muestra

40


proporcionalmente a la variabilidad de cada estrato, con la siguiente formula, llegando a tener un mayor muestreo en los estratos más variables (Mendenhall et al., 2010). 𝑛𝑖 = 𝑛 ∗

𝜎𝑖 𝑁𝑖 𝑘 ∑𝑗=1 𝜎𝑗 𝑁𝑗

Donde 𝑛𝑖 → Tamaño de muestra para un estrato 𝑖 𝑛 → Tamaño de muestra 𝑁𝑖 𝑁𝑗 → Población de un estrato 𝜎𝑖 𝜎𝑗 → Desviación del dato estudiado de un estrato 2.3.5.3

Muestreo por conglomerado

Si la población se encuentra agrupada en conglomerados y se puede suponer que los conglomerados son homogéneos, se puede seleccionar solo un grupo de conglomerados, asignar elementos representativos mediante muestreo simple o estratificado y a partir de lo anterior representar el universo total (Martinez, 2012). Como se puede deducir, esto presenta la ventaja de tener un menor desgaste en el muestreo, sin embargo, depende ampliamente de la homogeneidad de los conglomerados. Para el presente estudio, los conglomerados pueden ser las veredas del municipio de Tabio o las ZHF definidas, sin embargo, no hay razón para pensar que estas divisiones son homogéneas y, por el contrario, se espera una diferenciación en los valores del suelo. 2.3.5.4

Muestreo sistemático

Para los casos en los que la característica que se desea estudiar no es estratificable (pocos rangos), sino más bien responde a un listado de valores, el muestreo sistemático ofrece algunas alternativas. Según Mendenhall et al. (2010) se determina conjuntos de datos de un tamaño 𝑘 = 𝑁/𝑛, para posteriormente seleccionar un dato aleatorio para cada conjunto (lo que lo hace muy semejante al MAS). Para un desarrollo más preciso, se da un orden de lista a los elementos en la que los elementos contiguos sean más semejantes que los elementos lejanos, hacer el agrupamiento de tamaño 𝑘 y seleccionar aleatoriamente un valor 𝑐 menor que 𝑘, y 41


seleccionando como muestra los elementos enlistados en las posiciones 𝑐 , 𝑐 + 𝑘 , 𝑐 + 2𝑘 , … , 𝑐 + (𝑛 − 1)𝑘. Este último desarrollo presenta como ventaja el cubrimiento homogéneamente los valores enlistados de los elementos. En la práctica, es válido hacer uso de estos tipos de muestreos y combinaciones de los mismo, todo según la información que se desea estudiar. 2.3.6

Análisis espacial de residuales.

Para poder analizar qué modelo está explicando mejor los precios de los terrenos en el municipio, es necesario analizar los componentes espaciales de los mismos. Dado que se presume una correlación espacial de los valores donde pueden surgir, clústeres locales por ejemplo de aglomeración de zonas más costosas dentro del municipio, por ejemplo, zonas de vivienda campestre. En este sentido sirve de base los trabajos realizados por Landy Sánchez Peña (2012) en su trabajo titulado ‘Alcances y límites de los métodos de análisis espacial para el estudio de la pobreza urbana’, donde muestra la relación entre el espacio y los procesos sociodemográficos, partiendo de la estructura de los datos y sus efetos espaciales. Como herramientas extraídas de este trabajo se destaca lo proceso de análisis exploratorio de datos espaciales, especialmente la cuantificación de clústeres a partir del estadístico I de Moran. Por otro lado es posible utilizar un mapa de residuales para identificar zonas donde el modelo presenta bajo poder predictivo, el cual es sencillo en su construcción y se basa en un defenecía entre el valor de los terrenos obtenidos a partir de avalúos precios de mercado lo cuales deben contar con una ubicación espacial (x, y), contra los valores que cada modelo predice. Para poder visualizar esto espacialmente se debe acudir a un modelo de interpolación, el cual por sencillez y dado a que se espera contar con un numero de datos espacialmente distribuidos, se propone hacerlo a partir de Distancia Inversa Ponderada (IDW).

42


3

METODOLOGÍA

El desarrollo de la presente investigación se divide en tres fases: La identificación de variables formadoras de valor, el desarrollo de modelos de valoración del terreno y la comparación de estos modelos con la valoración usual de entidades oficiales. En cuanto a los modelos propuestos, estos se desarrollan con diferentes formulaciones matemáticas, pero siempre se encuentran en función de los pesos de las variables, evaluando su pertinencia para la valoración masiva de terreno y acercándose a establecer que metodología representa mejor la variación de los valores del terreno. Finalmente, se hace comparación cuantitativa de los pronósticos de valor entre el método tradicionalmente utilizado de Zonas Homogéneas Físicas y Geoeconómicas, frente a métodos también multicriterio, de valoración masiva con variables ponderadas. Estas comparaciones se realizan a través de los índices de Distancia de Manhattan y análisis de residuales, o índice de adecuación, para determinar la mejora en las estimaciones que pueden ser obtenidas por cada técnica. Ya en el desarrollo de pasos específicos, se encuentra en primer lugar la conformación de la información espacial de las variables formadoras de valor. Vale señalar que los datos cartográficos base del trabajo, como capas de predios, veredas y municipios vecinos; corresponden a datos públicos suministrados por el municipio, enmarcados dentro de la información base del IGAC. Ahora bien, para el caso de las variables formadoras de valor, no se cuenta con cartografía especifica disponible, por lo cual, se plantea la generación de esta información a partir de procesos geográficos y datos primarios, dentro de los cuales se destacan: Plan de Ordenamiento Territorial (POT), principal instrumento de ordenamiento y planeación municipal; mapa de vías, para la generación de áreas de influencia de estas, imagen satelital para realizar análisis de usos y cobertura, precipitaciones y tipos de suelos y para la determinación de los potenciales hídricos se usó los índices de evapotranspiración, con lo cual se puede obtener las zonas de mayor o menor disponibilidad de aguas. Posteriormente, se procede a establecer los pesos ponderados de estas variables mediante el AHP. Eje fundamental como lo muestra Reyna (2016), para la aplicación del Proceso 43


Analítico Jerárquico, son los expertos, ya que, bajo sus opiniones y juicios individuales sobre las variables, se constituye las matrices y las jerarquías de las variables. Por consiguiente, se prevé realizar encuestas a expertos conocedores del mercado inmobiliario del municipio. Para garantizar la idoneidad de estos, se encuestan a peritos que se encuentre en el Registro Abierto de Avaluadores y cuenten con un posgrado en valoración. Teniendo la espacialización de las variables y una ponderación de estas, es posible realizar los cruces espaciales y establecer las áreas con características semejantes, lo que se asemeja a las ZHF, con el atributo adicional de contar con los pesos de las variables, gracias al AHP. Como una entrada adicional de información, se desarrolla la captura de ofertas inmobiliarias, es decir, la clasificación y depuración de los anuncios de oferta de venta de inmuebles rurales en el municipio de Tabio. Estas ofertas, sumado al reconocimiento en campo y análisis de otros aspectos, son los insumos primordiales para la realización de los avalúos a predios que son escogidos como muestras. El muestreo, es decir, la selección de predios a los que se les establece el valor comercial mediante un avaluó, son parte de los datos para la formulación de las regresiones que, junto con las ofertas de mercado. Hasta este punto se desarrolla lo que se podría denominar información básica. Seguido, se establecerán los modelos de AHP, WGP, Minmax, Regresión lineal y WGP; obteniendo los mapas de pronósticos de valores. Los primeros modelos son aproximaciones experimentales mediante regresiones simples en función únicamente de la puntuación producto del AHP. No se espera resultados satisfactorios de estos modelos pues se puede afirmar que por la complejidad de la naturaleza del valor del suelo no se puede predecir a partir de una sola variable. Posteriormente se procede a desarrollar modelos de regresión múltiples entre los que es posible el manejo de variables logarítmicas. La conjunción de variables permite desarrollar modelos de mejor aproximación, sin embargo, puede existir problemas de autocorrelación espacial, pues las variables formadoras de valor y el valor como tal tienen intrínsicamente una autocorrelación espacial ya que las zonas de valores altos se agrupas en áreas específicas, al igual que las zonas de menor valor.

44


Como solución de lo anterior es posible desarrollar Regresiones Geográficamente Ponderadas pues se daría cumplimiento a la necesidad de que exista correlación espacial de las variables. En el desarrollo de cada modelamiento se revisan algunas pruebas estadísticas tales como prueba de Linealidad, Normalidad, Homocedasticidad, Multicolinealidad y Autocorrelación. El proceso concluye con el análisis comparativo entre los modelos y la valoración masiva realizada convencionalmente por la metodología de ZHF y ZHG, mediante el uso de los coeficientes de correlación, R2, índice de adecuación y cálculo del error típico, haciendo una profundización en la ilustración de la distribución espacial de las diferencias entre modelos. En la ilustración 1, se muestra el diagrama general de procesos.

Ilustración 1: Diagrama general de procesos.

A continuación, se presentan algunos aspectos que son necesarios profundizar, como las motivación y características del área de estudio, algunas particularidades de las variables formadoras de valor, detalles en la captura de ofertas y el desarrollo del AHP.

45


3.1 ÁREA DE ESTUDIO. 3.1.1

Generalidades

El municipio de Tabio se encuentra en la provincia de Sabana Centro, en el departamento de Cundinamarca, Colombia; localizado a unos 45 kilómetros al norte de la Ciudad de Bogotá. Tabio limita por el norte con el municipio de Zipaquirá, por el Occidente limita con los municipios de Cajicá y Chía, por el sur limita con el municipio de Tenjo y por el occidente limita con el municipio de Subachoque (Alcaldía Municipal de Tabio, 2007). Se ubica sobre la zona denominada Altiplano Cundí-Boyacense, correspondiente a una altillanura muy importante para el país debido a la alta explotación agrícola derivada de las altas fertilidades que presentan sus suelos. El sistema de División Político-Administrativa de Colombia (DIVIPOLA) del Departamento Administrativo Nacional de Estadística (DANE) indica que el municipio de Tabio, con código de identificación nacional 25785, tiene su cabecera municipal, de cerca de 610.000 metros cuadrados, con coordenadas centrales de latitud 4°55’1.93”N y longitud 74° 5’46.26”O, además de 7 centros poblados, que suman una superficie de 240,000 metros cuadrados, de los cuales 6 se encuentran en cercanías a la cabecera municipal y uno más en el extremo norte del municipio. La zona rural, con un área aproximada de 7,315 hectáreas, se encuentra políticamente dividida en 7 veredas: Rio frio Occidental, Rio frio Oriental, Paloverde, Juaica, Salitre, Centro y Lourdes (Alcaldía Municipal de Tabio, 2007). En las Ilustración 2 y Ilustración 3, las cuales ha sido construida a partir de la cartografía base del POT del municipio de Tabio, se muestra la ubicación dentro del territorio colombiano.

46


Ilustración 2 Ubicación Municipio de Tabio.

Ilustración 3: División política. Fuente de datos: Cartografía oficial de Tabio (Alcaldía Municipal de Tabio, 2007)

47


Según la proyección de población hecha por El Departamento Administrativo Nacional de Estadística (DANE, 2020) a partir del censo nacional de población y vivienda 2018, el municipio de Tabio tiene en el año 2,020 un total de 24,206 habitantes, distribuidos en 7,362 habitantes (el 30.41%) en la cabecera municipal y 16,844 (el 69.59%) personas en el resto del municipio (DANE, 2020). Tabio es el municipio con mayor porcentaje de población rural de la provincia de Sabana Centro y el segundo en el área metropolitana de Bogotá. Según las proyecciones del mismo censo hasta el año 2,035, la población de Tabio seguirá siendo porcentualmente más rural, pero reduciéndose al 58.14% (DANE, 2020). En el aspecto económico, el desarrollo del municipio se enfoca en el turismo y las actividades agrícolas y pecuarias, sin presentar mayores desarrollos en el ámbito industrial, dado que, contempla como visión de su territorio a futuro, ser un municipio verde y amigable con el medio ambiente. El valor agregado registrado por el municipio de Tabio para el corte de junio de 2017 fue de 226.9 miles de millones, siendo el 0.46 del valor agregado del departamento de Cundinamarca. El monto de valor agregado del municipio de Tabio se desagrega en actividades primarias con un 5.21%; actividades secundarias representando un 11.79% y las actividades terciarias con un 82. 99% (DANE, 2020). El municipio de Tabio es considerado como un municipio dormitorio, donde las personas viven, pero desarrollan sus trabajos y oficios en Bogotá, aprovechando su cercanía y las fuentes de empleo de mayor y mejor calidad que brinda la capital del país. En la actualidad en el municipio se desarrollan varios proyectos de vivienda campestre y recreativa, los desarrollos en infraestructura vial son básicos y no existe presencia de grandes autopistas, contando como principales vías de acceso las vías Tabio-Tenjo, Tabio - Cajicá, y Tabio Zipaquirá. 3.1.2

Motivantes para la selección del municipio de Tabio como área de estudio.

En cuanto a la categoría municipal, clasificación que se hace en el país teniendo en cuenta la población y los ingresos corrientes de libre destinación anuales, Tabio es categorizado como 6 (la categorización más baja que puede recibir un municipio en Colombia), rango que agrupa los municipios con población no mayor a 10,000 habitantes y que tengan ingresos corrientes de libre destinación no superiores a 15,000 salarios mínimos legales vigentes. Como se presentó antes, la población de Tabio si es superior a 10,000 habitantes, sin

48


embargo, sus ingresos corrientes de libre destinación anuales para la vigencia 2020 fueron de 12,551 salarios mínimos legales vigentes (Contaduría General de la Nacion, 2020). Es de resaltar que, como Tabio, solo 3 de las 18 entidades territoriales que conforman el área metropolitana de Bogotá son de categoría 6, una proporción relativamente baja dado el desarrollo en torno a la capital, ya que a nivel departamental el 82.05% de los municipios de Cundinamarca son categoría 6, así como el 87.65% de los municipios de toda Colombia (Contaduría General de la Nacion, 2020). Un factor decisorio en la selección de este municipio fue el hecho de que en Tabio no se encuentran figuras especiales de ordenamiento de la propiedad rural como resguardos indígenas, zonas de reserva campesinas o consejos comunitarios (DNP, 2020); áreas que pueden generar ruido en la valoración masiva pues se trata de elementos con normativa y propiedad especial. De la misma manera, en Tabio no se encontró registro de aeropuertos, peajes o áreas declaradas como zonas francas, elementos que por su naturaleza especial y su influencia particular en la valoración del suelo rural podrían afectar el ejercicio de valoración masiva. En cuanto a la minería, el Catastro Minero Colombiano señala 8 títulos vigentes sobre el municipio de Tabio. Uno de estos títulos se encuentra sobre la vía que comunica con el municipio de Cajicá, en el límite oriental de Tabio, ocupando área en ambos municipios, teniendo como titulares a “Receberas El Boquerón Z T S.A.”. Otro título minero se encuentra en el centro del municipio teniendo como titulares la “Gravillera Albania S.A” (Agencia Nacional de Mineria, 2020). Los dos anteriormente mencionados, parecen ser los únicos títulos mineros con actividad, pues los demás, distribuidos por el centro y norte del municipio, no tienen actividad aparente. Si bien varios municipios de Cundinamarca igualmente cumplen con esta caracterización de alta ruralidad y pocas dificultades para la valoración masiva, lo que los haría igualmente representativos, se seleccionó como área de estudio el municipio de Tabio por todo lo anteriormente mencionado y por su cercanía a la ciudad de Bogotá, una ventaja logística para la investigación, además del conocimiento y la experiencia que el autor ha tenido en trabajos de valoración en el municipio.

49


3.1.3

Características de Influencia en el Valor en el Área de Estudio

En cumplimiento de La Ley 388 de 1997 (Congreso de la Republica de Colombia, 1997), el municipio de Tabio adopta su Esquema de Ordenamiento Territorial (EOT) por medio del acuerdo municipal 1 de 2001, teniendo así el instrumento principal mediante el cual se ha definido la planificación urbana y rural. Seis años más tarde, el EOT tuvo proceso de revisión y ajuste, consagrado en el Acuerdo municipal 2 de 2007 (Alcaldía Municipal de Tabio, 2007). El vigente EOT del municipio de Tabio establece los usos permitidos y prohibidos en el área rural en el capítulo II de la norma. Como es de suponer, la norma de uso no es una relación directa de cada área del territorio a un único uso y por el contrario si bien es una serie de restricciones sectorizadas, ofrece dentro de sus parámetros una gama de posibles usos que puede tener el territorio. De manera puntual, el EOT del municipio de Tabio define una clasificación de usos Principal, Compatible, Condicionados y Prohibidos, así como diferentes enfoques en cuanto a la protección o aprovechamientos de los suelos, definidos en los Tratamientos del Suelo, que puede ser de Protección, Amortiguamiento, Desarrollo agropecuario, Minero y Desarrollo de parcelación. Lo anterior, si bien es un acierto desde el punto de vista del ordenamiento territorial, es un reto para las actividades de valoración masiva, pues indica que un mismo espacio se tiene la posibilidad de diferentes aprovechamientos. Desde la experiencia en valoración, se puede decir que este tema se resuelve teniendo como variable el uso Principal del suelo, junto con otra variable que establezca el uso real que tiene el territorio y adicionalmente, contemplando la posibilidad de los demás usos en el desarrollo de la valoración. Es esta una de las razones por las que el componente humano, es decir, el análisis hecho desde la experiencia, es necesario en los ejercicios de valoración, lo que se ha conocido como la definición del mayor y mejor uso del suelo. La valoración de terrenos, por la naturaleza compleja del origen del valor del suelo y la interacción de diferentes variables, hace que no sea posible reducir los procesos de valoración a únicamente ejercicios matemáticos exactos. A continuación, en la Tabla 1, se presenta un resumen sobre la normativa que señala el EOT para el municipio de Tabio. 50


Tabla 1. Resumen de la Normativa de uso del suelo para el municipio de Tabio. Uso Protección y Conservación

Principal

Infiltración para la Recarga de Forestal protector Áreas de Reserva Acuíferos Protección de nacimientos de agua Áreas de Amortiguamiento Amortiguamiento Tradicional

Áreas Agropecuarias Semi - intensivo

Intensiva o mecanizada

Compatible

Conservación de flora y Recreación recurso Recreación actividades agrosilvopastoriles y vivienda campesina

Conservación de suelos Recreación y vegetación Agroforestería

Plantaciones de frutales

Distritos de Adecuación, vivienda del propietario, institución rural, granjas y silvicultura Distritos de Adecuación, Agropecuario vivienda del propietario, tradicional a semi institución rural, granjas y mecanizado y forestal silvicultura Distritos de Adecuación, Agropecuario altamente vivienda del propietario, tecnificado y forestal institución rural Agropecuario tradicional y forestal

Condicionado Producción forestal institucionales, equipamiento y aprovechamiento forestal Captación de aguas. Agropecuarios tradicionales Cultivos bajo invernadero, agroindustria y vivienda campestre Cultivos bajo invernadero, agroindustria y vivienda campestre Cultivos bajo invernadero, agroindustria y minería

Es válido resaltar que las dinámicas de suelo que se han establecido en el municipio de Tabio debido a la demanda de vivienda de los habitantes que proceden de Bogotá ha hecho que el tamaño medio de los lotes o predios sea menor, situación con condiciones directas en el valor del suelo, ya que los inmuebles de menor área, presentan un mayor valor por metro cuadrado respecto a los lotes de mayor extensión, así mismo, el destino de los inmuebles para vivienda campestre, ha influido positivamente en los valores del terreno, razón por la que la variable de la norma desdibuja un poco su sentido al no tener en cuenta estas nuevas dinámicas dada la antigüedad de las políticas de Ordenamiento Territorial del municipio, pues su documento base data de los años 2002, sin que existe modificaciones a lo planteado en aquella época. 3.1.3.1

Suelos

La taxonomía dominante en el municipio se caracteriza por ser de suelos con orden inceptisol de horizontes desaturados. Los suelos son ligeramente ácidos, moderada saturación de aluminio y presentan moderados contenidos de carbón orgánico, además de bajos contenidos de fosforo, potasio y calcio. Estas características del suelo hacen que el territorio de Tabio tenga una clasificación de fertilidad entre moderada y alta, de textura fina y estructura moderadamente fuerte con alta susceptibilidad a la erosión hídrica cuando son desprovistos de vegetación (Alcaldía Municipal de Tabio, 2007). Estas características del suelo, y más aún su alto nivel de fertilidad, hace de los terrenos del municipio de Tabio óptimos y apetecidos para las labores agrícolas. 51


3.1.3.2

Orografía

El relieve es plano, hacia la zona central del municipio, pues el paso del Rio Frio, deja un valle central con elevaciones montañosas hacia el oriente y occidente del municipio, dentro de las que se destacan la Cuchilla Canica, la Peña de Juaica, El Cerro, La Costurera y el Monte Pincio. Tabio tiene una altitud media en las áreas planas (incluyendo el casco urbano) de 2.569 msnm mientras que sus picos montañosos pueden alcanzar los 3200 msnm (Alcaldía Municipal de Tabio, 2007). 3.1.3.3

Clima e Hidrografía

El clima del municipio es frio, variando entre frio seco y frio muy húmedo. Con una temperatura promedio de 14°C y precipitaciones medias de 861 m/año (Alcaldía Municipal de Tabio, 2007). La hidrografía en el municipio de Tabio está determinada por dos subcuencas, la de mayor ocupación, es la subcuenca del Río Frío, cuerpo hídrico que nace en el Cerro Carrasposo en el municipio de Zipaquirá y atravesar 5 municipios, entre esos a Tabio, ingresando en territorio del municipio por el norte, en sentido norte sur, hasta llegar a la vereda Centro, en el corazón del municipio, para desviarse al oriente y salir al municipio de Cajicá. En el sur del municipio se tiene la subcuenca del río Chicú, cuerpo hídrico que toma su nombre después de su paso por el occidente de la cabecera municipal de Tabio. Se tiene entonces que subcuenca del río Frío es la de mayor influencia en el territorio rural mientras que la del río Chicú en el territorio urbano (Alcaldía Municipal de Tabio, 2007). Es debido a la influencia de la Cuenca del Río Frío que el municipio cuenta con áreas de Reserva Forestal Protectora, que, por sus características, promueven la protección de los recursos naturales existentes en la zona, imposibilitando así, la explotación forestal de los bosques nativos que se encuentren sobre los cerros. No obstante, hacia las partes de la llanura se desarrolla la agricultura, ganadería intensiva y la vivienda campestre. 3.1.3.4

Vías

El artículo 26 del vigente EOT (Alcaldía Municipal de Tabio, 2007) señala como troncales municipales, las vías que conectan la cabecera municipal por el norte con el municipio de Zipaquirá, por el oriente con el municipio de Cajicá, por el sur con los municipios de Chía y Tenjo y por el occidente con el municipio de Subachoque. Dada la forma alargada del municipio en el sentido norte sur y la localización de la cabecera en el centro-sur del 52


municipio, la parte central y sur del municipio goza de varias vías, mientras que el costado norte presenta una situación más escasa de rutas de comunicación. 3.1.3.5

Conflictos de uso del suelo

En cuanto a los conflictos de uso del suelo, el municipio de Tabio presenta 2,097.5 Ha (el 28.34% del territorio) con uso adecuado, 2,192.2 Ha (el 29.62%) de terrenos con subutilización, 1,970.5 Ha (el 26.63% del área municipal) en actividades con sobreutilización y 1,308.7 Ha (el 17.68% del territorio) con otros conflictos de uso. Lo anterior según el DNP (2020) a partir de la información IGAC del año 2012. 3.2 IDENTIFICACIÓN DE LAS VARIABLES FORMADORAS DE VALOR. Para definir las variables que tienen incidencia sobre el valor de los terrenos, es importante tener claro conceptos sobre lo que hace que un terreno tenga mayor valor que otro, situación que explica Jaramillo (1994). En su obra el autor esboza como los suelos al tener una participación dentro del sistema de producción como un insumo fundamental para la producción de bienes, también les corresponden unas rentas por el uso de este, rentas que se traducen a través del tiempo en el precio del suelo. Las rentas a las que hace referencia Jaramillo corresponden a la renta absoluta, la cual está asociada únicamente al hecho de que el suelo sea un bien finito y apropiable (propiedad privada). La renta Diferencial tipo I, asociada a la fertilidad y ubicación, la renta diferencial tipo II, asociada a la intensidad de Capital y por último la renta de Monopolio asociada a la demanda del producto final; concluyendo que estas son las que definen el valor de los suelos, ya que las mismas pueden representarse en variables medibles y a su vez estas pueden presentar cierta distribución espacial dentro del territorio. 3.2.1

Variable Normativa

Para la definición del valor del terreno se tuvo en cuenta el principio del mayor y mejor uso, el cual debe ser legalmente permitido pues al final es lo que genera el mayor rendimiento de ingresos a la propiedad (Aznar y Guijarro, 2015), es decir, los terrenos valen según lo que en ellos se pueda hacer. Para su elaboración, se debe consultar el POT vigente del municipio y tomar lo concerniente al catastro en lo que respecta a la clasificación de los usos del suelo (áreas de actividad).

53


Aunque la clasificación se toma a nivel general se deben tener en cuenta aspectos que puedan incidir en los valores unitarios de terreno tales como zonas de riesgo, zonas de protección, de conservación, ambientales que no hacen parte de la clasificación de usos del suelo y que pueden estar descritos en otras subclasificaciones existentes en los POT. Estos aspectos se deben representar a una escala que permita identificarlos detalladamente. Se debe consultar tanto el texto como el mapa elaborado que contenga el POT. Es importante tener en cuenta que tiene prioridad el texto sobre el mapa. Si se encuentran diferencias significativas se debe consultar con la autoridad competente. El plano de la variable se construye con base en la información recolectada. La variable norma de uso debe representarse digitalmente en la escala en que se encuentre la prediación. Cabe resaltar que de acuerdo con lo establecido en el Artículo 19 del Acuerdo 002 de 2007 (Alcaldía Municipal de Tabio, 2007), por el cual se revisa y ajusta el Esquema de Ordenamiento Territorial del Municipio de Tabio, se define un cuadro de coordenadas, el cual delimita un polígono donde es posible el desarrollo de vivienda campestre, dado que este polígono no aparece en la cartografía oficial del municipio, la digitalización de la información no es fiel copia del plano oficial. De la revisión que se hizo al Plan de Ordenamiento Territorial, se construye el plano de norma que se muestra en la Ilustración 4 , en el cual se identifican las siguientes categorías. •

Suelos agrícolas intensivos: Hacen referencia a suelos con alta capacidad agrologica, en los cuales es posible implantar sistemas de riego y drenaje.

Suelos agrícolas semi intensivos: Son aquellos suelos con una capacidad agrologica media y permiten una mecanización controlada.

Suelos agrícolas tradicionales: Engloba aquellos suelos con una mediana-baja capacidad agrologica y mayor número de restricciones.

Áreas de Infiltración para la Recarga de Acuíferos: Hace referencia a los suelos cuya función se basa en la infiltración, circulación o tránsito de aguas entre la superficie y el subsuelo.

Áreas de Amortiguamiento: Estas áreas hacen parte de los suelos de conservación, sin embargo, son menos restrictivos que los suelos de protección, puesto que permiten el aprovechamiento forestal, la cosecha de algunos productos nativos y de manera condicionada posibilita los usos agropecuarios.

54


Áreas de protección: Hace referencia a las áreas del municipio donde se desarrollan actividades dedicadas a la conservación y restauración del medio ambiente y los recursos naturales.

Vivienda campestre: Hace referencia a aquellas áreas de parcelación destinadas a la habitación o recreación de las familias que dada sus características no pueden ser consideradas como viviendas campesinas.

Centros poblados: Hace referencia a aquellas concentraciones de viviendas que se ubican en suelo rural y que de acuerdo con el POT del municipio serán objeto de actuación urbanística mediante la figura de Plan Parcial.

Suelo Suburbano: Hace referencia a zonas ubicadas en suelo rural, en las cuales se permite el desarrollo urbanístico bajo ciertas restricciones de uso, intensidad, y densidad.

Ilustración 4: Variable Norma de uso del Suelo

3.2.2

Variable Densidad

Esta variable mide la tendencia de los propietarios a fragmentar sus predios a lo largo de los años, derivándose así en la concentración de varias unidades prediales de poca extensión. Esta fragmentación predial puede llegar a relacionarse con el uso que tienen los inmuebles, es decir, terrenos de mayor extensión se asocian a usos de protección, agrícolas y al

55


desarrollo de ganadería, mientras que terrenos con una menor extensión se asocia a fincas de recreación, vivienda campestre o asentamientos humanos. El fraccionamiento predial del municipio refleja también un comportamiento social y económico en la ocupación del territorio ya que refleja la presión por parcelar y construir y el porcentaje de la población que se ubica sobre la zona rural de Tabio. Para construcción de esta variable, se parte de los datos de la base Predial del Geoportal IGAC (Instituto Geografico Agustin Codazzi, 2020), los cuales son descargados en formato shape. Posteriormente se adelanta una clasificación por rangos, de acuerdo con las áreas de cada uno de los predios utilizando para esto intervalos de Jenks. La densidad predial clasificada se muestra en la Ilustración 5, identificando las siguientes subcategorías: •

Alta: Engloba las áreas donde se concentran la mayor cantidad de predios, caracterizados por presentar áreas pequeñas. Rango (0 a 3,160 m2).

Moderada: Engloba las áreas con terrenos divididos en pocas particiones y con extensiones semejantes, conservando características de ruralidad. Rango (3,161 m2 a 150,898).

Baja: Engloba las áreas donde se presenta un bajo número de predios, los cuales se caracterizan por presentar grandes extensiones de terreno Rango (150,899 m2 y más).

56


Ilustración 5: Variable Densidad.

3.2.3

Variable Capacidad de uso del suelo.

Esta variable reúne características de fertilidad, limitantes del suelo y su potencialidad de uso. Para lo cual se optó por utilizar los mapas de clasificación agrológica contenidos en al Estudio General de Suelos del Departamento de Cundinamarca, República de Colombia, Escala 1:100,000, año 2001 (Instituto Geográfico Agustín Codazzi- Subdirección de Agrología - Grupo Interno de Trabajo Geomática, 2001). Del anterior estudio se extrajo la clasificación USDA. Esta clasificación es un modelo categórico basado en el uso de principios cualitativos, para clasificar la aptitud de uso de los suelos. Para llevar a cabo una correcta categorización, Klingebiel y Montgomery (1961) partieron de datos que definían la capacidad productiva y valoraban pérdida de productividad del suelo. Para el desarrollo de este trabajo se hace uso de este método ya que se considera que representa de mejor manera las características físicas y químicas del suelo y hace una categorización adecuada del suelo. De acuerdo con el estudio general de suelos de Cundinamarca (Instituto Geográfico Agustín Codazzi, 2000), el municipio de Tabio presenta suelos con clases tipo I, II, IV, VI, VII y VIII. Teniendo en cuenta que la diferencia en cuanto a productividad en algunas clases es

57


muy baja, se opta por realizar una reclasificación de esta variable en las categorías Alta, media y baja de la siguiente forma: •

Alta: Engloba suelos clase I y II, en general se caracterizan por ser suelos fértiles, con alta capacidad agrologica para la producción agrícola y una capacidad de retención de agua de 120 a 150 mm. Los suelos pertenecientes a esta clase son generalmente profundos, con topografía plana y una alta capacidad para el suministro de nutrientes vegetales; las bajas limitaciones que presentan hacen que se requieran practicas simples de manejo y conservación con el fin de evitar futuros deterioros

Moderada: Engloba los suelos clase IV, los cuales se caracterizan por ser suelos con buena fertilidad, pero con algunos limitantes para la explotación, generalmente presenta topografías ligera y moderadamente inclinada con porcentajes de inclinación que van de 3% a 12%. Estos suelos cuentan con mayores restricciones de uso cuando se destinan a cultivos agronómicos, dando prioridad a las prácticas de manejo y conservación, dentro de esta clase se encuentran los suelos que son moderadamente profundos, con subsuelos de textura arenosa, franco arcillosa y arcillosa y una fertilidad natural de media a baja.

Baja: Engloba los suelos de clases VI VII y VIII, los cuales presentan una baja capacidad agrologica, por lo que estos suelos son destinados a protección o actividades agrícolas de muy baja intensidad dado que las restricciones de uso son mucho mayores, estos suelos se presentan en topografías con pendientes fuertemente inclinadas, lo que a su vez genera problemas de erosión pluvial.

La clasificación obtenida se muestra geográficamente en la Ilustración 6, donde se muestra que las mejoras características agrologicas se agrupan hacia una franja central del municipio.

58


Ilustración 6: Variable Capacidad del suelo

3.2.4

Variable Vías

Esta variable mide las condiciones de accesibilidad determinadas a través del tipo de vía, dado que este se encuentra estrechamente ligado a los costos de transporte, los cuales disminuyen a medida que mejoran las condiciones, el estado y el de tipo de vía. La determinación se realiza mediante el reconocimiento y clasificación de las vías y la demarcación y categorización de las zonas de influencia de cada una de las mismas. Dentro del estudio de zonas homogéneas físicas, se debe tener en cuenta que la existencia, el tipo y estado de las vías facilitan el acceso a los predios y el transporte de los productos agropecuarios para su comercialización. Para el desarrollo de esta variable, que se muestra en la Ilustración 7, se hizo uso de la información cartográfica y la clasificación de vías que presenta el Plan de Ordenamiento Territorial del municipio de Tabio Cundinamarca, sin embargo, dada la fecha de elaboración de este se hizo necesario actualizar el estado y tipo de vía a partir de la inspección virtual realizada mediante Street view y recorridos en campo, clasificándolas en 3 categorías según la Tabla 2. 59


Las vías de mayor relevancia en Tabio son aquellas que conducen a los municipios de Cajicá, Tenjo y Subachoque, adicionalmente se encuentran las vías que conectan al municipio con Zipaquirá y Chía, sin embargo, estas últimas se encuentran en condiciones irregulares, encontrando tramos pavimentados y tramos sin pavimentar; aun así, las vías anteriormente mencionadas junto con las aledañas al casco urbano se clasificaron como vías buenas. Para la clasificación de vías regulares se tomaron aquellas vías veredales de mayor capacidad de tránsito, como la vía Rio Frio, vía Llano Grande y la vía Palo Verde. Por último, las vías que fueron catalogadas como malas hacen referencia a caminos, trochas y carreteables que se encuentran en mal estado y dificultan el tránsito. Tabla 2 Caracterización y clasificación de las vías

Tipo de vía

Características

Buenas Regulares Malas

Pavimentadas de dos carriles Sin pavimentar, de un ancho importante y en buen estado de mantenimiento Sin pavimentar, angostas y en un estado de mantenimiento de regular a bajo.

Ilustración 7: Variable Influencia de las vías

60


3.2.5

Variable Disponibilidad de aguas

La importancia de las aguas deriva en que, si bien las condiciones físicas, de fertilidad e intrínsecas del suelo son importantes para la producción, algunos autores mencionan que estas pueden ser compensadas por la aplicación de fertilizantes al terreno; mientras que la falta de estas, dada la importancia en la producción agrícola y pecuaria, origina que se adelanten obras hidráulicas o de infraestructura para poder llevar el recurso a los terrenos, obras que resultan en la mayoría de los casos muy costosas. Es decir, un predio que cuenta con buena disponibilidad de aguas no se ve abocado a realizar inversiones de capital, caso diferente a lo que ocurre en terrenos que carecen del recurso, los cuales se ven obligados a invertir en obras a fin de estar en igualdad de condiciones. El mapa de aguas es elaborado a partir de la cartografía temática obtenida y relaciona los cuerpos de agua presentes. Se hace uso de la cobertura de cuencas del municipio de Tabio, mapa de clima, el modelo digital de terreno, la precipitación, evapotranspiración, el rendimiento de agua anual y la clasificación en los diferentes índices, con lo cual se califica el aprovechamiento potencial del recurso agua para las diferentes cuencas de Tabio. Adicionalmente se establecieron unas zonas de influencia sobre los cuerpos hídricos principales y secundarios para lo cual se fijó una distancia de 1.2 km a lado y lado del Rio Frio, principal rio del municipio, y un distancia de 0.8 km a lado y lado para el resto de drenajes, con lo cual se construyó un Buffer. Para saber los predios que tienen una disponibilidad permanente de aguas para la explotación agrícola, se utiliza la capa de distritos de riego y catastro de acueductos, disponible dentro de los planos del EOT de Tabio (Alcaldía Municipal de Tabio, 2007). Para definir los limites se utilizan los que los predios que pertenece a un distrito de riego o acueducto. Como fuentes de información, se cuenta con un modelo digital a partir de una imagen de la Misión Topográfica Shuttle Radar (SRTM) del Servicio Geológico de Estados Unidos (USGS), los datos de precipitación, temperatura, evapotranspiración e índice de aridez pueden ser consultadas en el geo servicio del Instituto de Hidrología, Meteorología y Estudios Ambientales (IDEAM). Una vez analizada la información fue posible definir para Tabio dos clasificaciones en cuanto a la disponibilidad del recurso hídrico, las cuales se muestran en la Ilustración 8.

61


Abundantes: Engloba las áreas aledañas a los principales cuerpos hídricos del municipio, por lo cual poseen agua en forma permanente durante todo el año. Se asocia con zonas que poseen un sistema de riego.

Suficientes: Engloba las áreas que poseen agua en forma permanente. Se asocia a las zonas que poseen acueductos rurales.

Ilustración 8: Variable Disponibilidad de aguas

3.2.6

Variable Uso actual del suelo

Esta variable mide las condiciones de mejoramiento en los terrenos debido a la intensidad de capital que sobre ellos se pueda estar efectuando (Jaramillo, 1994). Es decir, define las actividades que se llevan a cabo en los inmuebles al momento de recolectar la información, lo cual precisa la renta producida por el terreno, factor que influye directamente en el valor de cada uno de los inmuebles. La obtención de dicha información se hizo por medio del análisis de imágenes satelitales para lo cual fueron descargadas 4 imágenes de satélite a través del programa SAS PLANET, el cual permite descargar imágenes de diferentes servidores, para este caso, se optó por realizar la descarga del motor Bing Maps (https://www.bing.com/maps,Microsoft 62


Corporation, 2020), dado que presentaban una buena condición baja nubosidad y temporalidad de la toma de las imágenes. Estas imágenes cuentan con una resolución espacial de 7 cm y una resolución radiométrica de 8 bits como lo muestra la información de las imágenes en bruto de la Tabla 3, obtenida a partir del metadato de las imágenes. Dada la complejidad de manejar las imágenes, se decide hacer un cambio de resolución en ArcGIS mediante la herramienta “Resample” ampliando de 7 cm a 10 mts el tamaño del píxel, con el fin de obtener un archivo más liviano y que se ajuste a los requerimientos del proceso, ya que una resolución de 7 cm es demasiado detallista para determinar la cobertura de un municipio. La imagen obtenida y la calidad se aprecia en la Ilustración 10, a manera de ejemplo. En la Ilustración 9 se muestra la cobertura de las imágenes utilizadas.

Ilustración 9: Imagen satelital del municipio de Tabio Fuente Datos: Microsoft Corporation (2020)

63


Tabla 3 Información de las imágenes satelitales en bruto

Número de Bandas Columnas Filas Tamaño del píxel Tamaño en disco Resolución Radiométrica

3 123,062 60,936 7cm x 7cm 20.95 GB 8 bit.

Ilustración 10: Ejemplo de sector con resolución espacial de 10 metros Fuente Datos: (Microsoft Corporation, 2020)

A partir de las imágenes obtenidas se hace una clasificación de estas, con el fin de obtener el uso actual del suelo en el área rural del municipio. Para hacer la clasificación, lo primero que se hizo fue un análisis de componentes principales, esto, con el fin de mejorar la nitidez y diferencia de las bandas y obtener así un archivo ráster en una sola banda que permita una mejor identificación de las diferentes coberturas a revisar en el sector. Posterior a esto, se procesa la imagen por medio de cada una de las bandas, con el fin de aplicar las medidas que se consideren y ayuden al resultado que se espera obtener del tratamiento de la información. Con cada una de las bandas de la imagen se procede a suavizar los límites con ayuda de la herramienta “Boundary clean”. Una vez se suavizan los límites en la banda, con el uso de la herramienta “Majority filter “, se aplica un filtro a la banda con el fin de obtener agrupaciones de píxeles más definidas y 64


reducir las pequeñas agrupaciones de píxeles que pueden generar pequeños polígonos, los cuales no son de utilidad para el producto final. Con el fin de tener mejor claridad de la imagen, se vuelve a hacer un suavizado de límites a cada una de las bandas de la imagen, Con ayuda de la herramienta “Composite bands” se hace la composición de las bandas nuevamente para obtener el resultado del filtro y los límites suavizados en la imagen multiespectral. Con el fin de realzar las características de la cobertura se utiliza un análisis de componentes principales obteniendo una capa si clasificar como se muestra en la Ilustración 11.

Ilustración 11: Vista general imagen después de análisis de componentes principales.

Por último, se definen las regiones de interés que servirán como entrenamiento para el software, a fin de que el programa muestre la variedad de firmas espectrales asociadas a cada clase del mapa. Las clases que se deciden identificar en la imagen para efectos del presente trabajo son las siguientes: •

Bosque

Bosque disperso

Pastos limpios

Vegetación mixta

65


Utilizando la herramienta “Dendogram” de ArcGIS 10.5, es posible observar las diferentes características de las muestras que se tomaron y si ellas tienen diferencias comparables se pueden fusionar para hacer una sola clase. Teniendo definidas las 4 clases se procede por medio de la herramienta “Maximum Likelihood Classification” a realizar la clasificación del archivo ráster obteniendo una capa final como se muestra en la Ilustración 12.

Ilustración 12: Variable Uso Actual del suelo

3.3 ZONAS HOMOGÉNEAS FÍSICAS Para la construcción de estas se realizó la superposición de las variables formadoras de valor, normatividad, capacidad agrologica, vías, disponibilidad de aguas, uso actual del suelo y densidad predial. Siguiendo la metodología tradicional, se obtuvo un total de 227 zonas homogéneas físicas. 3.3.1.1

Codificación

Para la codificación de las zonas homogéneas se usa código compuesto de dos campos por cada una de las variables manejadas, para un total 12 dígitos, que se presentan en las tablas 4 a 10.

66


Tabla 4: Códigos para las ZHF

Campos

1,2

Densidad predial 3,4

Valores

01 a 09

01 a 04

Norma

5,6

Uso actual del suelo 7,8

01 a 03

01 a 04

Vías

9,10

Disponibilidad de aguas 11,12

01 a 03

01 a 02

Capacidad

A su vez cada una de las variables presenta la siguiente codificación. Tabla 5: Codificación para la variable Norma

Norma Centro Poblado Sub Urbano Vivienda Campestre Agropecuario Intensivo Agropecuario Semi-Intensivo Agropecuario Tradicional Áreas de Amortiguamiento Áreas de Infiltración para Recarga de Acuíferos Áreas de Protección

Cod 01 02 03 04 05 06 07 08 09

Tabla 6: Codificación variable Densidad predial

Densidad Predial Alta Medio Alta Medio Baja Baja

Cod 01 02 03 04

Tabla 7: Codificación variable Vías

Vías Cod Buenas 01 Regulares 02 Malas 03 Tabla 8: Codificación variable Uso actual del suelo

Uso actual del suelo Pastos Limpios Bosque Disperso Bosque Vegetación Mixta

Cod 01 02 03 04

Tabla 9 :Codificación variable Capacidad uso del suelo

Capacidad de uso Alta Moderada Baja

Cod 01 02 03 67


Tabla 10: Codificación variable Disponibilidad de aguas

Aguas Abundantes Suficientes

Cod 01 02

La caracterización de ZHF se elabora a través del uso de la codificación que permite agrupar áreas con características similares en cuanto a las variables de relevancia para la determinación de valores. A manera de ejemplo se muestra en la Ilustración 13 las divisiones de las Zonas obtenidas a partir de la superposición y análisis espacial de variables.

Ilustración 13: Zonas Homogéneas Físicas

3.4 DATOS DE MERCADO INMOBILIARIO A mediados de enero del 2020 se realizó el recorrido de campo por distintos puntos del municipio de Tabio, incluyendo diferentes oficinas de la alcaldía municipal y otras entidades con el fin de recopilar información básica para el trabajo, pero la mayor importancia del reconocimiento en campo lo tiene la inspección del área de estudio. Las principales actividades del reconocimiento se basaron en la recolección de referentes de mercado en la zona, la inspección de algunos inmuebles típicos del municipio y el

68


reconocimiento de elementos de interés como vías, zonas suburbanas, sectores agropecuarios, desarrollo económico y las características generales del paisaje. En la Ilustración 14 se muestra imágenes tanto de estado de algunas vías, como de las construcciones y paisaje en general de algunos puntos del municipio de Tabio.

Ilustración 14: Reconocimiento en campo (2020)

Para el estudio aquí desarrollado se logró la tabulación de 89 ofertas en bruto, recolectadas en los meses de diciembre de 2019 y marzo de 2020, ofertas que fueron corroboradas en cuanto a sus datos básicos y localización. Esta base de datos recolectada es depurada a través de corroboración de los datos publicados por medio del contacto telefónico a los vendedores. Para el proceso de depuración se descartaron aquellas que espacialmente se encuentran fuera del municipio, al igual que los datos que se encontraban duplicados, es decir, que corresponden al mismo predio, pero cuya información se había duplicado dado que la oferta se había publicado en 2 o más portales de internet. Este último proceso es fundamental, para confirmar, corregir o depurar la información sensible de las ofertas, tales como la cantidad monetaria solicitada, las áreas de los predios 69


en venta, la localización del inmueble y en general cualquier información que ayude al investigador a la determinación de la relación de valor del mercado inmobiliario de su área de estudio. Dado que el objetivo es encontrar el valor de los terrenos, en los casos en que las ofertas cuenten con anexidades y construcciones o cultivos, los mismos son descontados del valor de venta, con lo cual se establece únicamente el valor para el terreno en bruto. Con este valor dividido entre el área del terreno se obtiene la relación por metro cuadrado. Por ejemplo, una propiedad que se está anunciando en 1,400 millones, después de la indagación telefónica se logra determinar que existe un descuento y que el valor de venta seria de 1.,30 millones, sin embargo, la oferta cuenta con una casa pequeña y cultivos, por lo cual se descuenta un valor de 200 millones por estas anexidades, resultando para el terreno en bruto un valor de 1,130 millones. Si el área de terreno de este inmueble es de 20,000 m2 la relación por metro cuadrado será de $ 56,500/m2. Una vez realizada la depuración y descuento de anexidades, se analizaron los valores m2, descartando aquellos datos atípicos, con lo cual se llegó a una base de 55 datos como se muestra en la Ilustración 15.

70


Ilustración 15: Ubicación de las ofertas

En 3.6 Definición de la muestra, para cumplir las precisiones definidas para el estudio establece 72 datos mínimos necesarios para lo cual se realizaron unos avalúos, con eso se logra establecer una base de 146 datos finales que se utilizan para el modelamiento. No se consideró el levantamiento de encuestas a grupos focales para la definición del valor del suelo, dado que metodológicamente los valores de terreno deben ser obtenidos directamente del mercado de la zona o avalúos comerciales, para garantizar una mayor fiabilidad. 3.5 ESTRUCTURACION DEL PROCESO ANALITICO JERARQUICO Para la presente investigación se planteó la consulta a 4 expertos en valoración para definir la importancia de las variables en la formación del valor del suelo rural del municipio de Tabio. Las 4 personas encuestadas cuentan con por lo menos una carrera profesional, algún posgrado en valoración y adicionalmente un Registro Abierto de Avaluadores (RAA) vigente, al tratarse de la acreditación legal de peritos de valoración inmobiliaria en 71


Colombia. Adicionalmente se procuró que contaran con experiencia en valoración de áreas rurales, estudios sobre métodos de valoración del suelo y manejo del AHP. Los 4 expertos consultados fueron: •

Marco Fidel Pérez, Ingeniero Catastral y Geodesta, Especialista en Avalúos.

William Duarte, Ingeniero Catastral y Geodesta, Especialista en Avalúos.

Javier Leal, Ingeniero Catastral y Geodesta, Especialista en Métodos y Técnicas de Valoración (Autor del presente documento).

Fernando Gonzales, Ingeniero Catastral y Geodesta, Especialista en Gestión Territorial y Avalúos.

A partir de sus opiniones y encuestas se construye el árbol jerárquico, Ilustración 16,donde se plasma las diferentes variables formadoras de valor, las categorías y subcategorías. Para la definición de los pesos de cada variable se sigue la metodología tradicional en la elaboración del proceso analítico jerárquico, aplicando las encuestas y determinado las matrices de comparación pareada, definiendo de esta manera los vectores propios de ponderación. Ahora bien, dado a que existen 4 resultados, uno por encuestado, para unir las diferentes opciones y un único vector se utiliza como método la Agregación de Prioridades Individuales descrito por Aznar y Guijarro (2015, págs. 167-169).

72


Valoracion

Normatividad

Disponibilidad de aguas

Uso actual del suelo

Centros poblados

Abundantes

Pastos Limpios

Sub urbano

Suficientes

Bosque

Vvivienda Campestre

Vegetación

Agr Intesiva

Bosque Disperso

Desidad predial

Vías

Capacidad de uso del suelo

Alta

Buenas

Alta

Medio Alta

Regulares

Moderada

Medio Baja

Malas

Baja

Baja

Agr Semintensiva Agr Tradicional Areas Amortiguacio n Areas Recarga Areas Protegidas

Ilustración 16: Categorización de las variables formadoras de valor.

Los vectores obtenidos para cada categoría y subcategoría, de acuerdo con las matrices de comparación pareada para cada experto encuestado, se muestran en las tablas 11 a 17, nótese que las diferentes respuestas obtenidas para cada experto son agregadas en un vector final, para lo cual se utiliza la media geométrica (Aznar y Guijarro, 2015, págs. 167-169). Tabla 11: Vector categoría variables

ÍTEM EXPERTO 1 Norma 32.11% Densidad 30.56% Vías 18.86% Uso Actual 9.13% Capacidad 5.21% Aguas 4.14%

VECTOR VARIABLES EXPERTO 2 EXPERTO 3 EXPERTO 4 MEDIA GEOM FINAL 42.53% 40.71% 41.62% 39.00% 40.44% 24.85% 24.68% 16.05% 23.42% 24.28% 14.32% 14.08% 8.68% 13.48% 13.97% 3.15% 4.12% 3.97% 4.65% 4.83% 7.40% 7.54% 20.96% 8.83% 9.16% 7.75% 8.88% 8.73% 7.06% 7.32% 96.44% 100.00%

73


Tabla 12: Vector subcategoría norma

VECTOR SUBCATEGORÍA NORMA ÍTEM EXPERTO 1 EXPERTO 2 EXPERTO 3 EXPERTO 4 MEDIA GEOM FINAL CP 30.74% 32.02% 27.41% 29.33% 29.82% 30.03% SubUr 22.54% 24.02% 28.91% 17.94% 23.02% 23.18% VC 17.85% 18.67% 17.40% 21.36% 18.76% 18.89% AgrIn 8.80% 9.95% 8.43% 9.70% 9.20% 9.26% AgrSem 7.15% 5.67% 6.05% 7.24% 6.49% 6.54% AgrTra 5.33% 3.88% 4.56% 7.24% 5.11% 5.15% Amorti 3.23% 2.41% 2.99% 3.07% 2.91% 2.93% Recarga 2.43% 1.72% 2.39% 2.21% 2.17% 2.18% Pro 1.94% 1.65% 1.87% 1.91% 1.84% 1.85% 99.32% 100.00% Tabla 13: Vector subcategoría vías

ÍTEM Buenas Regulares Malas

EXPERTO 1 70.49% 21.09% 8.41%

VECTOR SUBCATEGORÍA VÍAS EXPERTO 2 EXPERTO 3 EXPERTO 4 MEDIA GEOM FINAL 63.70% 65.48% 58.16% 64.31% 64.59% 25.83% 24.99% 30.90% 25.47% 25.58% 10.47% 9.53% 10.95% 9.79% 9.84% 99.56% 100.00%

Tabla 14: Vector subcategoría disponibilidad de aguas

ÍTEM Abundantes Suficientes

VECTOR SUBCATEGORÍA AGUAS EXPERTO 1 EXPERTO 2 EXPERTO 3 EXPERTO 4 MEDIA GEOM FINAL 75.00% 75.00% 75.00% 50.00% 67.77% 69.51% 25.00% 25.00% 25.00% 50.00% 29.73% 30.49% 97.50% 100.00% Tabla 15: Vector subcategoría capacidad del suelo

VECTOR SUBCATEGORÍA CAPACIDAD DEL SUELO ÍTEM EXPERTO 1 EXPERTO 2 EXPERTO 3 EXPERTO 4 MEDIA GEOM FINAL Alta 69.10% 73.06% 63.70% 73.06% 69.62% 69.86% Moderada 21.76% 18.84% 25.83% 18.84% 21.13% 21.21% Baja 9.14% 8.10% 10.47% 8.10% 8.90% 8.93% 99.66% 100.00% Tabla 16: Vector subcategoría uso actual del suelo

VECTOR SUBCATEGORÍA USO ACTUAL DEL SUELO ÍTEM EXPERTO 1 EXPERTO 2 EXPERTO 3 EXPERTO 4 MEDIA GEOM FINAL Pastos Limpios 57.67% 45.89% 50.19% 54.95% 51.98% 53.44% Bosque 22.16% 11.87% 17.18% 24.76% 18.29% 18.80% Veg Mixta 12.51% 34.17% 24.25% 12.93% 19.13% 19.67% Bosque Disperso 7.66% 8.07% 8.38% 7.36% 7.86% 8.08% 97.26% 100.00%

74


Tabla 17: Vector subcategoría Densidad

ÍTEM EXPERTO 1 Alta 51.79% Medio Alta 31.93% Medio Baja 10.09% Baja 6.19%

VECTOR SUBCATEGORÍA DENSIDAD EXPERTO 2 EXPERTO 3 EXPERTO 4 MEDIA GEOM FINAL 54.71% 46.00% 52.54% 51.16% 51.33% 28.48% 32.48% 27.88% 30.13% 30.23% 11.04% 14.86% 13.93% 12.32% 12.37% 5.77% 6.65% 5.65% 6.05% 6.07% 99.66% 100.00%

Para unir cada una de las ponderaciones obtenidas en cada característica de las zonas homogéneas físicas se hace uso de las herramientas de ArcGIS, generando de esta manera el mapa de ponderaciones AHP que se muestra en la Ilustración 17. Para la visualización se ha utilizado un intervalo de clases.

Ilustración 17: Mapa de calor AHP

El mapa presenta en color rojo las zonas con una ponderación alta, la cual se relaciona con las mejores características obtenidas según las ponderaciones del modelo de valoración y en color verde las zonas con ponderación más baja que se traduce en bajas características.

75


3.6 DEFINICIÓN DE LA MUESTRA El tamaño de la muestra se estima en función del nivel de confianza deseado, el nivel de error dispuesto a aceptar y el tamaño total de la población, como se muestra en la siguiente formula. Es importante que en este caso el muestreo se diferencia en la estimación de la varianza, dado que es un término indeterminado en el presente caso, por lo que se recurre a suponer la situación más desfavorable posible con 𝑝 = 𝑞 = 0.5, es decir, se establece como máxima la varianza poblacional. 𝑛=

𝑁 ∗ (𝛼𝑐 ∗ 0.5)2 1 + (𝑒 2 ∗ (𝑁 − 1))

Donde: 𝑛 → Tamaño de muestra 𝑁 → Tamaño de población total () 𝛼𝑐→ t de Student del nivel de confianza deseado (1.96 correspondiente al 0.95%) 𝑒 →Nivel de error aceptado (0.05%) Por tanto, teniendo en cuenta diferentes porcentajes de error y de niveles de confianza, para una población total de 4,542, que correspondiente a la cantidad total de predios del municipio de Tabio señalados por la información catastral oficial vigente, se tienen los tamaños de muestras presentados en la tabla 18.

Nivel de confianza

Tabla 18 Tamaños de la muestra

99% 98% 97% 95% 90% 80% 70% 50%

1%

2%

3%

3,566 3,401 3,278 3,084 2,718 2,157 1,688 910

2,168 1,939 1,786 1,571 1,232 837 585 268

1,311 1,130 1,016 864 645 415 280 123

Error 5% 7,5%

10%

15%

20%

579 484 427 354 255 159 105 45

160 131 115 94 67 41 27 11

73 59 52 42 30 18 12 5

41 34 29 24 17 10 7 3

277 228 200 165 117 72 47 20

Ahora bien, se tiene una limitante en cuanto al desarrollo de muestras que al final se traducen en avalúos, puesto que los recursos de desplazamiento, captura de información, procesamiento de datos, análisis de particularidades y análisis económico puntual de cada 76


inmueble, hace que la actividad valuatoria para un gran grupo de predios sea muy costoso para el presente proyecto. Por tal razón, se decide seleccionar una muestra de 72 elementos, correspondientes a 72 predios a los que se les realiza un avaluó. Esta muestra representa un nivel de confianza del 80% con un error aceptado de 7.5%. 3.7 ZONAS HOMOGENEAS GEOECONOMICAS IGAC Dado que el objetivo es determinar que tanto mejoran los modelos propuestos sobre el modelo de ZHG del IGAC, se toma el mapa de zonas homogéneas para la vigencia de 2018, dada la temporalidad des los dados, se hace necesario actualizarlos a partir del índice de Valoración Predial (IVP), para lo cual se utiliza como fuente los estudios del DANE (2020)

Ilustración 18: ZHG Municipio de Tabio

En la Ilustración 18 se muestran los valores establecidos en el 2018 por el IGAC, se actualizaron, tomando valores puntuales para cada una de las zonas definidas. De esta manera, todos aquellos predios que se encuentren en las ZHG del IGAC tendrán un valor por metro cuadrado ya definido por estas.

77


3.8 ESTADÍSTICOS PARA LA COMPARACIÓN DE RESULTADOS 3.8.1

Distancia Manhattan.

La distancia Manhattan no es más que la sumatoria del valor absoluto de las diferencian entre el valor del muestreo y el pronosticado. Es una medida de magnitud (Aznar y Guijarro, 2015) 𝑛

𝐷𝑀 = ∑|(𝑚𝑖 − 𝑃𝑖 )| 𝑖=1

Donde 𝑛 → Numero de muestras y predicciones, igual a 146. 𝑚 → Valor de metro cuadrado de terreno de las muestras. 𝑃 → Valor de metro cuadrado de terreno de los pronósticos. En este sentido el mejor modelo es aquel que minimice la distancia Manhattan. 3.8.2

Índice de Adecuación

Este índice fue planteado por Aznar y Guijarro en el 2005, y el cual trata de enfrentar la solución base o también llamada solución Naive, al problema a contra otras soluciones a fin de determinar estas nuevas soluciones cuanto mejoran la estimación. La ecuación se plantea aparir de la distancia Manhattan de la siguiente manera. 𝐼. 𝐴𝑑𝑒𝑐𝑢𝑎𝑐𝑖𝑜𝑛 = (1 −

𝐷𝑖𝑠. 𝑀𝑎𝑛ℎ𝑎𝑡𝑎𝑛 𝑆𝑜𝑙𝑢𝑐𝑖𝑜𝑛 ) 𝑥100 𝐷𝑖𝑠. 𝑀𝑎𝑛ℎ𝑎𝑡𝑎𝑛 𝑁𝑎𝑖𝑣𝑒

Para este caso se toma distancia Manhattan del denominador, la obtenida a partir de la Zonas Homogéneas geonómicas del IGAC. Esto con el fin de que el índice de adecuación muestre un porcentaje, para cada modelo, cuanto mejora la estimación.

78


3.8.3

Error Medio Cuadrático (RMS)

El Error Medio Cuadrático es una medida de magnitud, El nombre deriva del hecho de que es la raíz cuadrada de la media aritmética de los cuadrados de los valores. Para el cálculo se usa la formula (Gujarati, 2009). 𝑛

1 𝑅𝑀𝑆 = √∑ (𝑚𝑖 − 𝑃𝑖 )2 𝑛 𝑖=1

Donde 𝑛 → Numero de muestras y predicciones, igual a 146. 𝑚 → Valor de metro cuadrado de terreno de las muestras. 𝑃 → Valor de metro cuadrado de terreno de los pronósticos. El mejor modelo era aquel que disminuya el error medio cuadrático. 3.8.4

Coeficiente de correlación Pearson

Este coeficiente muestra la relación lineal entre los valores muestreado y los valores predichos, en este sentido la correlación lineal de un modelo de pronostique al 100% los valores muestreados serán de 1, por consiguiente, el mejor modelo era aquel que logre el coeficiente de correlaciona ms cerca no a 1. Para esto se usa la fórmula de correlación de Pearson (Gujarati, 2009). Coeficiente Correlación =

∑𝑛𝑖=1(𝑚𝑖 − 𝑚 ̅ )(𝑃𝑖 − 𝑃̅ ) √∑𝑛𝑖=1(𝑚𝑖 − 𝑚 ̅ )2 ∑𝑛𝑖=1(𝑃𝑖 − 𝑃̅ )2

Donde 𝑛 → Numero de muestras y predicciones, igual a 146. 𝑚 → Valor de metro cuadrado de terreno de las muestras. 𝑃 → Valor de metro cuadrado de terreno de los pronósticos.

79


3.8.5

Error típico

El error típico de la regresión representa la desviación típica de los residuos, es decir, de las diferencias entre los valores por metro cuadrado y las predicciones obtenidas por cada regresión, en este caso, se busca el menor error típico, lo que conlleva a una predicción más exacta (Gujarati, 2009). 𝑛

(∑𝑛 (𝑚𝑖 − 𝑚 1 ̅ )(𝑃𝑖 − 𝑃̅))2 𝐸𝑟𝑟𝑜𝑟 𝑇í𝑝𝑖𝑐𝑜 = √ (∑(𝑃𝑖 − 𝑃̅)2 − 𝑖=1 𝑛 ) (𝑛 − 2) ∑𝑖=1(𝑚𝑖 − 𝑚 ̅ )2 𝑖=1

Donde 𝑛 → Numero de muestras y predicciones, igual a 146. 𝑚 → Valor de metro cuadrado de terreno de las muestras. 𝑃 → Valor de metro cuadrado de terreno de los pronósticos. 3.8.6

Selección del Muestreo proporcional según AHP

Teniendo como objetivo lograr hacer la distribución de la muestra más representativa posible en cuanto a la distribución de valores comercial del suelo y contemplando que los valores de AHP definidos para cada ZHF están (por el modelamiento de las variables) relacionadas con el valor comercial del suelo; la distribución de la muestra se basa en los valores de AHP calculados para cada ZHF. Se debe tener en cuenta que, si bien se tiene una población total de 4,542 predios, a los que se busca representar con 72 muestras, la distribución se hace en las 227 ZHF definidas en 3.3 y que geográficamente se muestran en la Ilustración 13: Zonas Homogéneas Físicas. Dado que al interior de cada ZHF se presenta valores muy homogéneos, una sola muestra representa toda una ZHF. Ahora bien, se tiene que son más ZHF que muestras, por lo que una muestra debe representar varias ZHF, por lo que se debe procurar que la heterogeneidad de las ZHF que sean muestreadas a partir del mismo elemento sea la menor posible. Para lograr esto, se recurre a un enlistado de ZHG según el orden del valor de AHP, es decir, una distribución sistemática, definiendo tamaños de cajones o estratos a partir de la relación entre el número de ZHF y de muestras, es decir, el fraccionario 𝑘 = 227/72 ≈ 3.1528.

80


Como se va a muestrear sobre las ZHF, no deben tomar valores enteros, por lo que habrá estratos que agrupan 3 ZHF y otros que agrupan 4. Una vez definidos los cajones o estratos, se procede a designar a un elemento como muestra de cada estrato, es decir, la elección del predio más representativo dentro de los grupos de ZHF. Para cumplir esta finalidad, de que la muestra sea el más representativo de su estrato, se optó por realizar la elección aleatoria y seleccionar, de manera supervisada, los predios representativos a los cuales se procede a realizar los avalúos de unidad de área de terreno. Los predios de muestra pueden ser visualizados en la Ilustración 19.

Ilustración 19: Ubicación de los predios muestra

81


4

RESULTADOS

La identificación de las variables formadoras de valor para el municipio de Tabio dio las bases sobre el tipo de información y el tratamiento de estas. En este sentido, para lograr una identificación acorde, se centra tanto en la investigación teórico económica llevada a cabo en 3.2, como en el ejercicio llevado a cabo con los encuestados en 3.5, donde se establece el árbol de jerarquías. Por lo anterior, se resalta que gran parte de los resultados obtenidos se basan en la escogencia de profesionales idóneos para la aplicación de los métodos, así como de las fuentes cartográficas de información. En este sentido, los encuestados suma al trabajo la experiencia en el campo económico y de avalúos que cada uno posee.

A continuación, se muestra los resultados para cada modelo planteado, analizando la calidad de cada uno, de acuerdo a los estadísticos de comparación de resultados, definidos en 3.8 4.1 ANALISIS DE MODELOS

Ilustración 20: Modelo desarrollados.

La Ilustración 20 muestra los diferentes modelos probados. En el desarrollo de los métodos por regresión se tiene la formulación de los modelos 1, 2, 3, 4, 5, 6 y 7; modelos relativamente simples que se desarrollan como acercamiento, teniendo para los dos primeros formulaciones rectilíneas y logarítmicas en función únicamente de la puntuación de AHP de las ZHF obtenidas en 3.5. Los modelos entre el 3 y el 7 son regresiones tanto puras como logarítmicas de combinaciones de por lo menos 4 variables formadoras de valor. 82


Debido a que el desarrollo estadístico de los modelos de regresión lineal supone testear los diferentes supuestos de modelos como normalidad, homocedasticidad, multicolinealidad, autocorrelación; para lo cual resultaría bastante extenso el consignar los resultados de cada uno de los estadísticos y pasos intermedios para cada modelo, se ha dejado un Anexo de Cálculos que contiene estos resultados, a fin que el lector pueda indagar sobre los supuestos de los modelos formulados. En la Tabla 19: Resumen de los estadísticos de los modelos lineales., se muestra el resumen de los estadísticos obtenidos a nivel general de los primeros 7 modelos. Tabla 19: Resumen de los estadísticos de los modelos lineales. Modelo

R2 ajustado

RMSE

RMSE Max(x)

Normalidad

Homocedasticidad

Multicolinealidad

Autocorrelación

1 2 3 4 5 6 7

0.67 0.738 0.9023 0.758 0.7743 0.8312 0.8661

88320 0.6084 48310 70040 73440 0.489 0.4355

14% 5% 8% 11% 11% 4% 3%

SI NO SI SI SI SI SI

NO SI NO NO NO NO SI

N/A N/A NO NO NO NO NO

SI SI SI SI SI SI SI

De estos modelos de regresión lineal se concluye principalmente: •

Ningún modelo cumple a plenitud los supuestos del modelo de regresión lineal. Presenta errores auto correlacionados y problemas de heterocedasticidad. Esto puede deberse en gran medida a la autocorrelación espacial de valores al ser el valor una variable espacial. Se seleccionaron mejores modelos para realizar una regresión geográficamente ponderada.

De los modelos de Regresión Lineal Simple, el mejor corresponde al modelo 2, en donde se utiliza el logaritmo del valor en función del Vector de ponderación total obtenido en el proceso analítico jerárquico.

De los modelos Multivariados los mejores son el 3 y 5 el cual se selecciona para el moldeo geográficamente ponderado.

En los modelos exponenciales el mejor modelo es el 7 el cual cumple con los supuestos de normalidad, homocedasticidad, multicolinealidad, pero no el de autocorrelación de los errores.

Se selecciona tanto el modelo 6 y 7 para realizar una regresión geográficamente ponderada, para tratar de esta manera la autocorrelación espacial de los errores y la heterocedasticidad

83


Posteriormente se evaluaron los modelos 8 y 9 que se enfocan en WGP, de los cuales no se obtuvo un resultado satisfactorio. Como fase final de la investigación, y buscando dar solución a problemas de correlación espacial de las variables, se desarrollaron los modelos 10, 11, 12, 13 y 14 los cuales son la ponderación espacial de los modelos 2, 3, 5, 6 y 7 respectivamente. Es decir, estos últimos modelos son modelos GWR. En este sentido se muestra de igual manera en el Anexo de Cálculos, los resultados obtenidos en ArcGIS 10.5 para cada modelo de regresión geográficamente ponderada. Tabla 20: Comparativo Modelos.

MODELO

Distancias M

índice de Adecuación

Coef. Correlación Pearson

RMS

Error Típico

Observaciones

MODELO BASE

8,123,242.00

0.0%

0.837

91,715.92

84,899.56

MODELO 1

10,201,428.71

-25.6%

0.822

87,715.79

88,322.83

MODELO 2

7,337,211.65

9.7%

0.860

86,264.93

79,077.53

MODELO 3

5,340,067.18

34.3%

0.951

47,476.85

47,805.42

MODELO 4

8,966,240.77

-10.4%

0.874

74,728.36

75,245.51

MODELO 5

8,714,544.02

-7.3%

0.883

72,169.81

72,669.26

MODELO 6

8,478,768.51

-4.4%

0.853

145,308.75

81,034.87

MODELO 7

4,984,068.42

38.6%

0.938

56,169.70

53,948.17

Modelo base ZHG del IGAC No es lineal. no presenta normalidad en los errores. presenta autocorrelación. No mejoras la solución base No presenta normalidad en los errores. presenta autocorrelación Las pruebas de Normalidad no son concluyentes, Presenta autocorrelación, Problemas de linealidad Presenta autocorrelación No mejoras la solución base Normalidad en los errores. bien especificado. pero autocorrelación de los errores. No mejoras la solución base Variables no lineales. presenta normalidad en los errores. Pero autocorrelación de errores, No mejoras la solución base Autocorrelación de errores

MODELO 8

11,693,527.78

-44.0%

0.822

132,229.01

88,322.83

No mejoras la solución base

MODELO 9

6,654,381.89

18.1%

0.915

65,485.67

62,469.19

MODELO 10

4,790,360.28

41.0%

0.944

52,506.51

51,076.23

MODELO 11

4,327,357.08

46.7%

0.964

40,741.24

40,994.75

MODELO 12

5,008,494.02

38.3%

0.952

47,209.07

47,442.38

MODELO 13

5,215,788.76

35.8%

0.928

73,062.50

57,823.48

MODELO 14

4,367,675.47

46.2%

0.954

50,341.98

46,444.07

Modelo 2 con componente geográfico, Presenta autocorrelación espacial de los errores. problemas de especificación del modelo, Modelo 3 con componente geográfico, Sin problemas de autocorrelación espacial Modelo 5 con componente geográfico, Sin problemas de autocorrelación espacial Modelo 6 con componente geográfico, Sin problemas de autocorrelación espacial Modelo 7 con componente geográfico, Sin problemas de autocorrelación espacial

84


Como se aprecia en la Tabla 20: •

Todos los modelos que fueron probados con regresión lineal (Modelos 1,2,3,4,5) presentan problemas de autocorrelación o no normalidad en los errores, situación que se debe a las relaciones espaciales que se derivan de la distribución de valores del terreno, donde se presentan altos valores hacia zonas específicas como centros poblados o áreas aledañas al casco urbano; Esta situación también se hacía evidente según lo descrito en la Tabla 19: Resumen de los estadísticos de los modelos lineales. Por este motivo se decide tener en cuenta el componente espacial a partir de un modelo de regresión geográficamente ponderado, el cual tiende a solucionar los problemas de autocorrelación espacial y no normalidad de los errores.

Los modelos WGP o de programación por metas ponderada, el modelo 8 no mejoran sustancialmente los valores encontrados con la metodología del IGAC, mientras que el modelo 9 lo hace en un 18.1%; mejora que es muy baja en comparación con los demás modelos planteados. Si bien, en este caso particular no se logra una mejora significativa, en general se recomienda para futuros trabajos testear el modelo WGP, gracias a su sencillez.

El modelo 10, a pesar de mejorar las estimaciones y disminuir el RMS, presenta según el estadístico I de Moran problemas de autocorrelación espacial de tipo clústeres, motivo por el cual existirían restricciones para su uso, puesto que indica que no se ha solucionado el problema de autocorrelación espacial. Sin embargo, mejora en un 41% la solución base, según el índice de adecuación.

El modelo 12 mejora bastante la solución planteada en el modelo 5 al agregar el componente espacial. Según el índice de adecuación mejora la solución base en 38.3%. No presenta problemas de autocorrelación espacial. Sin embargo, existen modelos con mejores estadísticos de ajuste.

El modelo 13 mejora bastante la solución planteada en el modelo 6 al agregar el componente espacial. Según el índice de adecuación mejora la solución base en 35.79%. Sin embargo, como se verá más adelante, este modelo puede presentar problemas de fuerte autocorrelación espacial no detectados. Por otra parte, existen modelos con mejores estadísticos de ajuste.

Los modelos 11 y 14 son los que presenta los mejores estadísticos, Según el índice de adecuación mejora la solución base en 46.7% y 46.2% respectivamente. No obstante, el modelo 11, a pesar de ser estadísticamente el mejor, como se verá más adelante, 85


espacialmente tiene problemas de predicción, ya que estima valores negativos hacia algunos sectores por lo cual debe desecharse. •

En general se puede concluir que el modelar las variables a partir del proceso analítico jerárquico, unido a modelo de regresión lineal mejora, para el caso de Tabio, en cerca de un 30% las estimaciones realizadas por la metodología del IGAC.

Al modelar los errores con el componente espacial, en el modelo de regresión geográficamente ponderada, se logra una mejoría de un 45% en las estimaciones con relación al escenario base o modelo el IGAC.

4.2 ANÁLISIS ESPACIAL DE RESIDUALES Y VALORES En este apartado se muestra la variabilidad espacial de los errores de los modelos, junto con la predicción de valores de los mejores modelos encontrados, esto con el fin de detectar las zonas en las que el modelo de predicción falla y determinar la implicancia que esto tiene a nivel global, visualizando las áreas donde el pronóstico se acerca a los valores muestreados y donde se encuentran focalizados o distribución los errores. Una de las principales condiciones que debe guardar el modelo de predicción es garantizar que el valor de terreno no se igual o inferior a cero, es decir no deben existir valores de terreno o negativos, ya que la realidad muestra que ningún terreno dentro del municipio, tendría un valor de mercado igual a cero, dado que, en un mercado de libre competencia y concurrencia, siempre existiría un comprador dispuesto a pagar una cantidad de dinero. Para el análisis estadístico de residuales se parte de 146 datos de muestra de valor comercial del área de estudio, conformadas por 55 ofertas de mercado inmobiliario como se indicó en 3.4 y 91 datos de avalúos realizados a lo largo del municipio definidos bajo los criterios muestrales y de distribución espacial indicados en 3.6 . Vale aclarar que si bien en el capítulo de muestras se seleccionaron 72 predios como objetos de avaluó, estos corresponden a 91 referencias de valores unitarios de terreno, no obstante, algunos predios, dependiendo de su extensión, están sobre diferentes ZHF, obligando la valoración conjunta de diferentes unidades fisiográficas debido a que presentan diversas características, las cuales deben valorarse independientemente. A partir de estos 146 puntos donde se conoce el valor de terreno, se procede a establecer cada uno de los residuales que cada uno de los 15 modelos.

86


Para el caso de los residuales y su variación espacial se muestra en el anexo Cartográfico: Mapa Errores de las ZHG IGAC y los 14 modelos propuestos respecto a las muestras la variación espacial de los errores

y de la distancian manhattan de cada modelo. A

continuación, se extrae aparte de este mapa para cada uno de los modelos.

Ilustración 21: Residuales Modelo Base y Modelo 1.

La Ilustración 21: Residuales Modelo Base y Modelo 1. muestra el modelo base o modelo de zonas geoeconómicas del IGAC a la izquierda, siendo este el modelo base con el cual se pretende comparar. Gráficamente se aprecia como los residuos aumentan hacia la zona central, donde se presenta usos agrícolas o de vivienda campestre, que corresponden a las zonas más costosas del municipio. Por otra parte, los residuales del Modelo 1 aumentan en toda el área 87


del municipio, lo cual sumado a lo descrito en las pruebas realizadas en 4.1 descartan este modelo.

Ilustración 22: Residuales Modelo 2 y Modelo 3.

En la Ilustración 22: Residuales Modelo 2 y Modelo 3., para el modelo 2, espacialmente el área de residuales bajos es mayor que la solución base, lo cual indica para esas zonas una buena capacidad de explicación del modelo, pero presenta unos residuales muy altos hacia la zona sur, con lo cual se detecta una posible correlación espacial de los errores. Para el modelo 3, gráficamente se ve una mejoría de la distribución espacial de los residuales, los cuales aún se agrupan hacia la zona que se extiende diagonalmente en del municipio lo cual indicaría que presenta una posible correlación espacial de residuos. Como se describe en las estadísticas en 4.1 , este modelo a pesar de utilizar una única variable, mejora 88


significativamente los estadísticos, específicamente el índice de adecuación muestra que mejora la estimación base en un 34.26%.

Ilustración 23: Residuales Modelo 4 y Modelo 5.

La Ilustración 23: Residuales Modelo 4 y Modelo 5. muestra los residuales de los modelos 4 y 5 estos aumentan en toda el área del municipio, en general estos modelos no ajustan los datos, situación concordante con estadísticos mostrados en 4.1.

89


Ilustración 24: Residuales Modelo 6 y Modelo 7.

La Ilustración 24: Residuales Modelo 6 y Modelo 7. muestra para el modelo 6 que espacialmente el área de residuales bajos es mayor que la solución base, lo cual indica para esas zonas una buena capacidad de explicación del modelo, pero presenta unos residuales muy altos hacia la zona central, con lo cual se confirma una correlación espacial de los errores que se evidenciaba según las pruebas de normalidad y autocorrelación llevadas a cabo en 4.1. Ese modelo falla en la predicción de zonas costosas, ya que sobreestima casi al doble los valores. Para el modelo 7 el modelo falla en dos zonas específicas, una zona ubicada hacia el norte y otra hacia el sur, donde se evidencia la autocorrelación espacial de los errores, situación que podría mejorarse con la aplicación de un modelo GRW. Los residuales no son muy altos, y en general se ve visualmente una mejora en las estimaciones con relación a la solución base. El modelo 7 mejora en un 38.64% la estimación base según el índice de adecuación. 90


Ilustración 25: Residuales Modelo 8 y Modelo 9.

La Ilustración 25: Residuales Modelo 8 y Modelo 9. muestra para el modelo 8 y 9 que los residuales aumentan en toda el área del municipio, en general estos modelos no mejoran significativamente los resultados del modelo base IGAC.

91


Ilustración 26: Residuales Modelo 10 y Modelo 11.

La Ilustración 26: Residuales Modelo 10 y Modelo 11. muestra que el modelo 10

mejora

significativamente la estimación y hace una reducción en los residuales, sin embargo, este modelo, una vez se evalúa el estadístico I de Moran presentaría autocorrelación espacial. (Ver Anexo). Por otra parte, el modelo 11 mejora significativa con relación al modelo base, especialmente no se detecta una autocorrelación espacial fuerte.

92


Ilustración 27: Residuales Modelo 12 y Modelo 13.

La Ilustración 27: Residuales Modelo 12 y Modelo 13. muestra que el modelo 12 mejora significativa con relación al modelo base. Por otra parte, el modelo 13, si bien mejora la estimación, hacia la zona sur existen 2 zonas donde los residuales son altos, lo cual puede indicar una posible autocorrelación espacial no detectada.

93


Ilustración 28: Residuales Modelo 14.

La Ilustración 28 muestra que el modelo 14 mejora significativamente la estimación y hace una reducción en los residuales, encontrándose dos áreas en específico donde se concentra los mayores valores de residuales, lo cual puede ser una autocorrelación espacial no detectada. Sin embargo, este modelo mejora significativa con relación al modelo base del IGAC en un 46.23% siendo el segundo el ajuste más alto después del modelo 11.

Del análisis residual se concluye que: •

Los mejores modelos son aquellos que involucran la regresión geográficamente ponderada ya que minimizan al máximo los residuales obtenidos.

Los modelos de regresión lineal no ajustan los valores de terreno, salvo excepcionalmente el modelo 3.

Los modelos obtenidos a partir de programación por metas ponderado no ajustan adecuadamente espacialmente no mejoran la solución base de ZHG del IGAC.

Los mejores modelos para utilizar serian el modelo 11, 12 y el modelo 14 ya que minimizan los residuales en gran parte del área del municipio y logrando Índices de adecuación de 46.7%, 38.34% y 46.2% respectivamente. 94


Se procede con los 2 mejores modelos a graficar los valores que los mismos predicen para las diferentes zonas del municipio a fin de detectar si estos entregan valores negativos.

Ilustración 29: Valores predichos por los modelos 11 y 14.

En la Ilustración 29: Valores predichos por los modelos 11 y 14. se muestra a la izquierda los valores predichos por el modelo 14 y a la derecha los predicho con el modelo 11, gráficamente se aprecia que existen zonas a las cuales el modelo 11 entrega valores negativos o cercanos a cero. Realizando la medición de las áreas en las cuales el modelo 11 falla, corresponde a 1,127 Ha que son un 15,4% del territorio del Municipio de Tabio. Por lo anterior, y a pesar de que estadísticamente en la Tabla 20: Comparativo Modelos. se señalaba que el modelo 11 era uno de los modelos con mejor ajuste, por los análisis espaciales de residuales, debe ser rechazado. 4.3 EVALUACIÓN DE APLICABILIDAD Y ADAPTABILIDAD A continuación, se realiza la evaluación de Aplicabilidad y Adaptabilidad a los tres grandes conjuntos de métodos utilizados: Regresiones Lineales, WGP y GWR. Esta evaluación es presentada en las siguientes cuatro tablas (tablas 21 a 24), teniendo en las dos primeras la desagregación por tipo de Regresiones Lineales, seguida de la aplicabilidad y adaptabilidad para los modelos WGP y cerrando con la evaluación de los modelos GWR, entendiendo la aplicabilidad como cuan aplicable al caso de estudio resulta ser el modelo, o si dadas las 95


condiciones de datos no es recomendable su utilización, y definiendo la adaptabilidad como el volumen de cambios que se deben realizar al modelo del IGAC para poder ejecutar el modelo, es decir cuan adaptable a la condición actual de datos y normativa seria el modelo propuesto. Tabla 21 :Aplicabilidad de los Modelos de Regresión

Regresión SIMPLE

LINEAL Modelo 1

NO LINEAL Modelo 2

Para el caso de estudio no es recomendable dado la extrema generalización del modelo, puesto que el valor no puede ser explicado a partir de la condensación de una sola variable. Los resultados de pronóstico de un modelo uni-variado pierden potencial de explicación. Dado que el modelo tiene estructura rectilínea, teóricamente no es aplicable ya que son pocas las ocasiones en que valor del suelo frente a sus variables formadoras se comporte como una recta.

No es recomendable dado la extrema generalización del modelo, puesto que el valor no puede ser explicado a partir de la condensación de una sola variable. Los resultados de pronóstico de un modelo uni-variado pierden potencial de explicación. Dado a que proviene de un modelo potencial que se linealiza, su estructura de curva parece mejora el pronóstico del valor del suelo, pero no a un nivel mayor al que se logra con las Zonas homogéneas del IGAC.

Modelo 3

Modelo 4 - Modelo 5 - Modelo 6 - Modelo 7

Su poder de predicción es mayor dado que involucra más variables formadoras del valor del Regresión suelo, modelando una mejor variación del valor. MÚLTIPLE Pero el hecho de agregar más variables debe ser sopesado bajo el principio de parsimonia: La mejor estimación a partir del menor número de variables posible.

Estas regresiones asumen variables no lineales, dado que la racionalidad económica supone relaciones no lineales entre el suelo y las variables definidas que son posibles linealizar mediante logaritmos. Su poder de predicción es mayor modelando una mejor variación del valor, pero el hecho de agregar más variables debe ser sopesado bajo el principio de parsimonia: La mejor estimación a partir del menor número de variables posible.

96


Tabla 22. Adaptabilidad de los Modelos de Regresión

Regresión SIMPLE

LINEAL Modelo 1

NO LINEAL Modelo 2

Requiere ponderación de las variables para construcción de Zonas Homogéneas Físicas. No requiere de un volumen de datos amplio. No requiere chequeo de estadísticos tan grandes (no aplica la multicolinealidad). No supone un mayor esfuerzo matemático y técnico computacional.

Requiere ponderación de las variables para construcción de Zonas Homogéneas Físicas. No requiere de un volumen de datos amplio. No requiere chequeo de estadísticos tan grandes (no aplica la multicolinealidad). No supone un mayor esfuerzo matemático y técnico computacional.

Modelo 3

Modelo 4 - Modelo 5 - Modelo 6 - Modelo 7

Requiere ponderación de las variables para construcción de Zonas Homogéneas Físicas. La inclusión de nuevas variables consume grados de Regresión libertad del modelo, por ende se requiere de un MÚLTIPLE equilibrio de datos y variables. La estadística es más robusta, el investigador deber revisar temas de multicolinealidad para la selección del mejor modelo. Requiere mayor manejo estadísticos y econométricos, así como entendimiento de los estadísticos para llegar a pronósticos racionales.

Requiere ponderación de las variables para construcción de Zonas Homogéneas Físicas. La inclusión de nuevas variables consume grados de libertad del modelo, por ende se requiere de un equilibrio de datos y variables. La estadística es más robusta, el investigador deber revisar temas de multicolinealidad para la selección del mejor modelo. Requiere mayor manejo estadísticos y econométricos, así como entendimiento de los estadísticos para llegar a pronósticos racionales.

Tabla 23 Aplicabilidad y Adaptabilidad de los Modelos de WGP

Programación de Objetivos Ponderados (WGP) Modelo 8 - Modelo 9 Aplicabilidad Adaptabilidad Dentro del caso de estudio empeora la solución, sin embargo, se recomienda la exploración de su aplicabilidad según cada caso. Supone de hecho que las variables deben ser lineales, lo cual riñe con los conceptos económicos que de por no siempre la relación valor vs variables explicativas es lineal

Requiere ponderación de las variables para construcción de Zonas Homogéneas Físicas. Requiere especial cuidado del investigador en la formulación de las ecuaciones y conocimiento de los paquetes estadísticos para resolver el sistema de ecuaciones, pero reduce la necesidad de manejo teórico pues al no requerir chequeo de estadísticos se hace más simple en lo matemático.

97


Tabla 24 Aplicabilidad y Adaptabilidad de los Modelos de GWR

Regresión Geográficamente Ponderada (GWR) Modelo 10 - Modelo 11 - Modelo 12 - Modelo 13 - Modelo 14 Aplicabilidad Adaptabilidad

Los modelos deben ser multivariables, por lo que se ajusta para la valoración de terreno. Los residuales deben presentar errores de autocorrelación espacial, lo cual coincide con la teoría económica y es condición típica del comportamiento del valor del suelo. Los modelos mediante WGR tienen en cuenta la componente posicional, teniendo a partir de la autocorrelación espacial una mejor explicación de la variabilidad espacial.

Requiere ponderación de las variables para construcción de Zonas Homogéneas Físicas. Requiere de un volumen de datos mayor y si no se cuenta con datos suficientes no sería posible su utilización. Igualmente requiere variables significativas y una buena distribución de la muestra. Estos modelos exigen un mayor manejo matemático y estadístico, además de disponer de mayores recursos de cómputo. Los pronósticos son los más precisos junto con las técnicas de Kriging y Cokriging, pues tienen en cuento la variabilidad espacial, fundamental en la valoración masiva.

4.4 ANÁLISIS Y DISCUSIÓN DE RESULTADOS De acuerdo a los análisis y resultados mostrados en 4.1 y 4.2, es el Modelo 14, el mejor modelo de ajuste. Este define como una Regresión Geográficamente Ponderada definida por la ecuación: 𝑙𝑜𝑔𝑣𝑎𝑙𝑜𝑟 = 𝛽0 + 𝛽1 ∗ 𝐴ℎ𝑝𝐴𝑔𝑢𝑎𝑠 + 𝛽2 ∗ 𝐴ℎ𝑝𝐶𝑙𝑎𝑠𝑒 + 𝛽3 ∗ 𝐴ℎ𝑝𝐷𝑒𝑛𝑠𝑖 + 𝛽4 ∗ 𝐴ℎ𝑝𝑉í𝑎𝑠 + 𝛽5 ∗ Log Norma Donde: 𝑙𝑜𝑔𝑣𝑎𝑙𝑜𝑟: Logaritmo de los valores metro cuadrado. 𝐴ℎ𝑝𝐴𝑔𝑢𝑎𝑠 : Ponderación de la variable Disponibilidad de aguas, obtenida a partir del proceso analítico jerárquico. 𝐴ℎ𝑝𝐶𝑙𝑎𝑠𝑒 : Ponderación de la variable Disponibilidad de aguas, obtenida a partir del proceso analítico jerárquico. 𝐴ℎ𝑝𝐷𝑒𝑛𝑠𝑖 : Ponderación de la variable Densidad, obtenida a partir del proceso analítico jerárquico 𝐴ℎ𝑝𝑉í𝑎𝑠 : Ponderación de la variable Vías, obtenida a partir del proceso analítico jerárquico Log Norma: Logaritmo de la Ponderación de la variable norma, obtenida a partir del proceso analítico jerárquico. 98


𝛽0 , 𝛽1 , 𝛽2 , 𝛽3 , 𝛽4 , 𝛽5 : Coeficientes de regresión. Este modelo resulta ser significativo según los estadísticos que se muestran en los anexos. Presentando un coeficiente de correlación espacial de R2 Ajustado=0,885 logrando cumplir la prueba de autocorrelación espacial I de Moran. Según los estadísticos definidos 3.8 y sintetizados en la Tabla 20: , este modelo mejora las estimaciones obtenidas a partir del modelo de zonas homogéneas geoeconómicas del IGAC en un 46.2%, de acuerdo con el índice de adecuación, reduciendo a cerca de la mitad, el error medio cuadrático RMS, La distancia de Manhattan y el error típico.

Ilustración 30: Valores m2 de terreno modelo final adoptado.

99


Gráficamente el mapa de valores de terreno obtenido muestra una variabilidad espacial adecuada, sin pronosticar valor negativos ni demasiado bajos. La

Ilustración 30: Valores m2 de terreno modelo final adoptado. muestra los valores m2 obtenidos para las zonas rurales, en el presente estudio para el municipio de Tabio. Ahora bien para mirar en proporción los resultados entre la metodología desarrollada y los valores IGAC se estimó el valor total de los terrenos del municipio a partir del Modelo Final contra el modelo del IGAC. Para el primero, se obtiene un valor de la totalidad de la extensión rural del municipio de 6.46 billones de pesos, mientras que utilizando los valores del IGAC se obtiene un valor de 9.26 billones de pesos. Según los resultados obtenidos, se encuentra que el modelo de ZHG del IGAC, sobrestimaría los valores de terreno en cerca de un 2.8 billones de pesos. Proporcionablemente los valores de IGAC estarían en un 43% por encima del modelo 14 encontrado y que presenta el mejor ajuste espacial a los datos de mercado de terrenos en Tabio. En este sentido, sería mucho más justo para los contribuyentes si los valores de sus terrenos fuesen estimados con el modelo 14 en comparativo con el del IGAC.

100


Tal como se señaló en la revisión de literatura, se confirma el hecho de la semejanza de la metodología de Krigring en un desarrollo de inspección, evidencia una enorme similitud con el modelamiento de Regresión Geográficamente Ponderada, pues ambas metodologías se basan en la correlación espacial, por lo que la formulación resulta ser equivalente. Por esta razón se descartó dentro de los modelos desarrollados o dicho de otra manera, es semejante a lo elaborado en torno a los modelos de Regresión Geográficamente Ponderada. Finalmente, en cuanto a el desarrollo de Redes Neuronales, se evidencia en su elaboración la necesidad de reunir una gran cantidad de datos de entrenamiento de la red, insumo que no es posible realizar dado los límites de recursos de la investigación (pues el número de avalúos necesarios aumenta exponencialmente) además de que sería un distanciamiento al objetivo de buscar propuestas eficientes para la valoración masiva.

101


5

CONCLUSIONES Y RECOMENDACIONES

Se determinaron las variables formadoras de valor, de mayor importancia para el municipio de Tabio, a partir de la participación de profesionales conocedores del comportamiento de mercado de los terrenos de la zona de estudio. Por medio de estas variables fue posible modelar valores obtenidos por diferentes técnicas como modelos de regresión simple, modelos de programación por metas ponderada, modelos de regresión múltiple, modelos de regresión geográficamente ponderada. Se logró identificar que el modelo actual de zonas homogéneas físicas y geoeconómicas establecido por el IGAC pronostica para el área de estudio valores de mercado mucho mejor que algunos modelos probados como el modelo de regresión simple lineal (modelo 1), el modelo de regresión simple no lineal (modelo 2), modelos de regresión múltiple (modelo 4 y modelo 5), y modelo de regresión múltiple en forma exponencial (modelo 6) y resulta para el caso de estudio mucho mejor que el modelo de programación por metas ponderado WGP (modelo 8). Ahora bien, se demuestra que el modelo de Zonas Homogéneas Físicas y geoeconómicas del IGAC puede ser susceptible de mejoras en la estimación, sobre todo, si se resuelve el tema de ponderación de variables uniéndolo al método de proceso analítico jerárquico. Según los estadísticos de distancia manhattan, índice de adecuación, error medio cuadrático, coeficiente de Pearson y error típico, el utilizar modelos de regresión múltiple con las variables capacidad de uso, densidad, norma y vías mejora las estimaciones en un 34.3% (modelo 3). Sin embargo, se debe tener especial cuidado y tratamiento de estos modelos debido a los problemas de normalidad, autocorrelación y linealidad, situación que se deriva especialmente de la autocorrelación espacial de los errores, situación que es normal debido a que los valores de los terrenos son un fenómeno espacial, fuertemente auto correlacionado. Igualmente ocurre con la utilización del modelo exponencial que utiliza las variables, aguas, capacidad de uso, densidad, vías, norma en logaritmo, ya que este mejora la estimación en un 38.6% (modelo 7) sin embargo presenta autocorrelación espacial de los errores que se aprecia a través del mapa de residuales, donde lo errores más altos se agrupan hacia las zonas más costosas. Para solucionar esto, se vinculó al análisis los modelos de regresión geográficamente ponderada y como resultado final se logra mejorar las estimaciones de valores de terreno 102


en un 46.2% (Modelo 14), solucionado los problemas de autocorrelación espacial y sin pronósticos de valores negativos en los valores de terreno. Dado lo anterior se puede concluir que el método de zonas homogéneas es susceptible de complementarse con otras técnicas a fin de mejorar los procesos de valoración masiva. Como recomendaciones para futuros trabajos se resaltan desde el punto de vista metodológico las siguientes: Se debe resaltar la importancia de los profesionales expertos y conocedores de las dinámicas de valores de la zona de estudio, de esto depende en gran medida la precisión del estudio, pues unas malas especificación de las condiciones económicas sesgan los modelos y dado que cada municipio tiene su comportamiento económico propio, es necesario en cada caso analizar independientemente con los expertos, las variables que están definiendo el valor. Aunque no se menciona, el cartografiar cada variable a un nivel de detalle adecuado supone un esfuerzo, el cual está relacionado con la existencia o no de información previa y en concordancia con el párrafo anterior, pueden existir, para casos específicos, variables que sean relevantes, las cuales pueden no tener una cartografía asociada, con lo cual se convierte en un reto de investigación, el lograr cartografiarla adecuadamente. No siempre los estadísticos puros y duros, estandarizados en un número, es el mejor indicador de estimación de un modelo. Es importante analizar las distribuciones espaciales de los errores dado a que los precios tiene comportamientos espaciales diversos. Se debe apelar a la racionalidad económica. El proceso analítico jerárquico es una herramienta poderosa para migrar de variables cualitativas a cuantitativas, no obstante, para establecer los pesos de las variables, matemáticamente es mejor utilizar las ponderaciones o pesos obtenidos a partir de modelos de regresión, donde el investigador, de acuerdo con los datos disponibles debe analizar diferentes modelos de ajuste. Es de suma importancia definir muestras distribuidas dentro del área de estudio, a las cuales se les practica un avalúo comercial; esto dado a que las ofertas de terrenos que se venden en el marcado, no se distribuyen uniformemente, con lo cual existen sectores donde el mercado no oferta bienes y como consecuencia se desconoce el valor comercial. 103


Las muestras deben complementar la falta de información es estos sectores, esto garantiza que el modelo funcione correctamente. Si se logran definir con mayor precisión los valores de mercado de los terrenos, lo cual sirve de base para los impuestos, se logra cumplir con el principio de equidad, terrenos más costosos, mayores impuestos, terrenos menos costos, menores impuestos.

104


BIBLIOGRAFÍA

Agencia Nacional de Mineria. (2020). Catastro Minero Colombiano. Recuperado el 2020, de http://www.cmc.gov.co:8080/CmcFrontEnd/consulta/index.cmc Alcaldía Municipal de Tabio. (2007). Acuerdo 002 de 2007. Por medio del cual se revisa y ajusta el Esquema de Ordenamiento Territorial para el Municipio de Tabio - Cundinamarca, adoptado mediante Acuerdo Municipal 001 de 2001. Arrow, K., y Raynaud, H. (1986). Social Choice and Multicriterion Decision Making. Cambridge, M. I. T. Press. Aznar, J., y Guijarro, F. (2015). Nuevos métodos de valoración - Modelos multicriterio. Valencia: Universitat Politécnica de Valéncia. Ballestero Pareja, E. (1994). Metodologia de la valoracion agraria y sus aplicaciones catastrales. CT Catastro, 8-20. Borrero, O. (2005). FORMACIÓN DE PRECIOS DEL SUELO URBANO. Lincoln Institute Land Policy, 1-40. Cadena Cepeda, H. (2001). Tesis (Especialización en Sistemas de Información Geográfica). Actualización de la metodología en la determinación de zonas homogéneas físicas, mediante la utilización de un SIG caso de estudio : municipio de Zipaquirá zona urbana. Bogota: Universidad Distrital Francisco José de Caldas - Instituto Geográfico Agustín Codazzi. Castellanos, R. (2007). Apuntaciones Conceptuales y Metodológicas para la Elaboración de Avalúos de Bienes Inmuebles. Bogotá D.C.: Camara de la Propiedad Raiz Lonja Inmobiliaria. Cervelló, R. (2008). Evolución del mercado inmobiliario en centros urbanos. Efectos de la política de intervención pública. Valencia: UNIVERSIDAD POLITÉCNICA DE VALENCIA. Chica, J., y Cano, R. (1992). Una Metodología Objetiva para las Valoraciones Inmobiliarias. En Programación, selección, control y valoración de proyectos, Capitulo 7 (pág. 2004). Granada: Departamento de Métodos Cuantitativos para la Economía y la Empresa Universidad de Granada. Congreso de la Republica de Colombia . (1983). Por la cual se fortalecen los fiscos de las entidades territoriales y dictan otras disposiciones. Bogotá D.C: Diario Oficial No. 36.288. Congreso de la Republica de Colombia. (18 de julio de 1997). Ley 388. Por la cual se modifica la Ley 9 de 1989, y la Ley 2 de 1991 y se dictan otras disposiciones. Diario Oficial No. 43.091. CONPES. Consejo Nacional de Política Económica y Social. (2016). Documento 3859. Política para la adopción e implementación de un catastro multipropósito rural-urbano. Bogotá. CONPES. Consejo Nacional de Política Económica y Social. (2019). Documento 3958. Estrategia para la Implementación de la Politica Pública de Catastro Multiproposito. Bogotá.

105


Contaduría General de la Nacion. (2020). Resolución 190 de 2020. Porla cualse expide la certificación de categorización de las entidadesterritoriales: departamentos, distritos y municipios, conforme a lo dispuesto en las Leyes 136 de 1994, 617 de 2000 y el Decreto 2106 de 2019. Bogotá. Contraloría de la Republica. (2017). Consideraciones para la implementación de un catastro multipropósito en Colombia. Boletín Macro Sectorial, 2-3. DANE. Departamento Administrativo Nacional de Estadística (2020). Censo Nacional de poblacion y vivienda 2018. Serie nacional de población por área, para el periodo 2020 – 2035. Colombia. DANE. Departamento Administrativo Nacional de Estadística (2020) Datos Indice de valoracion predial, Recuperado el 05 de 05 2020, de https://www.dane.gov.co/index.php/estadisticaspor-tema/precios-y-costos/indice-de-valoracion-predial-ivp DNP. Departamento Nacional de Planeacion (2020). Datos territoriales TerriData. Recuperado el 20 de 03 de 2020 de https://terridata.dnp.gov.co/index-app.html#/perfiles/25785 Duque, J., Velásquez, H., y Agudelo, J. (10 de 06 de 2011). Infraestructura pública y precios de vivienda : una aplicación de regresion geograficamente ponderada en el contexto de precios Hedonicos. Medellin, Colombia. Ebra, D. A. (2008). El Catastro territorial en America Latina y el Caribe. Cambridge: Lincoln Institute of Land Policy. ESRI. Environmental Systems Research Institute (2020) Conceptos basico de regresion ArcGIS for desktop. Recuperado el 10 de 04 de 2020, de http://desktop.arcgis.com/es/arcmap/10.3/tools/spatial-statistics-toolbox/regressionanalysis-basics.htm Gujarati, D. (2009). Econometría. NUEVA YORK: McGraw-Hill/Irwin, Inc. Hidalgo, O. F. (1993). Metodología para la determinación de zonas homogéneas físicas mediante la implementación de un Sistema de Información Geográfica. Bogota: Universidad Distrital Francisco José de Caldas. IGAC. Instituto Geográfico Agustín Codazzi (4 de Febrero de 2011). Resolución 070 de 2011. Por la cual se reglamenta técnicamente la formación catastral, la actualización de la formación catastral y la conservación catastral. IGAC. Instituto Geográfico Agustín Codazzi (2017). Metodología elaboración del estudio de Zonas Homogeneas Físicas y Geoeconomicas y determinación del valor unitario por tipo de construcción. Bogotá D.C: Instituto Geografico Agustín Codazzi. IGAC.Instituto Geográfico Agustín Codazzi. (2000). Estudio general de suelos y zonificación de tierras del Departamento de Cundinamarca. Bogota: IGAC. IGAC.Instituto Geografico Agustin Codazzi. (01 de 09 de 2020). GEOPORTAL IGAC. Obtenido de https://geoportal.igac.gov.co/contenido/consulta-catastral IGAC.Instituto Geográfico Agustín Codazzi- Subdirección de Agrología - Grupo Interno de Trabajo Geomática. (2001). Estudio General de Suelos del Departamento de Cundinamarca, República de Colombia. Escala 1:100.000. Bogota.

106


Jaramillo, S. (1994). Hacia una teoria de rentas del suelo urbano. Bogota: Universidad de Loa Andes Facultad de Economia. Jiménez, J. M. (2001). EL PROCESO ANALÍTICO JERÁRQUICO (AHP) FUNDAMENTOS, METODOLOGÍA Y APLICACIONES. Dpto. Métodos Estadísticos. Facultad de Económicas. Universidad de Zaragoza, 33. Klingebiel, A., y Montgomery, P. (1961). Land - Capability Classification. Soil Conservation Service. Llano Elcid, A. (2007). Valoraciones inmobiliarias. Fundamentos teóricos y manual práctico. Bilbao: Ediciones Inmobiliarias Llano. Martinez, C. (2012). Estadística y Muestreo. 13. Bogotá: Ecoe Ediciones. Matos, R., y Salado, M. (2018). El componente espacial en la valoración de inmuebles residenciale: Uso de la regresion geograficamente ponderada. Geografia y Sistemas de Informacion Geografica (GEOSIG), 167-188. Mendenhall, W., Beaver , R., y Beaver, B. (2010). Introducción a la probabilidad y estadística. 13. Mexico D.F.: Cengage Learning Editores. Microsoft Corporation. (01 de 09 de 2020). Bing Maps . Obtenido de https://www.bing.com/maps Miller, G. A. (1956). The magical number seven, plus or minus two. Some limits on our capacity for processing information. The Psychological Review 63, 81-97. Molina, L., y Barreto, L. (2018). Catastro y Planificación territorial: Desafios para implementar los acuerdos de la Habana. Revista de Ingenieria 46, 60 - 69. Monzani, F., Montenegro, M., Piumetto, M., Cordoba, M., y Salomón, M. (2018). Técnicas Geoestadísticas Aplicadas a la Valuación Masiva de la Tierra Urbana: El Caso de la Ciudad de Rio Cuarto, Provincia de Córdoba. Cordoba: COBRAC. Mora, J. (2008). Modelos de valoración automatizada. CT: Catastro, 51-68. Muñoz Mora, J., y Cardona Jaramillo, H. (2013). El precio de la Tierra: Estado del arte de las metodologías de valoración de predios rurales y su aplicación en Colombia. Suma de Negocios, Vol. 4 N° 1, 21-31. Nuñes, J., Rey, F., y Caridad, J. (2016). Redes neuronales (RN) aplicadas a la valoración de locales comerciales. Informes de la Construcción, 69(545): e179. Pardo, Y. (2005). Valoracion Economica de Predios Agropecuarios en Paisaje de Lomerio y Vega en la Zona de Colonizacion del Caqueta. Bogota: Universidad de los Andes. Parias, A. (2010). Reseña de: Hacia una Teoria de la Renta del Suelo Urbano de Samuel Jaramillo Gonzalez. Bogotá: Ediciones Uniandes. Pérez, F. (2015). Ecnomia politica y métodos de avalúo del suelo. Equidad y Desarrollo(24), 5395. Reyna, G. (2016). Modelamiento de un sistema de valoración multicriterio del suelo para catastro rural empleando el Proceso Analítico Jerárquico. Sangolqui: Universidad de las Fuerzas Armadas.

107


Rosen, S. (1974). Hedonic Prices and Implicit Markets: Product Differentiation in Pure Competition. Journal of Political Economy Vol. 82, No. 1 , 34-55. Sánchez Peña, L. (2012). Alcances y límites de los métodos de análisis espacial para el estudio de la pobreza urbana. (E. C. México, Ed.) Papeles de Poblacion No 72, 148-179. SIGAGRO. Sistema de Información Geográfica y Agropecuaria del Ministerio de Agricultura, Ganadería, Acuacultura y Pesca de Ecuador (2008). Metodologia de valoracion de tierras Rurales. Quito: Ministerio de Agricultura, Ganadería, Acuacultura y Pesca de Ecuador. Tusell, F. (2011). Análisis de Regresión. Introduccion teorio y practica en R. Bilbao.

108


Anexos

109


INDICE 1

Analisis exploratorio de datos .................................................................................... 3 1.1

Modelos de Regresión Lineal Simple. ............................................................. 7 1.1.1

Modelo 1 ....................................................................................................... 7

1.1.1.1 Linealidad .................................................................................................. 8 1.1.1.2 Prueba de normalidad ................................................................................ 8 1.1.1.3 Prueba de heterocedasticidad .................................................................. 11 1.1.1.4 Prueba de multicolinealidad .................................................................... 11 1.1.1.5 Prueba de autocorrelación ....................................................................... 11 1.1.2

Modelo 2 ..................................................................................................... 12

1.1.2.1 Linealidad ................................................................................................ 12 1.1.2.2 Prueba de normalidad .............................................................................. 13 1.1.2.3 Prueba de heterocedasticidad .................................................................. 15 1.1.2.4 Prueba de multicolinealidad .................................................................... 15 1.1.2.5 Prueba de autocorrelación ....................................................................... 16 1.2

Modelos de Regresión Múltiple .................................................................... 16 1.2.1

Modelo 3 ..................................................................................................... 16

1.2.1.1 Prueba de normalidad .............................................................................. 17 1.2.1.2 Prueba de heterocedasticidad .................................................................. 19 1.2.1.3 Prueba de Multicolinealidad.................................................................... 19 1.2.1.4 Prueba de autocorrelación ....................................................................... 20 1.2.2

Modelo 4 ..................................................................................................... 20

1.2.2.1 Prueba de normalidad .............................................................................. 21 1.2.2.2 Prueba de Heterocedasticidad ................................................................. 23


1.2.2.3 Prueba de multicolinealidad .................................................................... 23 1.2.2.4 Prueba de autocorrelación ....................................................................... 24 1.2.2.5

Modelo 5 ................................................................................................. 24

1.2.2.6 Prueba de normalidad .............................................................................. 25 1.2.2.7 Prueba de heterocedasticidad .................................................................. 27 1.2.2.7.1 Prueba de Multicolinealidad.................................................................. 27 1.2.2.8 Prueba de autocorrelación ....................................................................... 28 1.3

Modelos Exponenciales. ................................................................................ 28 1.3.1

Modelo 6 ..................................................................................................... 29

1.3.1.1 Prueba de normalidad .............................................................................. 30 1.3.1.2 Prueba de heterocedasticidad .................................................................. 31 1.3.1.3 Prueba de multicolinealidad .................................................................... 31 1.3.1.4 Prueba de autocorrelación ....................................................................... 32 1.3.2

Modelo 7 ..................................................................................................... 32

1.3.2.1 Prueba de normalidad .............................................................................. 33 1.3.2.2 Prueba de heterocedasticidad .................................................................. 35 1.3.2.3 Prueba de multicolinealidad .................................................................... 35 1.3.2.4 Prueba de autocorrelación ....................................................................... 36 1.4

Resumen de los modelos de regresión ........................................................... 36

1.5

Modelos Weighted Goal Programing WGP .................................................. 37 1.5.1

Modelo 8 ..................................................................................................... 37

1.5.2

Modelo 9 ..................................................................................................... 38

1.6

Regresión geográficamente ponderada -GWR .............................................. 39 1.6.1

Modelo 10 ................................................................................................... 39

1.6.2

Modelo 11 ................................................................................................... 42


1

1.6.3

Modelo 12 ................................................................................................... 45

1.6.4

Modelo 13 ................................................................................................... 47

1.6.5

Modelo 14 ................................................................................................... 50

ANALISIS EXPLORATORIO DE DATOS

En primera medida se presenta el análisis exploratorio para regresiones lineales, es decir, el modelamiento a partir de Variables Puras y Variables Logarítmicas. Estos se tratan más de acercamiento que a modelación de valores de terreno y se explican a continuación: •

Variables Puras

Para empezar, mediante el software RStudio se estudia la correlación existente entre las variables, con lo cual, se obtiene el siguiente resultado:

Ilustración 1: Correlación entre las variables estudiadas


Definición de variables Logvalor: Logaritmo Metro Cuadrado; Valorm2: Valor Metro Cuadrado; Ahp_Vias: ponderación obtenida únicamente para la variable vías en el proceso analítico jerárquico; Ahp_Norma: ponderación obtenida únicamente para la variable norma en el proceso analítico jerárquico; Ahp_Densi: ponderación obtenida únicamente para la variable densidad en el proceso analítico jerárquico; Ahp_Cobe: ponderación obtenida únicamente para la variable cobertura en el proceso analítico jerárquico; Ahp_Clase: ponderación obtenida únicamente para la variable capacidad agrologica el proceso analítico jerárquico; Ahp_Aguas: ponderación obtenida únicamente para la variable disponibilidad de agua en el proceso analítico jerárquico; Ahp: ponderación total obtenida por el proceso analítico jerárquico.

Con lo anterior es posible deducir que todas las correlaciones entre las variables son positivas, es decir que son directamente proporcionales entre ellas. Así mismo, se encuentra que las variables independientes que tienen un mayor nivel de correlación con las variables dependientes valorm2 y logvalor son Ahp, Ahp_Norma y Ahp_Capac, con lo cual se puede visualizar la relación que permitirá explicar el comportamiento del valor del terreno. Por otra parte, al observar los valores de correlación entre las variables dependientes, se evidencia una fuerte correlación entre las variables que representan el agua, la capacidad de uso del suelo, el uso del suelo, la norma y las vías contra la variable del AHP, ya que esta última representa la ponderación de las anteriores, aun así, también se evidencia una correlación entre las variables de norma de uso y capacidad de uso del suelo. Por medio del software RStudio se grafican las variables de logvalor y Valorm2 como dependientes, y la variable AHP como independiente, con el fin de interpretar la dispersión de los datos:


Ilustración 2: Dispersión de los datos

Definición de variables Ahp: ponderación total obtenida por el proceso analítico jerárquico; Logvalor: Logaritmo Metro Cuadrado; Valorm2: Valor Metro Cuadrado

Gracias a las gráficas se puede identificar el comportamiento diferencial entre Valorm2 vs Ahp y logvalor vs Ahp, donde se evidencia una mayor tendencia lineal por parte de la gráfica que usa el logaritmo del valor como variable independiente, representando una mejor opción para obtener el modelo lineal. •

Variable Logaritmo

Como segunda medida se calculan los logaritmos de las variables dependientes con fin de realizar el análisis de correlación. La razón de aplicar logaritmo a las variables radica en que en algunos casos el comportamiento de las variables no es lineal, con lo cual la aplicación de logaritmo ayuda a mejorar estos problemas. Se obtuvo los siguientes coeficientes de correlación:

Ilustración 3: Correlación entre las variables estudiadas Definición de variables:


logvalor: Logaritmo Metro Cuadrado; Valorm2: Valor Metro Cuadrado; log_Vias: logaritmo de la ponderación obtenida únicamente para la variable vías en el proceso analítico jerárquico; log_Norma: logaritmo de la ponderación obtenida únicamente para la variable norma en el proceso analítico jerárquico; log_Densi: logaritmo de la ponderación obtenida únicamente para la variable densidad en el proceso analítico jerárquico; log_Cobe: logaritmo de la ponderación obtenida únicamente para la variable cobertura en el proceso analítico jerárquico; log_Clase: logaritmo de la ponderación obtenida únicamente para la variable capacidad agrologica el proceso analítico jerárquico; log_Aguas: logaritmo de la ponderación obtenida únicamente para la variable disponibilidad de agua en el proceso analítico jerárquico; logahp: logaritmo de la ponderación total obtenida por el proceso analítico jerárquico.

De igual manera en concordancia con el análisis anterior, se obtiene que todas las correlaciones entre las variables son positivas, es decir que son directamente proporcionales entre ellas. Así mismo, se evidencia que las variables independientes que tienen un mayor nivel de correlación con las variables dependientes son logahp,log_norma y log_capac. Lo cual debe de ser controlado para evitar problemas de multicolinealidad. De igual manera es posible ver una fuerte correlación entre las variables individuales contra la variable del AHP, al igual que una correlación entre las variables de norma de uso y capacidad de uso del suelo. Por medio del software se grafican las variables de logvalor y Valorm2 como dependientes, y la variable logahp como independiente, con el fin de interpretar la dispersión de los datos

Ilustración 4: Dispersión de los datos Definición de variables


logvalor: Logaritmo Metro Cuadrado; ; logahp: ponderación total obtenida por el proceso analítico jerárquico; Valorm2: Valor Metro Cuadrado

Gracias a las gráficas se puede identificar el comportamiento diferencial entre Valorm2 vs logahp y logvalor vs logahp, donde se evidencia una mayor tendencia lineal por parte de la gráfica que usa el logaritmo del valor como variable independiente, representando una mejor opción para obtener el modelo lineal. Por el contrario, la gráfica donde se representa el Logaritmo del AHP contra el valor en crudo no presenta linealidad y dice que esta combinación no es recomendable para trabajar. 1.1 Modelos de Regresión Lineal Simple. Se analiza inicialmente los modelos de regresión con una única variable, los cuales por su sencillez son los más fáciles de obtener. Se omiten los modelos que fueron poco significativos. 1.1.1

Modelo 1

Para este primer modelo, se usó el valor por metro cuadrado y la puntuación obtenida por AHP, obteniendo un coeficiente de correlación R2 de 0.6758, lo cual indica que el modelo explica un 67.58% a la variable Valorm2, teniendo en cuenta que los residuos tienen un sesgo a la derecha y que la normalidad de los mismos se ve comprometida, se tiene que la variable AHP es significativa y el modelo como tal en primera instancia, parece representar una buena opción. En la Tabla 1 : Modelo 1 Regresión Lineal, se encuentra el resumen de proceso aplicado: Tabla 1 : Modelo 1 Regresión Lineal Simple

Residuales Ítem Mínimo Promedio Máximo Residuales - 89.591,00 - 8.927,00 205.815,00 Modelo Ítem Valor R2 0,6758 RSE 88.320 Valor p 2,2E-16 Coeficientes Ítem Estimado Valor p Sign.


Intercepto -186.451,40 AHP 13.334,50

2E-16 2E-16

De esta manera, la ecuación del modelo 1 queda de la siguiente manera: 𝑉𝑎𝑙𝑜𝑟𝑚2 = −186.451,4 + 13334,5 ∗ 𝐴𝐻𝑃 1.1.1.1

Linealidad

La Ilustración 5: Distribución de los errores – Modelo 1, representa la gráfica de los residuos con respecto al AHP, con el fin de observar la tendencia que sigue la distribución de los errores, con lo cual es posible evidenciar que no siguen una tendencia lineal, ya que la línea magenta difiere mucho de la línea azul punteada.

Ilustración 5: Distribución de los errores – Modelo 1

1.1.1.2

Prueba de normalidad

Para determinar la normalidad de los residuos, se utilizan diferentes gráficas que representen la distribución y la desviación de los residuos del modelo.


Ilustración 6: Residuos y valores predichos Modelo 1 Ilustración 6: Residuos y valores predichos Modelo 1,

presenta la gráfica entre los residuos y los

valores predichos revela que una gran cantidad de los residuos se encuentran más arriba del cero, es decir, que los residuos estarán sesgados a la derecha, también es posible apreciar que los residuos de mayor magnitud también son positivos, lo que lleva la tendencia aún más a la derecha.

Ilustración 7: Grafica entre los residuos y los cuantiles de normalidad – Modelo 1

La Ilustración 7: Grafica entre los residuos y los cuantiles de normalidad – Modelo 1, representa la gráfica entre los residuos y los cuantiles de normalidad deja en evidencia aquellos valores atípicos que salen sobre los límites de la normalidad, los cuales, en coherencia a lo encontrado anteriormente, también se encuentran en el sector positivo del eje.


Ilustración 8: Densidad de los residuos – Modelo 1

Como muestra la Ilustración 8: Densidad de los residuos – Modelo 1, se tiene la densidad de los residuos, lo que ayuda evidenciar si los residuos siguen una distribución normal, ya que si es así deberían asemejarse a una campana de Gauss, de lo cual no se está muy distantes, pero se pueden ver los datos atípicos del modelo. Por último, para corroborar los análisis realizados, se aplican los Test de Shapiro-Wilk y Kolmogorov Smirnov, con el fin de determinar la normalidad del conjunto de datos, en la Tabla 2 Test De Shapiro-Wilk Y Kolmogoroy Smirnov se identifican los resultados obteniendos: Tabla 2 Test De Shapiro-Wilk Y Kolmogoroy Smirnov

Pruebas de normalidad Prueba Estimado Shapiro-Wilk 0,97 Kolmogorov-Smirnov 0,06

Valor p 0,029 0,144

Según la prueba Shapiro-Wilk, se ve que el valor p es menor a 0.05, lo cual indica que se debe rechazar la hipótesis nula sobre la distribución normal de los datos, es decir, no siguen una distribución normal. Al ver que el valor p es mayor a 0.05 en el Test de Kolmogorov Smirnov, se decide aceptar la hipótesis nula sobre la distribución normal de los residuos, es decir, que sí siguen una distribución normal.


Debido a las pruebas discordantes, se decide que este modelo cumple con el supuesto de normalidad. 1.1.1.3

Prueba de heterocedasticidad

Con el fin de corroborar que el modelo no sufra de problemas de heterocedasticidad, es decir que la varianza de los residuos sea variable a través de las muestras se realiza la prueba de Breusch-Pagan como muestra la Tabla 3 Prueba De Heterocedasticidad obteniendo el siguiente resultado: Tabla 3 Prueba De Heterocedasticidad

Prueba de Heterocedasticidad Prueba Estimado Valor p Breusch-Pagan 29,77 4,84E-08

Según el valor p, se rechaza la hipótesis nula sobre la homocedasticidad de los residuos, es decir que este modelo es heterocedástico. 1.1.1.4

Prueba de multicolinealidad

Las pruebas de Multicolinealidad para modelos simples o de una sola variable, no son aplicables, debido a que la colinealidad se debe a la interacción entre las variables dependientes. 1.1.1.5

Prueba de autocorrelación

Para establecer si existe autocorrelación entre los residuos en Tabla 4 Prueba De Autocorrelación, se describe la aplicación del Test de Durbin-Watson, arrojando el siguiente resultado: Tabla 4 Prueba De Autocorrelación

Prueba de autocorrelación Prueba Estimado Valor p Dw 0,61046 4,84E-08 Dl 1,71208 Du 1,74064 Como Dw<Dl hay evidencia de autocorrelación


Esto tomando n = 144 como los datos usados para el modelo y k = 1, debido a que solo se usó una variable dependiente. 1.1.2

Modelo 2

Para este modelo, como lo muestra la Tabla 5 Modelo 2 De Regresión Lineal Simple, se usó el logaritmo del valor por metro cuadrado y la puntuación obtenida por Ahp, se obtiene un coeficiente de correlación R2 de 0.7406, lo cual indica que el modelo explica un 74.06% a la variable logvalor, teniendo en cuenta que los residuos tienen un sesgo mínimo a la izquierda, se tiene que la variable Ahp es significativa y el modelo como tal representa una mejor opción que la presentada en el Modelo 1. Tabla 5 Modelo 2 De Regresión Lineal Simple

Residuales Ítem Mínimo Promedio Máximo Residuales - 1,853 - 0,018 7,173 Modelo Ítem Valor R2 0,7406 RSE 0,6084 Valor p 2,2E-16 Coeficientes Ítem Estimado Valor p Sign. Intercepto 8,528409 2E-16 Ahp 0,1075 2E-16

De esta manera, la ecuación del modelo 2 queda de la siguiente manera: 𝐿𝑜𝑔𝑣𝑎𝑙𝑜𝑟 = 8,528409 + 0,1075 ∗ Ahp 1.1.2.1

Linealidad

En la Ilustración 9: Distribución de los errores– Modelo 2, se muestra los residuos con respecto al Ahp, con el fin de observar la tendencia que sigue la distribución de los errores, con lo cual se evidencia, que siguen una tendencia cercana a la lineal, ya que la línea magenta no difiere mucho de la línea azul punteada.


Ilustración 9: Distribución de los errores– Modelo 2

1.1.2.2

Prueba de normalidad

Ilustración 10: Residuos y valores predichos Modelo 1

La Ilustración 10: Residuos y valores predichos Modelo 1, muestra los residuos y los valores predichos, a diferencia del modelo anterior, se puede observar una aglomeración de datos en el centro de la gráfica, lo cual muestra una buena distribución de estos, contando con algunos datos atípicos.


Ilustración 11: Grafica entre los residuos y los cuantiles de normalidad – Modelo 2

La Ilustración 11: Grafica entre los residuos y los cuantiles de normalidad – Modelo 2, muestra los residuos y los cuantiles de normalidad, dejando en evidencia aquellos valores atípicos que salen sobre los límites de la normalidad, encontrando algunos tanto a la derecha como a la izquierda de la gráfica.

Ilustración 12: Densidad de los residuos – Modelo 2 Ilustración 12: Densidad de los residuos – Modelo 2, muestra la densidad de los residuos, la cual es

una manera muy sencilla de evidenciar si los residuos siguen una distribución normal, ya que de ser así deberían asemejarse a una campana de Gauss, de lo cual no se está muy distantes, pero se pueden evidenciar los datos atípicos del modelo.


Por último, para corroborar los análisis realizados, como se muestra en la Tabla 6 Test De Shapiro-Wilk Y Kolmorov Smirnov, con el fin de determinar la normalidad del conjunto de datos, obteniendo el siguiente resultado: Tabla 6 Test De Shapiro-Wilk Y Kolmorov Smirnov

Pruebas de normalidad Prueba Estimado Valor p Shapiro-Wilk 0,96 0,0003 Kolmogorov-Smirnov 0,09 0,0054

Según las pruebas Shapiro-Wilk y Kolmogorov-Smirnov, se observa que el valor p es menor a 0.05, lo cual indica que se debe rechazar la Hipótesis nula sobre la distribución normal de los datos, es decir, no siguen una distribución normal. 1.1.2.3

Prueba de heterocedasticidad

Con el fin de corroborar que el modelo no sufra de problemas de heterocedasticidad, es decir, que la varianza de los residuos sea variable a través de las muestras se realiza la prueba de Breusch-Pagan obteniendo el resultado que muestra la Tabla 7 Prueba De Heterocedasticidad: Tabla 7 Prueba De Heterocedasticidad

Prueba de Heterocedasticidad Prueba Estimado Valor p Breusch-Pagan 0,108 0,7423

Según el valor p, se acepta la hipótesis nula sobre la homocedasticidad de los residuos, es decir que este modelo es homocedástico. 1.1.2.4

Prueba de multicolinealidad

Las pruebas de Multicolinealidad para modelos simples o de una sola variable, no son aplicables, debido a que la colinealidad se debe a la interacción entre las variables dependientes.


1.1.2.5

Prueba de autocorrelación

Para establecer si existe autocorrelación entre los residuos, como muestra la Tabla 8 Prueba De Autocorrelación, se opta por aplicar el Test de Durbin-Watson, arrojando el siguiente resultado: Tabla 8 Prueba De Autocorrelación

Prueba de autocorrelación Prueba Estimado Valor p Dw 0,8030 9,63E-14 Dl 1,71208 Du 1,74064 Como Dw<Dl hay evidencia de autocorrelación

Por tanto, la prueba ofrece evidencia de que los residuos tienen una autocorrelación. 1.2 Modelos de Regresión Múltiple Se propone los modelos multivariados ya que se cuenta con 6 variables distintas y sus logaritmos. Esto con el fin de mejorar progresivamente la estimación de los valores de terreno y desechar aquellas variables que no contribuyan al modelo. Por otra parte, esto ayuda a lograr modelos estables y que cumplan con los supuestos estadísticos de los modelos de regresión lineal. 𝑦 = 𝛽0 + 𝛽1 𝑋1 + ⋯ 𝛽𝑛 𝑋𝑛 Donde las variables respuesta es lineal pero los Xn se utiliza igualmente la variable pura o en logaritmo. Se omiten los modelos que fueron poco significativos, para lo cual se aprovecha la selección del mejor modelo a partir de STEP-WISE o selección paso a paso que se realiza en RStudio. 1.2.1

Modelo 3

Para el modelo 3 se inicia con un modelo donde se usen todas las variables, explicando la variable del valor de metro cuadrado, sin embargo, por significancia de algunas variables, se hace la selección de modelo por StepWise obteniendo los resultados que describe la Tabla 9 Modelo 3 De Regresión Lineal Simple:


Tabla 9 Modelo 3 De Regresión Lineal Simple

Ítem Residuales

Residuales Mínimo Promedio Máximo - 110.525 - 969 161.861 Modelo

Ítem R2 R2 Ajustado RSE Valor p

Valor 0,905 0,9023 48310 2,2E-16 Coeficientes Ítem Estimado Valor p Sign. Intercepto -98.678,3 2E-16 Ahp Clase 810,8 0,0000821 Ahp Densidad 1.438,8 6,32E-10 Ahp Norma 17.187 2E-16 Ahp Via 993,7 2E-16

Luego de que la selección de modelo reflejara que el mejor modelo es aquel conformado por las variables de Capacidad de uso del suelo, Densidad, Norma de Uso del Suelo y Disponibilidad de Vías, se obtiene un coeficiente de correlación R2 de 0.9023, lo cual dice que el modelo explica en un 90.23% a la variable Valorm2, ligeramente superior al anterior, pero en este caso todas las variables son significativas. De esta manera, la ecuación del modelo 3 queda de la siguiente manera: 𝑉𝑎𝑙𝑜𝑟𝑚2 = −98.678,3 + 810,8 ∗ AhpClase + 1.438,8 ∗ AhpDensidad + 17.187 ∗ AhpNorma + 993,7 ∗ AhpVia

1.2.1.1

Prueba de normalidad

Para determinar la normalidad de los residuos, se utilizan diferentes gráficas que representen la distribución y la desviación de los residuos del modelo.


Ilustración 13: Grafica entre los residuos y los cuantiles de normalidad – Modelo 3

Ilustración 13: Grafica entre los residuos y los cuantiles de normalidad – Modelo 3, deja en evidencia aquellos valores atípicos que salen sobre los límites de la normalidad, los cuales se encuentran en el sector positivo del eje.

Ilustración 14: Densidad de los residuos – Modelo 3

Ilustración 14: Densidad de los residuos – Modelo 3, la cual es una manera muy sencilla de evidenciar si los residuos siguen una distribución normal, ya que de ser así estos deberían asemejarse a una campana de Gauss, de lo cual no se está muy distantes, pero se pueden evidenciar los datos atípicos del modelo.


Por último, para corroborar los análisis realizados, se aplican los Test de Shapiro-Wilk y Kolmogorov Smirnov, con el fin de determinar la normalidad del conjunto de datos, obteniendo el siguiente resultado que describe la Tabla 10 Test De Shapiro-Wilk Y Kolmogorov Smirnov: Tabla 10 Test De Shapiro-Wilk Y Kolmogorov Smirnov

Pruebas de normalidad Prueba Estimado Valor p Shapiro-Wilk 0,98 0,19 Kolmogorov-Smirnov 0,05 0,56

Según las pruebas Shapiro-Wilk y Kolmogorov-Smirnov, se observa que el valor p es mayor a 0.05, lo cual indica que se debe aceptar la Hipótesis nula sobre la distribución normal de los datos, es decir, sí siguen una distribución normal. 1.2.1.2

Prueba de heterocedasticidad

Con el fin de corroborar que el modelo no sufra de problemas de heterocedasticidad, es decir que la varianza de los residuos sea variable a través de las muestras se realiza la prueba de Breusch-Pagan obteniendo el siguiente resultado que describe Tabla 11 Prueba De Heterocedasticidad. Tabla 11 Prueba De Heterocedasticidad

Prueba de Heterocedasticidad Prueba Estimado Valor p Breusch-Pagan 32,79 1,31E-06

Según el valor p, se debe rechazar la hipótesis nula sobre la homocedasticidad de los residuos, es decir que este modelo es heterocedástico. 1.2.1.3

Prueba de Multicolinealidad

Para establecer la colinealidad entre las variables independientes se utiliza el Factor de Inflación de la Varianza o VIF por sus siglas en inglés, sabiendo que estos valores deben ser lo más bajos posible, para que el modelo sea correcto, el resultado obtenido se describe en la Tabla 12 Prueba De Multicolinealidad


Tabla 12 Prueba De Multicolinealidad

Prueba de Multicolinealidad Prueba Estimado VIF_Clase 1,74 VIF_Densidad 1,06 VIF_Norma 1,87 VIF_Vias 1,13

Como todos los valores de VIF están por debajo de 10, se dice que no existe una multicolinealidad fuerte entre las variables independientes. 1.2.1.4

Prueba de autocorrelación

A fin de establecer si existe autocorrelación entre los residuos, se opta por el Test de DurbinWatson, arrojando el siguiente resultado que describe la Tabla 13 Prueba De Autocorrelación : Tabla 13 Prueba De Autocorrelación

Prueba Estimado Valor p Dw 1,3414 1,60E-05 Dl 1,66856 Du 1,7844 Como Dw<Dl hay evidencia de autocorrelación

Si se toma n = 144 como los datos usados para el modelo y k = 4, la prueba ofrece evidencia de que los residuos tienen una autocorrelación. 1.2.2 Modelo 4 Como muestra la


Tabla 14 Modelo 4 Modelo De Regresión Lineal S usan los logaritmos de todas las variables, explicando la variable del valor de metro cuadrado, sin embargo, por significancia de algunas variables, se hace la selección de modelo por StepWise obteniendo:


Tabla 14 Modelo 4 Modelo De Regresión Lineal Simple

Ítem Residuales

Residuales Mínimo Promedio Máximo - 166.855 6.658 200.236 Modelo

Ítem R2 R2 Ajustado RSE Valor p

Valor 0,7647 0,758 76040 2,2E-16 Coeficientes Ítem Estimado Valor p Sign. Intercepto - 394.922 2E-16 Log Clase 41.580 2,30E-05 Log Densidad 26.965 7,00E-04 Log Norma 112.395 2E-16 Log Vías 41.632 1,30E-06

Luego de que la selección de modelo reflejara que el mejor modelo es aquel conformado por el logaritmo de las variables de Capacidad de uso del suelo, Densidad, Norma de uso del suelo y Vías, se obtiene un coeficiente de correlación R2 de 0.758, lo cual indica que el modelo explica en un 75.8% a la variable Valorm2, reduciendo la correlación a la obtenida en el modelo. De esta manera, la ecuación del modelo 4 queda de la siguiente manera: 𝑉𝑎𝑙𝑜𝑟𝑚2 = −394.922 + 41.580 ∗ LogClase + 26.965 ∗ LogDensidad + 112.395 ∗ LogNorma + 41.632 ∗ LogVia

1.2.2.1

Prueba de normalidad

Para determinar la normalidad de los residuos, se utilizan diferentes gráficas que representen la distribución y la desviación de los residuos del modelo.


Ilustración 15: Grafica entre los residuos y los cuantiles de normalidad – Modelo 4

La Ilustración 15: Grafica entre los residuos y los cuantiles de normalidad – Modelo 4 deja en evidencia que no hay valores que sobresalen de los límites de cuantiles.

Ilustración 16: Densidad de los residuos – Modelo 4

Ilustración 16: Densidad de los residuos – Modelo 4,

la cual es una manera muy sencilla de

evidenciar si los mismo siguen una distribución normal, ya que de ser así , deberían asemejarse a una campana de Gauss, de lo cual no se está muy distantes, pero se pueden evidenciar los datos atípicos del modelo.


Por último, como muestra la Tabla 15 Prueba De Normalidad, para corroborar los análisis realizados, se aplican los Test de Shapiro-Wilk y Kolmogorov Smirnov, con el fin de determinar la normalidad del conjunto de datos, obteniendo el siguiente resultado: Tabla 15 Prueba De Normalidad

Pruebas de normalidad Prueba Estimado Valor p Shapiro-Wilk 0,98 0,27 Kolmogorov-Smirnov 0,05 0,56

Según las pruebas Shapiro-Wilk y Kolmogorov-Smirnov, se observa que el valor p es mayor a 0.05, lo cual indica que se debe aceptar la Hipótesis nula sobre la distribución normal de los datos, es decir, sí siguen una distribución normal. 1.2.2.2

Prueba de Heterocedasticidad

Con el fin de corroborar que el modelo no sufra de problemas de heterocedasticidad, es decir que la varianza de los residuos sea variable a través de las muestras se realiza la prueba de Breusch-Pagan obteniendo el siguiente resultado, que describe la Tabla 16 Prueba De Heterocedasticidad: Tabla 16 Prueba De Heterocedasticidad

Prueba de Heterocedasticidad Prueba Estimado Valor p Breusch-Pagan 47,85 1,00E-09

Según el valor p, se debe rechazar la hipótesis nula sobre la homocedasticidad de los residuos, es decir que este modelo es heterocedástico. 1.2.2.3

Prueba de multicolinealidad

Para establecer la colinealidad entre las variables independientes se utiliza el Factor de Inflación de la Varianza o VIF por sus siglas en inglés, sabiendo que estos valores deben ser lo más bajos posible, para que el modelo sea correcto, se obtiene el resultado que muestra la Tabla 17 Prueba De Multicolinealidad:


Tabla 17 Prueba De Multicolinealidad

Prueba de Multicolinealidad Prueba Estimado VIF_Logclase 1,66 VIF_Logdensidad 1,04 VIF_Lognorma 1,72 VIF_Logvias 1,04

Como todos los valores de VIF están por debajo de 10, se dice que no existe una multicolinealidad fuerte entre las variables independientes. 1.2.2.4

Prueba de autocorrelación

Para establecer si existe Autocorrelación entre los residuos en la Tabla 18 Prueba De Autocorrelación se desarrolla el Test de Durbin-Watson, arrojando el siguiente resultado: Tabla 18 Prueba De Autocorrelación

Prueba de autocorrelación Prueba Estimado Valor p Dw 0,9318 1,43E-11 Dl 1,66856 Du 1,7844 Como Dw<Dl hay evidencia de autocorrelación

Si se toma n = 144 como los datos usados para el modelo y k = 4, la prueba ofrece evidencia de que los residuos tienen una autocorrelación. 1.2.2.5

Modelo 5

Para este modelo, se toma el valor por metro cuadrado contra las variables crudas de Capacidad de uso del suelo, Densidad predial, Vías y el Logaritmo de la Norma de Uso del Suelo, como lo describe la Tabla 19 Modelo 5 Regresión Lineal Simple:


Tabla 19 Modelo 5 Regresión Lineal Simple

Ítem Residuales

Mínimo Promedio - 157.207 6.510

Máximo 198.793

Modelo Ítem R2 R2 Ajustado RSE Valor p

Valor 0,7743 0,7805 73440 2,2E-16 Coeficientes Ítem Estimado Valor p Sign. Intercepto -173.254,7 2E-16 Ahp Clase 1.474,3 2,80E-06 Ahp Densidad 1.415,6 3,47E-05 Ahp Via 1.399,2 3,02E-06 Log Norma 103.579,6 2,00E-16

Se obtiene un coeficiente de correlación R2 de 0.7743, lo cual señala que el modelo explica en un 77.43% a la variable Valorm2, ligeramente superior al anterior. De esta manera, la ecuación del modelo 5 queda de la siguiente manera: 𝑉𝑎𝑙𝑜𝑟𝑚2 = −173.254,7 + 1.474,3 ∗ AhpClase + 1.415,6 ∗ AhpDensidad + 1.399,2 ∗ AhpVía + 103.579,6 ∗ LogNorma

1.2.2.6

Prueba de normalidad

Para determinar la normalidad de los residuos, se utilizan diferentes gráficas que representen la distribución y la desviación de los residuos del modelo.


Ilustración 17: Grafica entre los residuos y los cuantiles de normalidad – Modelo 5

Ilustración 17: Grafica entre los residuos y los cuantiles de normalidad – Modelo 5 deja en evidencia aquellos valores atípicos que salen sobre los límites de la normalidad, los cuales se encuentran en el sector positivo del eje.

Ilustración 18: Densidad de los residuos – Modelo 5 Ilustración 18: Densidad de los residuos – Modelo 5,

la cual es una manera muy sencilla de

evidenciar si los residuos siguen una distribución normal, ya que de ser así estos deberían asemejarse a una campana de Gauss, de lo cual no se está muy distantes, pero se pueden evidenciar los datos atípicos del modelo.


Por último, para corroborar los análisis realizados, como muestra la Tabla 20 Test De Shapiro-Wilk Y Kolmogorov Smirnov, se aplican con el fin de determinar la normalidad del conjunto de datos, obteniendo el siguiente resultado: Tabla 20 Test De Shapiro-Wilk Y Kolmogorov Smirnov

Pruebas de normalidad Prueba Estimado Valor p Shapiro-Wilk 0,98 0,10 Kolmogorov-Smirnov 0,06 0,11

Según las pruebas Shapiro-Wilk y Kolmogorov-Smirnov, se observa que el valor p es mayor a 0.05, lo cual indica que se debe aceptar la Hipótesis nula sobre la distribución normal de los datos, es decir, sí siguen una distribución normal. 1.2.2.7

Prueba de heterocedasticidad

Con el fin de corroborar que el modelo no sufra de problemas de heterocedasticidad, es decir que la varianza de los residuos sea variable a través de las muestras se realiza la prueba de Breusch-Pagan obteniendo el resultado que describe la Tabla 21 Prueba De Heterocedasticidad:

Tabla 21 Prueba De Heterocedasticidad

Prueba de Heterocedasticidad Prueba Estimado Valor p Breusch-Pagan 53,15 7,91E-11

Según el valor p, se debe rechazar la hipótesis nula sobre la homocedasticidad de los residuos, es decir que este modelo es heterocedástico. 1.2.2.7.1

Prueba de Multicolinealidad

Para establecer la colinealidad entre las variables independientes se utiliza el Factor de Inflación de la Varianza o VIF por sus siglas en inglés, sabiendo que estos valores deben ser lo más bajos posible, para que el modelo sea correcto, se obtiene lo siguiente:


Tabla 22 Prueba De Multicolinealidad

Prueba de Multicolinealidad Prueba Estimado VIF_Ahp Clase 1,72 VIF_Ahp Desidad 1,07 VIF_Ahp Vías 1,1 VIF_Lognorma 1,81

Como todos los valores de VIF están por debajo de 10, como lo muestra la


Tabla 22 Prueba De Multicolinealidad, se dice que no existe una multicolinealidad fuerte entre las variables independientes. 1.2.2.8

Prueba de autocorrelación

Para establecer si existe Autocorrelación entre los residuos se opta por el Test de DurbinWatson, arrojando el siguiente resultado, que describe la Tabla 23 Prueba De Autocorrelación: Tabla 23 Prueba De Autocorrelación

Prueba de autocorrelación Prueba Estimado Valor p Dw 0,8713 1,12E-12 Dl 1,66856 Du 1,7844 Como Dw<Dl hay evidencia de autocorrelación

Si se toma n = 144 como los datos usados para el modelo y k = 5, la prueba ofrece evidencia de que los residuos tienen una autocorrelación. 1.3 Modelos Exponenciales. Se propone los modelos de regresión múltiple de forma exponencial ya que se cuenta con 6 variables distintas y sus logaritmos. Lo cuales se expresan de la forma 𝑦 = 𝑒𝛽0 +𝛽1 𝑋1 +⋯𝛽𝑛 𝑋𝑛 Donde las variables respuesta es lineal pero los Xn se utiliza igualmente la variable pura o en logaritmo. Se omiten los modelos que fueron poco significativos, para lo cual se aprovecha la selección del mejor modelo a partir de STEP-WISE o selección paso a paso que se realiza en RStudio. 1.3.1

Modelo 6

Para obtener los modelos exponenciales, se usa el logaritmo del valor de metro cuadrado como variable dependiente y diferentes combinaciones para las variables dependientes.


En este primer modelo exponencial, se usan las seis variables dependientes en crudo, es decir, sin aplicarle logaritmo, luego se realiza la selección del mejor modelo mediante StepWise, obteniendo el siguiente: Tabla 24 Modelo 6 De Regresión Lineal Simple

Ítem Residuales

Residuales Mínimo Promedio Máximo - 1,183 0,008 1,218 Modelo

Ítem R2 R2 Ajustado RSE Valor p

Valor 0,8371 0,8312 0,489 2,2E-16 Coeficientes Ítem Estimado Valor p Sign. Intercepto 8,687 2E-16 Ahp Aguas 0,009 4,03E-04 Ahp Clase 0,011 6,25E-07 Ahp Densidad 0,021 2,00E-16 Ahp Norma 0,089 2,00E-16 Ahp Vías 0,004 2,52E-02

Como se identifica en la Tabla 24 Modelo 6 De Regresión Lineal Simple, para este modelo usando el logaritmo del valor, luego de la selección de modelo, se observa que se descartó la variable correspondiente al Ahp del uso actual del suelo dejando las demás como significativas además se obtiene un coeficiente de correlación R2 de 0.8312, lo cual dice que el modelo explica un 83.12% a la variable logvalor, la media de los residuos, se acerca a cero, lo cual da un primer indicio de la normalidad del modelo. De esta manera, la ecuación del modelo 6 queda de la siguiente manera: 𝐿𝑜𝑔𝑣𝑎𝑙𝑜𝑟 = −8,687 + 0,009 ∗ Ahp𝐴𝑔𝑢𝑎𝑠 + 0,011 ∗ AhpClase + 0,021 ∗ AhpDensidad + 0,089 ∗ AhpNorma + 0,004 ∗ AhpVía

1.3.1.1

Prueba de normalidad

Para determinar la normalidad de los residuos, se utilizan diferentes gráficas que representen la distribución y la desviación de los residuos del modelo.


Ilustración 19: Grafica entre los residuos y los cuantiles de normalidad – Modelo 6 Ilustración 19: Grafica entre los residuos y los cuantiles de normalidad – Modelo 6

deja en evidencia

aquellos valores atípicos que salen sobre los límites de la normalidad, los cuales se encuentran distribuidos en las partes negativas y positivas del gráfico.

Ilustración 20: Densidad de los residuos – Modelo 6 Ilustración 20: Densidad de los residuos – Modelo 6,

la cual es una manera muy sencilla de

evidenciar si los residuos siguen una distribución normal, ya que de ser así estos deberían asemejarse a una campana de Gauss, de lo cual no se está muy distantes, pero se pueden evidenciar los datos atípicos del modelo.


Por último, para corroborar los análisis realizados, se aplican los Test de Shapiro-Wilk y Kolmogorov Smirnov, con el fin de determinar la normalidad del conjunto de datos, obteniendo el siguiente resultado, que describe la Tabla 25 Prueba De Normalidad: Tabla 25 Prueba De Normalidad

Pruebas de normalidad Prueba Estimado Valor p Shapiro-Wilk 0,98 0,27 Kolmogorov-Smirnov 0,06 0,21

Según las pruebas Shapiro-Wilk y Kolmogorov-Smirnov, se observa que el valor p es mayor a 0.05, lo cual indica que se debe aceptar la Hipótesis nula sobre la distribución normal de los datos, es decir, sí siguen una distribución normal. 1.3.1.2

Prueba de heterocedasticidad

Con el fin de corroborar que el modelo no sufra de problemas de heterocedasticidad, es decir que la varianza de los residuos sea variable a través de las muestras se realiza la prueba de Breusch-Pagan obteniendo el siguiente resultado, que describe la Tabla 26 Prueba De Heterocedasticidad: Tabla 26 Prueba De Heterocedasticidad

Prueba de Heterocedasticidad Prueba Estimado Valor p Breusch-Pagan 13,46 0,019

Según el valor p, se debe rechazar la hipótesis nula sobre la homocedasticidad de los residuos, es decir que este modelo es heterocedástico. 1.3.1.3

Prueba de multicolinealidad

Para establecer la colinealidad entre las variables independientes se utiliza el Factor de Inflación de la Varianza o VIF por sus siglas en inglés, sabiendo que estos valores deben ser lo más bajos posible, para que el modelo sea correcto, a continuación en la Tabla 27 Prueba De Multicolinealidad se relaciona el resultado: Tabla 27 Prueba De Multicolinealidad

Prueba de Multicolinealidad Prueba Estimado VIF_Ahp Aguas 1,27


VIF_Ahp Clase VIF_Ahp Desidad VIF_Ahp Norma VIF_Ahp Vías

1,87 1,06 1,88 1,17

Como todos los valores de VIF están por debajo de 10, se dice que no existe una multicolinealidad fuerte entre las variables independientes. 1.3.1.4

Prueba de autocorrelación

Para establecer si existe autocorrelación entre los residuos se opta por el Test de DurbinWatson, arrojando el resultado que describe la Tabla 28 Prueba De Autocorrelación: Tabla 28 Prueba De Autocorrelación

Prueba de autocorrelación Prueba Estimado Valor p Dw 0,7521 3,87E-15 Dl 1,65372 Du 1,79936 Como Dw<Dl hay evidencia de autocorrelación

Si se toma n = 144 como los datos usados para el modelo y k = 5, la prueba ofrece evidencia de que los residuos tienen una autocorrelación. 1.3.2

Modelo 7

Para este modelo exponencial, se usan las variables anteriores, sin embargo, la variable de Norma de uso de suelo es reemplazada por su logaritmo, con el fin de lograr la linealidad, obteniendo el resultado que describe la Tabla 29 Modelo 7 Regresión Lineal Simple:


Tabla 29 Modelo 7 Regresión Lineal Simple

Ítem Residuales

Residuales Mínimo Promedio Máximo - 1,193 0,016 0,949 Modelo

Ítem R2 R2 Ajustado RSE Valor p

Valor 0,8708 0,8661 0,4355 2,2E-16 Coeficientes Ítem Estimado Valor p Sign. Intercepto 8,226 2E-16 Ahp Aguas 0,007 2,58E-03 Ahp Clase 0,010 2,38E-07 Ahp Densidad 0,020 2,00E-16 Ahp Vías 0,006 1,08E-03 Log Norma 0,791 2,00E-16

En este caso, usando el logaritmo de la Norma, obteniendo un coeficiente de correlación R2 de 0.8661, lo cual indica que el modelo explica en un 86.61% a la variable logvalor, lo cual representa una mejora con respecto al modelo 5, ya que la media de los residuos se acerca a cero, lo cual da un primer indicio de la normalidad del modelo. De esta manera, la ecuación del modelo 7 queda de la siguiente manera: 𝐿𝑜𝑔𝑣𝑎𝑙𝑜𝑟 = 8,226 + 0,006 ∗ Ahp𝐴𝑔𝑢𝑎𝑠 + 0,010 ∗ AhpClase + 0,020 ∗ AhpDensidad + 0,006 ∗ AhpVías + 0,791 ∗ Log Norma

1.3.2.1

Prueba de normalidad

Para determinar la normalidad de los residuos, se utilizan diferentes gráficas que representen la distribución y la desviación de los residuos del modelo.


1.0 0.5 0.0

RegModel.1$residuals

-0.5 -1.0

81 56 -2

-1

0

1

2

norm quantiles

Ilustración 21: Grafica entre los residuos y los cuantiles de normalidad – Modelo 7 Ilustración 21: Grafica entre los residuos y los cuantiles de normalidad – Modelo 7

deja en evidencia

aquellos valores atípicos que salen sobre los límites de la normalidad, logrando establecer, que ningún valor está por fuera de dichos límites, lo cual es una buena señal para el modelo.

Ilustración 22: Grafica densidad de residuos Modelo 7 Ilustración 22: Grafica densidad de residuos Modelo 7,

la cual es una manera muy sencilla de

evidenciar si los residuos siguen una distribución normal, ya que de ser así estos deberían asemejarse a una campana de Gauss, de lo cual no se está muy distantes, pero se pueden evidenciar los datos atípicos del modelo.


Por último, para corroborar los análisis realizados, se aplican los Test de Shapiro-Wilk y Kolmogorov Smirnov, con el fin de determinar la normalidad del conjunto de datos, obteniendo el resultado que describe la Tabla 30 Prueba De Normalidad: Tabla 30 Prueba De Normalidad

Pruebas de normalidad Prueba Estimado Valor p Shapiro-Wilk 0,98 0,23 Kolmogorov-Smirnov 0,06 0,28

Según las pruebas Shapiro-Wilk y Kolmogorov-Smirnov, se observa que el valor p es mayor a 0.05, lo cual indica que se debe aceptar la Hipótesis nula sobre la distribución normal de los datos, es decir, sí siguen una distribución normal. 1.3.2.2

Prueba de heterocedasticidad

Con el fin de corroborar que el modelo no sufra de problemas de heterocedasticidad, es decir que la varianza de los residuos sea variable a través de las muestras se realiza la prueba de Breusch-Pagan obteniendo el resultado que describe la Tabla 31 Prueba De Heterocedasticidad: Tabla 31 Prueba De Heterocedasticidad

Prueba de Heterocedasticidad Prueba Estimado Valor p Breusch-Pagan 6,06 0,300

Según el valor p, se debe aceptar la hipótesis nula sobre la homocedasticidad de los residuos, es decir que este modelo es homocedástico. 1.3.2.3

Prueba de multicolinealidad

Para establecer la colinealidad entre las variables independientes se utiliza el Factor de Inflación de la Varianza o VIF por sus siglas en inglés, sabiendo que estos valores deben ser lo más bajos posible, para que el modelo sea correcto, obtenemos el resultado que describe la Tabla 32 Prueba De Multicolinealidad:


Tabla 32 Prueba De Multicolinealidad

Prueba de Multicolinealidad Prueba Estimado VIF_Ahp Aguas 1,29 VIF_Ahp Clase 1,81 VIF_Ahp Desidad 1,07 VIF_Ahp Vías 1,14 VIF_Log Norma 1,86

Como todos los valores de VIF están por debajo de 10, se dice que no existe una multicolinealidad fuerte entre las variables independientes. 1.3.2.4

Prueba de autocorrelación

Para establecer si existe Autocorrelación entre los residuos se opta por el Test de DurbinWatson, arrojando el resultado que describe la Tabla 33 Prueba De Autocorrelación: Tabla 33 Prueba De Autocorrelación

Prueba de autocorrelación Prueba Estimado Valor p Dw 1,1417 3,61E-08 Dl 1,65372 Du 1,79936 Como Dw<Dl hay evidencia de autocorrelación

Si se toma n = 144 como los datos usados para el modelo y k = 5, la prueba ofrece evidencia de que los residuos tienen una autocorrelación. 1.4 Resumen de los modelos de regresión Tabla 34 Resumen De Los Modelos De Regresión

Modelo

R2 ajustado

RMSE

RMSE Max(x)

Normalidad

Homocedasticidad

Multicolinealidad

Autocorrelación

1 2 3 4 5 6 7

0,67 0,738 0,9023 0,758 0,7743 0,8312 0,8661

88320 0,6084 48310 70040 73440 0,489 0,4355

14% 5% 8% 11% 11% 4% 3%

SI NO SI SI SI SI SI

NO SI NO NO NO NO SI

N/A N/A NO NO NO NO NO

SI SI SI SI SI SI SI


A partir de los resultados que muestra la Tabla 34 Resumen De Los Modelos De Regresión, se concluye que: •

Ningún modelo cumple a plenitud los supuestos del modelo de regresión lineal. Presenta errores auto correlacionados y problemas de heterocedasticidad. Esto puede deberse en gran medida a la autocorrelación espacial de valores al ser el valor una variable espacial. Se seleccionaron mejores modelos para realizar una regresión geográficamente ponderada.

De los modelos de Regresión Lineal Simple, el mejor corresponde al modelo 2, en donde se utiliza el logaritmo del valor en función del AHP obtenido en el proceso analítico jerárquico.

De los modelos Multivariados los mejores son el 3 y 5 el cual se selecciona para el moldeo geográficamente ponderado.

En los modelos exponenciales el mejor modelo es el 7 el cual cumple con los supuestos de normalidad, homocedasticidad, multicolinealidad, pero no el de autocorrelación de los errores.

Se selecciona tanto el modelo 6 y 7 para realizar una regresión geográficamente ponderada para tratar de esta manera la autocorrelación espacial de los errores y la heterocedasticidad.

1.5 Modelos Weighted Goal Programing WGP Dato que se cuenta con 6 variables las cuales son obtenidas a partir de los vectores propios del proceso analítico jerárquico, se utiliza el método MAVAM, propuesto por (Aznar y Guijarro, 2015). Para esto se utiliza el paquete LpSolve dentro de las librerías del software R, planteando las ecuaciones de maximización y minimización 1.5.1

Modelo 8

Este modelo se formula a partir del vector agregado AHP, obtenido a partir del análisis de proceso analítico Jerárquico.


Formula inicial: 𝑀𝑖𝑛[(𝑛1 + 𝑝1 ) + (𝑛2 + 𝑝2 ) + ⋯ + (𝑛146 + 𝑝146 ) 𝐴𝐻𝑃𝑖 𝑥 + 𝑛𝑖 − 𝑝𝑖 = 𝑃𝑟𝑒𝑐𝑖𝑜𝑖 Se plantea de manera general las ecuaciones de las restricciones de siguiente forma: 9,23𝑥1 + 𝑛1 + 𝑝1 = 14804 14,14𝑥1 + 𝑛2 + 𝑝2 = 15802 44,93𝑥1 + 𝑛146 + 𝑝146 = 590800 La ecuación de estimación de valores a partir de este método quedaría descrita según las ecuaciones anteriores, de la siguiente manera: 𝑉𝑎𝑙𝑜𝑟𝑖 = 3728.78𝐴𝐻𝑃:𝑖 1.5.2

Modelo 9

En este modelo se utilizan las 6 variables obtenidas a partir del proceso analítico jerárquico en la ponderación de vectores para formular una ecuación de valores y restricciones del WGP. General quedaría formula de la siguiente manera 𝐴𝐻𝑃_𝐴𝐺𝑈𝐴𝑆𝑖 𝑥 + 𝐴𝐻𝑃_𝐶𝐴𝑃𝐴𝐶𝐼𝐷𝐴𝐷𝑖 𝑥 + 𝐴𝐻𝑃_𝑈𝑆𝑂𝑖 𝑥 + 𝐴𝐻𝑃_𝐷𝐸𝑁𝑆𝐼𝐷𝐴𝐷𝑖 𝑥 + 𝐴𝐻𝑃_𝑁𝑂𝑅𝑀𝐴𝑖 𝑥 + 𝐴𝐻𝑃_𝑉𝐼𝐴𝑆𝑖 𝑥 + 𝑛𝑖 − 𝑝𝑖 = 𝑃𝑟𝑒𝑐𝑖𝑜𝑖 Colocando dentro de la ecuación los valores obtenidos en el AHP y formulándolo a partir de la ecuación de restricción se obtiene: 6,6𝑥1 + 9,84𝑥2 + 69,51𝑥3 + 21,21𝑥4 + 19,67𝑥5 + 51,3𝑥6 + 𝑛1 + 𝑝2 = 171700. 23,17𝑥1 + 64,59𝑥2 + 23,2𝑥3 + 10,2𝑥4 + 20,21𝑥5 + 45𝑥6 + 𝑛1 + 𝑝2 = 590800 La solución de las 146 ecuaciones en R se obtiene que únicamente son diferentes de cero los coeficientes para AHP_Norma y AHP_Vias, lo que indica que, según la función de maximización, los restantes se teme no son significativos. Los demás coeficientes de la matriz son los términos betas de cada uno de los 146 errores positivos y 146 negativos.


La ecuación a partir de este método quedaría descrita según el coeficiente anterior, de la siguiente manera: 𝑃𝑟𝑒𝑐𝑖𝑜𝑖 = 17854,22𝐴𝐻𝑃_𝑁𝑂𝑅𝑀𝐴 + 17.99𝐴𝐻𝑃_𝑉𝐼𝐴𝑆 Ilustración 23: Distribución de errores - Modelo 14

1.6 Regresión geográficamente ponderada -GWR Para desarrollar los modelos bajo Regresión geográficamente ponderada, se toman los modelos seleccionados en el método de regresión lineal, que sus residuos sigan una distribución normal y tengan los mejores indicadores, los modelos seleccionados para desarrollar GWR fueron los siguientes: •

𝑀𝑜𝑑𝑒𝑙𝑜 2: 𝑙𝑜𝑔𝑣𝑎𝑙𝑜𝑟 = 𝛽0 + 𝛽1 ∗ 𝐴𝐻𝑃

𝑀𝑜𝑑𝑒𝑙𝑜 3: 𝑉𝑎𝑙𝑜𝑟𝑚2 = 𝛽0 + 𝛽1 ∗ 𝐴ℎ𝑝𝐶𝑙𝑎𝑠𝑒 + 𝛽2 ∗ 𝐴ℎ𝑝𝐷𝑒𝑛𝑠𝑖 + 𝛽3 ∗ 𝐴ℎ𝑝𝑁𝑜𝑟𝑚𝑎 + 𝛽4 ∗ 𝐴ℎ𝑝_𝑉í𝑎𝑠

𝑀𝑜𝑑𝑒𝑙𝑜 5: 𝑉𝑎𝑙𝑜𝑟𝑚2 = 𝛽0 + 𝛽1 ∗ 𝐴ℎ𝑝𝐶𝑙𝑎𝑠𝑒 + 𝛽2 ∗ 𝐴ℎ𝑝𝐷𝑒𝑛𝑠𝑖 + 𝛽3 ∗ 𝐴ℎ𝑝𝑣í𝑎𝑠 + 𝛽4 ∗ log _𝑛𝑜𝑟𝑚𝑎

𝑀𝑜𝑑𝑒𝑙𝑜 6: logvalor= 𝛽0 + 𝛽1 ∗ AhpAguas +𝛽2 ∗AhpClase +𝛽3 ∗AhpDensi +𝛽4 ∗ AhpNorma +𝛽5 ∗ Ahp_Vías

𝑀𝑜𝑑𝑒𝑙𝑜 7: 𝑙𝑜𝑔𝑣𝑎𝑙𝑜𝑟 = 𝛽0 + 𝛽1 ∗ 𝐴ℎ𝑝𝐴𝑔𝑢𝑎𝑠 + 𝛽2 ∗ 𝐴ℎ𝑝𝐶𝑙𝑎𝑠𝑒 + 𝛽3 ∗ 𝐴ℎ𝑝𝐷𝑒𝑛𝑠𝑖 + 𝛽4 ∗ 𝐴ℎ𝑝𝑉í𝑎𝑠 + 𝛽5 ∗ 𝐿𝑜𝑔𝑁𝑜𝑟𝑚𝑎

En estos modelos fueron procesados mediante el Software ArcMap, con el fin de calcular las Regresiones Geográficamente Ponderadas y así, dejar atrás la autocorrelación espacial y la heterocedasticidad que tenían en común algunos modelos calculados anteriormente. Con el fin de asegurar la fiabilidad en los modelos se le practican la prueba I de Moran y se verifican para todos los indicadores de ajuste de modelo. 1.6.1

Modelo 10

La función generadora es la del Modelo 2: 𝑙𝑜𝑔𝑣𝑎𝑙𝑜𝑟 = 𝛽0 +𝛽1 ∗ 𝐴ℎ𝑝


Luego de correr el modelo Geográficamente Ponderado, se obtiene los resultados que descrbe la Tabla 35 Resumen de estadísticos - Modelo 10 Tabla 35 Resumen de estadísticos - Modelo 10

ÍTEM

VALOR

Ancho de banda

1117,31

Residuos al Cuadrado

24,33

Número Efectivo

40,93

Desviación de Residuos

0,48

AICc

233,27

R2

0,8815

R2 Ajustado

0,8364

OBSERVACIONES Habla del número de vecinos utilizado para la estimación local de los coeficientes Se busca que esta magnitud sea lo más pequeña posible. Representa el número aproximado de registros que se usaron en el cálculo de cada regresión. Representa la variación de los errores, mientras sea menor, el modelo es más eficiente. Método de comparación entre modelos, se debe escoger el que tenga este índice más bajo. Coeficiente de correlación que representa la explicación del modelo simple. Coeficiente de correlación que representa la explicación del modelo múltiple.

Como punto a destacar, se encuentra una mejora en el Índice de Correlación en cerca de 15%, con relación al Modelo 3, obteniendo un R2 = 0.8815, lo cual indica que el modelo explica en un 88.15% a la variable logvalor. De la misma manera, se hace la revisión en los estadísticos locales de mayor relevancia, obteniendo la Tabla 36 Revisión de estadísticos locales - Modelo 10:

Tabla 36 Revisión de estadísticos locales - Modelo 10

Ítem

Mínimo Promedio Máximo

Número de condición

4,54

7,89

16,85

R2 Local

0,17

0,63

0,92

Residuos

-1,40

0,01

1,46

Error Estándar C AHP

0,01

0,02

0,07

Observaciones Los valores mayores a 30 deben revisarse, pues habla de fallas en el modelo. Los valores más bajos, hablan de la poca explicación en algunas partes del modelo. Se observa una simetría y media cercana a 0, representa normalidad. La variación baja en los coeficientes habla de la significancia de la variable AHP.


Para establecer si el problema de Autocorrelación fue solucionado, se realiza la prueba I de Moran, obteniendo el siguiente reporte, que describe la Ilustración 24: Reporte prueba I de Moran:

Ilustración 24: Reporte prueba I de Moran

En este caso, se ve que la distribución de los errores sigue obteniendo una correlación espacial, generando Clusters en la distribución, razón por la cual, no supera esta prueba, esto indica que faltan variables en el modelo explicativo de los valores de terreno. La distribución de los errores, se muestran en la Ilustración 25: Distribución de errores - Modelo 10

se ve de la siguiente manera:


Count

Residuos Modelo 2 GWR 38 36 34 32 30 28 26 24 22 20 18 16 14 12 10 8 6 4 2 0 [-1,396; -1,158)

[-0,92; -0,682)

[-0,444; -0,206)

[0,033; 0,271)

[0,509; 0,747)

[1,223; 1,461]

Residual Curva ajustada CurveFit

Ilustración 25: Distribución de errores - Modelo 10

1.6.2

Modelo 11

Se parte de la ecuación del modelo 3 con una ecuación generadora de la siguiente forma 𝑉𝑉𝑎𝑙𝑜𝑟𝑚2 = 𝛽0 + 𝛽1 ∗ 𝐴ℎ𝑝𝐶𝑙𝑎𝑠𝑒 + 𝛽2 ∗ 𝐴ℎ𝑝𝐷𝑒𝑛𝑠𝑖 + 𝛽3 ∗ 𝐴ℎ𝑝𝑁𝑜𝑟𝑚𝑎 + 𝛽4 ∗ 𝐴ℎ𝑝_𝑉í𝑎𝑠 Luego de correr el modelo Geográficamente Ponderado, se obtiene el siguiente resumen de los estadísticos, como lo describe la Tabla 37 Resumen de estadísticos - Modelo 11: Tabla 37 Resumen de estadísticos - Modelo 11

ÍTEM Ancho de banda Residuos al Cuadrado Número Efectivo Desviación de Residuos AICc R2 R2 Ajustado

VALOR

OBSERVACIONES Habla del número de vecinos utilizado para la 2780,19 estimación local de los coeficientes Este indicador, no se puede comparar con el 242.357.273.570,11 anterior, ya que está dado en $. Representa el número aproximado de registros que 25,062 se usaron en el cálculo de cada regresión. Representa la variación de los errores, mientras sea 44.765,82 menor, el modelo es más eficiente. Este indicador, no se puede comparar con el 3.560,38 anterior, por la diferencia funcional de los modelos. Coeficiente de correlación que representa la 0,93 explicación del modelo simple. Coeficiente de correlación que representa la 0,91 explicación del modelo múltiple.


Se encuentra una mejora en el Índice de Correlación en cerca de 1%, obteniendo un R 2 = 0.9161, lo cual dice que el modelo explica en un 91.61% a la variable Valorm2, mejora que no es muy significativa. De la misma manera, se hace la revisión en los estadísticos locales de mayor relevancia, obteniendo la Tabla 38 Revisión de estadísticos - Modelo 11: Tabla 38 Revisión de estadísticos - Modelo 11

Ítem

Mínimo

Promedio

Número de condición

5,54

7,26

R2 Local

0,611

0,81

Residuos

-83.591,49

-505,38

234,48

317,80

273,10

343,96

857,77

1.730,28

222,80

298,87

Error Estándar C AHP Clase Error Estándar C AHP Densi Error Estándar C AHP Norma Error Estándar C AHP Vías

Máximo

Observaciones Los valores mayores a 30 deben revisarse, pues 9,78 habla de fallas en el modelo. En la totalidad de las ecuaciones, el modelo 0,94 representa más del 60%. Se observa una simetría y media cercana a 0, 143.342,65 representa normalidad. La variación baja en los coeficientes habla de la 572,58 significancia de la variable AHP Clase. La variación baja en los coeficientes habla de la 522,82 significancia de la variable AHP Densidad. La variación baja en los coeficientes habla de la 4.467,48 significancia de la variable AHP Norma. La variación baja en los coeficientes habla de la 574,45 significancia de la variable AHP Vías.

Para establecer si el problema de Autocorrelación fue solucionado, se realiza la prueba I de Moran, obteniendo Ilustración 26: Distribución de errores - Modelo 11:


Ilustración 26: Distribución de errores - Modelo 11

En este caso, se ve que la distribución de los errores sigue una distribución aleatoria, haciendo que el modelo supere esta prueba. Respecto a la distribución de los errores a continuación la Ilustración 27: Distribución de errores - Modelo 11

Residuos Modelo 3 GWR 36 34 32 30 28 26 24

Count

22 20 18 16 14 12 10 8 6 4 2 0 [-83.591,494; -64.680,315)

[-7.946,779; 10.964,4)

[67.697,937; 86.609,116)

Residual Curva ajustada CurveFit


Ilustración 27: Distribución de errores - Modelo 11

1.6.3

Modelo 12

Se parte de la Ecuación generadora del modelo 5 la cual se platea de la siguiente forma. 𝑉𝑎𝑙𝑜𝑟𝑚2 = 𝛽0 + 𝛽1 ∗ 𝐴ℎ𝑝𝐶𝑙𝑎𝑠𝑒 + 𝛽2 ∗ 𝐴ℎ𝑝𝐷𝑒𝑛𝑠𝑖 + 𝛽3 ∗ 𝐴ℎ𝑝𝑣í𝑎𝑠 + 𝛽4 ∗ log 𝑛𝑜𝑟𝑚𝑎 Luego de correr el modelo Geográficamente Ponderado, se obtiene el siguiente resumen de los estadísticos que se describen en la Tabla 39 Resumen de estadísticos - Modelo 12: Tabla 39 Resumen de estadísticos - Modelo 12

ÍTEM

VALOR

OBSERVACIONES

Habla del número de vecinos utilizado para la estimación local de los coeficientes Con respecto al modelo anterior, los residuos Residuos al Cuadrado 325.400.141.841,65 son más altos aquí señal de desmejoramiento. Representa el número aproximado de registros Número Efectivo 37,79 que se usaron en el cálculo de cada regresión. Representa la variación de los errores, mientras Desviación de Residuos 54.836,07 sea menor, el modelo es más eficiente. Se evidencia que es mejor el modelo 11, según AICc 3.632,04 este indicador. Coeficiente de correlación que representa la R2 0,9060 explicación del modelo simple. Coeficiente de correlación que representa la R2 Ajustado 0,8741 explicación del modelo múltiple. Ancho de banda

2032,36

Se encuentra una mejora en el Índice de Correlación en cerca de 10% con relación al modelo 5 sin componente geográfico, obteniendo un R2 = 0.874141, lo cual dice que el modelo explica en un 87.41% a la variable Valorm2. De la misma manera, se hace la revisión en los estadísticos locales de mayor relevancia, obteniendo la Tabla 40 Revisión de estadísticos - Modelo 12


Tabla 40 Revisión de estadísticos - Modelo 12

Ítem Número de condición R2 Local Residuos Error Estándar C AHP Clase Error Estándar C AHP Densi Error Estándar C AHP Vías Error Estándar C Log Norma

Mínimo 6,64 0,48 -166.250,22 350,18 399,83 303,41 11.532,62

Promedio Máximo

Observaciones Los valores mayores a 30 deben revisarse, 9,65 23,34 pues habla de fallas en el modelo. En la totalidad de las ecuaciones, el modelo 0,73 0,93 representa más del 45%. Se observa una simetría y media cercana a 0 -1.514,03 138.927,07 (En proporción), representa normalidad. La variación baja en los coeficientes habla de 527,14 1042,86 la significancia de la variable AHP Clase. La variación baja en los coeficientes habla de 539,84 1070,56 la significancia de la variable AHP Densidad. La variación baja en los coeficientes habla de 481,51 1493,43 la significancia de la variable AHP Vías La variación baja en los coeficientes habla de 16.301,65 30.170,08 la significancia de la variable Log Norma

Para establecer si el problema de autocorrelación fue solucionado, se realiza la prueba I de Moran, obteniendo el reporte de la Ilustración 28: Distribución de errores - Modelo 12.

Ilustración 28: Distribución de errores - Modelo 12

En este caso, se ve que los errores siguen una distribución aleatoria según esta prueba, lo cual permite considerar como apto este modelo, bien especificado y con variables significativas.


A continuación Ilustración 29: Distribución de errores - Modelo 12: Residuos Modelo 5 GWR 45 40 35

Count

30 25 20 15 10 5 0 72

81

70

105

145

146

143

142

122

101

118

130

Residual Curva ajustada CurveFit

Ilustración 29: Distribución de errores - Modelo 12

Como se menciona anteriormente la distribución de errores pude considerase como normal. 1.6.4

Modelo 13

Se utiliza como ecuación generadora la obtenida en el modelo 6 la cual corresponde a log 𝑣𝑎𝑙𝑜𝑟~𝐴ℎ𝑝_𝐴𝑔𝑢𝑎𝑠 + 𝐴ℎ𝑝_𝐶𝑙𝑎𝑠𝑒 + 𝐴ℎ𝑝_𝐷𝑒𝑛𝑠𝑖 + 𝐴ℎ𝑝_𝑁𝑜𝑟𝑚𝑎 + 𝐴ℎ𝑝_𝑉í𝑎𝑠 Luego de correr el modelo geográficamente ponderado, se obtiene el e resumen de los estadísticos, que describe la Tabla 41: Resumen de estadísticos - Modelo 13: Tabla 41: Resumen de estadísticos - Modelo 13

ÍTEM

VALOR

Ancho de banda

2887,39

Residuos al Cuadrado

21,65

Número Efectivo

28,10

Desviación de Residuos

0,43

AICc

189,06

R2

0,8945

OBSERVACIONES Habla del número de vecinos utilizado para la estimación local de los coeficientes Con respecto al modelo 10, los residuos son más bajos aquí señal de mejoramiento. Representa el número aproximado de registros que se usaron en el cálculo de cada regresión. Representa la variación de los errores, mientras sea menor, el modelo es más eficiente. Se evidencia que con respecto al modelo 10, este es el mejor modelo. Coeficiente de correlación que representa la explicación del modelo simple.


ÍTEM

VALOR

R2 Ajustado

0,8702

OBSERVACIONES Coeficiente de correlación que representa la explicación del modelo múltiple.

Como punto a destacar, se encuentra una mejora en el índice de correlación en cerca de 4%, con relación al modelo 6 sin componente geográfico, obteniendo un R2 = 0.8702, lo cual dice que el modelo explica en un 87.02% a la variable logvalor. De la misma manera, se hace la revisión en los estadísticos locales de mayor relevancia, obteniendo la Tabla 42: Revisión de estadísticos - Modelo 13. Tabla 42: Revisión de estadísticos - Modelo 13

Ítem Número de condición R2 Local Residuos Error Estándar C AHP Aguas Error Estándar C AHP Clase Error Estándar C AHP Densi Error Estándar C AHP Norma Error Estándar C AHP Vías

Mínimo

Promedio Máximo

8,94

13,11

16,10

0,7397

0,8271

0,8731

-1,00

0,001

1,25

0,003

0,004

0,006

0,002

0,003

0,006

0,003

0,003

0,005

0,008

0,016

0,042

0,002

0,003

0,005

Observaciones Los valores mayores a 30 deben revisarse, pues habla de fallas en el modelo. En la totalidad de las ecuaciones, el modelo representa más del 70%. Se observa una simetría y media cercana a 0, representa normalidad. La variación baja en los coeficientes habla de la significancia de la variable AHP Aguas. La variación baja en los coeficientes habla de la significancia de la variable AHP Clase. La variación baja en los coeficientes habla de la significancia de la variable AHP Densidad. La variación baja en los coeficientes habla de la significancia de la variable AHP Norma. La variación baja en los coeficientes habla de la significancia de la variable AHP Vías.

Para establecer si el problema de autocorrelación fue solucionado, se realiza la prueba I de Moran, obteniendo Ilustración 30: Distribución de errores - Modelo 13:


Ilustración 30: Distribución de errores - Modelo 13

En este caso, se ve que los errores siguen una distribución aleatoria, por tanto, se ha dejado atrás la autocorrelación espacial y los problemas de heterocedasticidad. La distribución de los errores se representan en la Ilustración 31: Distribución de errores - Modelo 13:

Residuos Modelo 6 GWR 32 30 28 26 24 22

Count

20 18 16 14 12 10 8 6 4 2 0 [-1,001; -0,813)

[-0,626; -0,438)

[-0,25; -0,063)

[0,125; 0,313)

[0,5; 0,688)

[0,876; 1,063)

Residual Curva ajustada CurveFit

Ilustración 31: Distribución de errores - Modelo 13


1.6.5

Modelo 14

La ecuación generadora corresponde a la del modelo 7 𝑙𝑜𝑔𝑣𝑎𝑙𝑜𝑟 = 𝛽0 + 𝛽1 ∗ 𝐴ℎ𝑝𝐴𝑔𝑢𝑎𝑠 + 𝛽2 ∗ 𝐴ℎ𝑝𝐶𝑙𝑎𝑠𝑒 + 𝛽3 ∗ 𝐴ℎ𝑝𝐷𝑒𝑛𝑠𝑖 + 𝛽4 ∗ 𝐴ℎ𝑝𝑉í𝑎𝑠 + 𝛽5 ∗ Log Norma Luego de correr el modelo Geográficamente Ponderado, se obtiene el siguiente resumen de los estadísticos, representados en la Tabla 43: Resumen de estadísticos - Modelo 14: Tabla 43: Resumen de estadísticos - Modelo 14

ÍTEM

VARIABLE OBSERVACIÓN Habla del número de vecinos utilizado para la Ancho de banda 3296,28 estimación local de los coeficientes Con respecto a los modelos 10 y 13, los residuos Residuos al Cuadrado 19,71 son más bajos aquí señal de mejoramiento. Representa el número aproximado de registros Número Efectivo 24,57 que se usaron en el cálculo de cada regresión. Representa la variación de los errores, mientras Desviación de Residuos 0,40 sea menor, el modelo es más eficiente. Es de los modelos GWR el de menor AICc lo AICc 167,86 cual dice que es el mejor modelo. Coeficiente de correlación que representa la R2 0,9039 explicación del modelo simple. Coeficiente de correlación que representa la R2 Ajustado 0,8853 explicación del modelo múltiple.

Este modelo mejora el coeficiente de Correlación en cerca de 2% con relación al modelo 6 sin componente espacial, obteniendo un R2 = 0.8853, lo cual dice que el modelo explica en un 88.53% a la variable logvalor. De la misma manera, se hace la revisión en los estadísticos locales de mayor relevancia, obteniendo la Tabla 44: Revisión de estadísticos - Modelo 14: Tabla 44: Revisión de estadísticos - Modelo 14

Ítem Número de condición R2 Local Residuos

Mínimo Promedio Máximo 9,26

12,89

15,25

0,79

0,86

0,89

-1,29

0,006

1,12

Observaciones Los valores mayores a 30 deben revisarse, pues habla de fallas en el modelo. En la totalidad de las ecuaciones, el modelo representa más del 79%. Se observa una simetría y media cercana a 0, representa normalidad.


Ítem Error Estándar C AHP Aguas Error Estándar C AHP Clase Error Estándar C AHP Densi Error Estándar C AHP Vías Error Estándar C Log Norma

Mínimo Promedio Máximo 0,002

0,003

0,005

0,002

0,003

0,005

0,002

0,003

0,004

0,002

0,002

0,004

0,06

0,08

0,14

Observaciones La variación baja en los coeficientes habla de la significancia de la variable AHP Aguas. La variación baja en los coeficientes habla de la significancia de la variable AHP Clase. La variación baja en los coeficientes habla de la significancia de la variable AHP Densidad. La variación baja en los coeficientes habla de la significancia de la variable AHP Vías. La variación baja en los coeficientes habla de la significancia de la variable Log Norma.

Para establecer si el problema de autocorrelación fue solucionado, se realiza la prueba I de Moran, obteniendo Ilustración 32: Distribución de errores - Modelo 14:

Ilustración 32: Distribución de errores - Modelo 14

En este caso, se ve que los errores siguen una distribución aleatoria, por tanto, se ha dejado atrás la autocorrelación espacial. La distribución de los errores en la siguiente ilustración Ilustración 33 Residuos Modelo 7 :


Residuos Modelo 7 GWR 38 36 34

Count

32 30 28 26 24 22 20 18 16 14 12 10 8 6 4 2 0 [-1,292; -1,091)

[-0,889; -0,688)

[-0,285; -0,084)

[0,118; 0,319)

Residual Curva ajustada CurveFit

Ilustración 33 Residuos Modelo 7

[0,52; 0,722)

[0,923; 1,124]


996.000

Referente Base de Valoración: Z.H.G. IGAC

1.004.000

996.000

Modelo 1: Valor = f (AHP)

ZI PA Q U I RÁ

1.004.000

996.000

Modelo 2: lnValor = f (AHP)

ZI PA Q U I RÁ

1.004.000

ANEXO CARTOGRÁFICO: MAPA DE ERRORES DE LAS ZHG IGAC Y LOS 14 MODELOS PROPUESTOS RESPECTO A LAS MUESTRAS ANÁLISIS MULTICRITERIO EN LA VALORACIÓN CATASTRAL EN EL MUNICIPIO DE TABIO, COLOMBIA.

ZI PA Q U I RÁ

CA J I CÁ

S UB A C HO Q UE

CA J I CÁ

S UB A C HO Q UE

UNIGIS América Latina Programa UNIGIS en la Universidad de Salzburgo Z_GIS Department of Geoinformatics, University Salzburg Tesis para optar por el título de MSc in Geographic Information Science and Systems - UNIGIS MSc BOGOTÁ - COLOMBIA 2020

1.040.000

1.040.000

1.040.000

1.040.000

1.040.000

1.040.000

JAVIER ORLANDO LEAL

Cartografía básica del IGAC - Información Integrada Colombia_Bogota_Zone Proyección: Transverse_Mercator Meridiano Central: -74,080916667 Latitud de Origen: 4,5990472222 Sistema de coordenadas geográficas: GCS_Bogota Datum: D_Bogota

CA J I CÁ

S UB A C HO Q UE

Leyenda Rangos de error 0 - $39.000

996.000

1.004.000

996.000

1.004.000

996.000

1.004.000

Presenta un error acumulado (Distancia Manhattan) de $4.327.357, Coeficiente de correlación de 96,44% y un Error típico de $40.995. Este modelo indica un ajuste del 46,73% respecto a las ZHG del IGAC, siendo un mejoramiento considerable.

1.040.000

1.040.000

TE N J O

996.000

1.040.000

1.040.000

1.004.000

1.004.000

Modelo 14: WGR para lnValor =f (AHPVías+AHPAguas+AHPCapac.+AHPDens.+lnAHPNorma)

CA J I CÁ

S UB A C HO Q UE

Presenta un error acumulado (Distancia Manhattan) de $5.008.494, Coeficiente de correlación de 95,21% y un Error típico de $47.442. Este modelo indica un ajuste del 38,34% respecto a las ZHG del IGAC, siendo un mejoramiento considerable.

CH ÍA

TE N J O

996.000

1.032.000 1.040.000

996.000

CH ÍA

1.032.000

1.004.000

1.032.000

TE N J O

1.004.000

ZI PA Q U IR Á

CA J I CÁ

S UB A C HO Q UE

CH ÍA

1.032.000

CH ÍA

996.000

ZI PA Q U IR Á

CA J I CÁ

S UB A C HO Q UE

TE N J O

Presenta un error acumulado (Distancia Manhattan) de $4.790.360, Coeficiente de correlación de 94,42% y un Error típico de $51.076. Este modelo indica un ajuste del 41,03% respecto a las ZHG del IGAC, siendo un mejoramiento considerable.

Modelo 13: WGR para lnValor =f (AHPNorma + AHPVías + AHPAguas + AHPCapac. + AHPDensi.)

ZI PA Q U IR Á

1.040.000

1.040.000

TE N J O

Presenta un error acumulado (Distancia Manhattan) de $6.654.382, Coeficiente de correlación de 91,53% y un Error típico de $62.469. Este modelo indica un ajuste del 18,08% respecto a las ZHG del IGAC, siendo un mejoramiento leve.

Modelo 12: WGR para Valor = f (AHPVías + AHPCapacidad + AHPDensidad + lnAHPNorma)

CA J I CÁ

CH ÍA

1.040.000

1.004.000

ZI PA Q U IR Á

CA J I CÁ

S UB A C HO Q UE

1.032.000

996.000

Presenta un error acumulado (Distancia Manhattan) de $11.693.528, Coeficiente de correlación de 82,20% y un Error típico de $88.323. Este modelo indica un ajuste del -43,95% respecto a las ZHG del IGAC, por lo tanto, no es una solución buscada.

Modelo 11: WGR para Valor = f (AHPNorma + AHP Vías + AHP Capacidad + AHP Densidad)

1.032.000 1.040.000 1.040.000

1.040.000

1.040.000

TE N J O

Modelo 10: WGR para lnValor = f (AHP)

1.040.000

1.004.000

1.004.000

ZI PA Q U I RÁ

1.040.000

996.000

996.000

CH ÍA

1.032.000

1.004.000

1.004.000

Presenta un error acumulado (Distancia Manhattan) de $8.478.769, Coeficiente de correlación de 85,27% y un Error típico de $81.035. Este modelo indica un ajuste del -4,38% respecto a las ZHG del IGAC, por lo tanto, no es una solución buscada.

CA J I CÁ

S UB A C HO Q UE

1.040.000

996.000

1.032.000

TE N J O

1.032.000

1.032.000

Modelo 9: WGP para Valor = f (AHPNorma +AHPVías)

CH ÍA

Presenta un error acumulado (Distancia Manhattan) de $4.984.068, Coeficiente de correlación de 93,76% y un Error típico de $53.948. Este modelo indica un ajuste del 38,64% respecto a las ZHG del IGAC, siendo un mejoramiento considerable.

1.032.000

1.004.000

996.000

ZI PA Q U I RÁ

CA J I CÁ

S UB A C HO Q UE

CH ÍA

996.000

996.000

Presenta un error acumulado (Distancia Manhattan) de $8.714.544, Coeficiente de correlación de 88,35% y un Error típico de $72.669. Este modelo indica un ajuste del -7,28% respecto a las ZHG del IGAC, por lo tanto, no es una solución buscada.

1.004.000

Presenta un error acumulado (Distancia Manhattan) de $5.215.789, Coeficiente de correlación de 92,79% y un Error típico de $57.823. Este modelo indica un ajuste del 35,79% respecto a las ZHG del IGAC, siendo un mejoramiento considerable.

1.032.000

CA J I CÁ

S UB A C HO Q UE

1.004.000

ZI PA Q U I RÁ

1.040.000

1.040.000

ZI PA Q U I RÁ

996.000

TE N J O

1.032.000

1.004.000

TE N J O

1.032.000

996.000

Modelo 8: WGP para Valor = f (AHP)

CA J I CÁ

S UB A C HO Q UE

1.040.000

1.004.000

1.032.000

996.000

Presenta un error acumulado (Distancia Manhattan) de $8.966.241, Coeficiente de correlación de 87,45% y un Error típico de $75.246. Este modelo indica un ajuste del -10,38% respecto a las ZHG del IGAC, por lo tanto, no es una solución buscada.

Modelo 7: lnValor = f (AHPVías + AHPAguas + AHPCapacidad + AHPDensidad + lnAHPNorma)

ZI PA Q U I RÁ

CH ÍA

1.040.000

1.004.000

Presenta un error acumulado (Distancia Manhattan) de $5.340.067, Coeficiente de correlación de 95,13% y un Error típico de $47.805. Este modelo indica un ajuste del 34,26% respecto a las ZHG del IGAC, siendo un mejoramiento considerable.

TE N J O

1.004.000

Modelo 6: lnValor = f (AHPNorma + AHPVías + AHPAguas + AHPCapacidad + AHPDensidad)

CH ÍA

1.032.000

996.000

1.032.000

1.004.000

1.032.000

996.000

996.000

CA J I CÁ

S UB A C HO Q UE

CH ÍA

TE N J O

$538.000 - $826.000

ZI PA Q U I RÁ

1.040.000

1.040.000

1.040.000

1.040.000 1.032.000

CH ÍA

$347.000 - $538.000

Modelo 5: Valor = f (AHPVías + AHPCapacidad + AHPDensidad + lnAHPNorma)

CA J I CÁ

S UB A C HO Q UE

Municipios Vecinos

$207.000 - $347.000

1.004.000

ZI PA Q U I RÁ

CA J I CÁ

S UB A C HO Q UE

996.000

Veredas municipio de Tabio

TE N J O

996.000

1.004.000

1.032.000

1.004.000

ZI PA Q U I RÁ

$104.000 - $207.000

Presenta un error acumulado (Distancia Manhattan) de $7.337.212, Coeficiente de correlación de 86,03% y un Error típico de $79.078. Este modelo indica un ajuste del 9,68% respecto a las ZHG del IGAC, siendo un mejoramiento leve.

Modelo 4: Valor = f (lnAHPNorma + lnAHPVías + lnAHPCapacidad + lnAHPDensidad)

Modelo 3: Valor = f (AHPNorma + AHP Vías + AHP Capacidad + AHP Densidad)

1.004.000

1.032.000

996.000

996.000

1.032.000

1.004.000

S UB A C HO Q UE

1.032.000

Presenta un error acumulado (Distancia Manhattan) de $10.201.429, Coeficiente de correlación de 82,20% y un Error típico de $88.323. Este modelo indica un ajuste del -25,58% respecto a las ZHG del IGAC, por lo tanto, no es una solución buscada.

1.032.000

996.000

1.004.000

1.032.000

Presenta un error acumulado (Distancia Manhattan) de $8.123.242, Coeficiente de correlación de 83,69% y un Error típico de $84.900. Se toma como valoración de referencia.

996.000

TE N J O

1.040.000

1.004.000

TE N J O

1.032.000

996.000

$39.000 - $104.000

CH ÍA

1.032.000

TE N J O

1.032.000

CH ÍA

1.032.000

1.032.000

CH ÍA

Municipio de Tabio

Presenta un error acumulado (Distancia Manhattan) de $4.367.675, Coeficiente de correlación de 95,41% y un Error típico de $46.444. Este modelo indica un ajuste del 46,23% respecto a las ZHG del IGAC, siendo un mejoramiento considerable.


Turn static files into dynamic content formats.

Create a flipbook

Articles inside

TABLA 21:APLICABILIDAD DE LOS MODELOS DE REGRESIÓN

1min
page 96

5 CONCLUSIONES Y RECOMENDACIONES

4min
pages 102-104

ILUSTRACIÓN 30: VALORES M2 DE TERRENO MODELO FINAL ADOPTADO

2min
pages 99-101

ILUSTRACIÓN 27: RESIDUALES MODELO 12 Y MODELO 13

0
page 93

ILUSTRACIÓN 28: RESIDUALES MODELO 14

0
page 94

ILUSTRACIÓN 26: RESIDUALES MODELO 10 Y MODELO 11

0
page 92

ILUSTRACIÓN 25: RESIDUALES MODELO 8 Y MODELO 9

0
page 91

ILUSTRACIÓN 24: RESIDUALES MODELO 6 Y MODELO 7

0
page 90

ILUSTRACIÓN 23: RESIDUALES MODELO 4 Y MODELO 5

0
page 89

ILUSTRACIÓN 22: RESIDUALES MODELO 2 Y MODELO 3

0
page 88

ILUSTRACIÓN 21: RESIDUALES MODELO BASE Y MODELO 1

0
page 87

TABLA 19: RESUMEN DE LOS ESTADÍSTICOS DE LOS MODELOS LINEALES

1min
page 83

3.8.2 Índice de Adecuación

0
page 78

ILUSTRACIÓN 19: UBICACIÓN DE LOS PREDIOS MUESTRA

0
page 81

4.2 Análisis Espacial de Residuales y Valores

2min
page 86

ILUSTRACIÓN 18: ZHGMUNICIPIO DE TABIO

0
page 77

ILUSTRACIÓN 15: UBICACIÓN DE LAS OFERTAS

1min
pages 71-72

ILUSTRACIÓN 14: RECONOCIMIENTO EN CAMPO(2020

2min
pages 69-70

ILUSTRACIÓN 12: VARIABLE USO ACTUAL DEL SUELO

0
page 66

ILUSTRACIÓN 5: VARIABLE DENSIDAD

2min
pages 57-58

ILUSTRACIÓN 9: IMAGEN SATELITAL DEL MUNICIPIO DE TABIO

0
page 63

ILUSTRACIÓN 6: VARIABLE CAPACIDAD DEL SUELO

1min
page 59

ILUSTRACIÓN 1: DIAGRAMA GENERAL DE PROCESOS

2min
pages 45-46

ILUSTRACIÓN 4: VARIABLE NORMA DE USO DEL SUELO

2min
pages 55-56

ILUSTRACIÓN 8: VARIABLE DISPONIBILIDAD DE AGUAS

0
page 62

TABLA 1. RESUMEN DE LA NORMATIVA DE USO DEL SUELO PARA EL MUNICIPIO DE TABIO

8min
pages 51-54

PRINCIPALES

0
page 65
Issuu converts static files into: digital portfolios, online yearbooks, online catalogs, digital photo albums and more. Sign up and create your flipbook.