SISTEMA AUTOMATIZADO DE HOMOGENEIDAD DE TIERRAS (S.I.A.H.T) MÓDULOS N° 1: Central de Cálculos del IHM N° 2: Simulaciones del IHM
MANUAL TÉCNICO. VERSIÓN 2.0 PROYECTO DE GRUPO FONACIT Nº 2013002336 CONVOCATORIA PEII-2012-245. FECHA DE INICIO: MAYO 2015 FECHA DE FINALIZACIÓN: NOVIEMBRE 2016
Dr. Edgar Jaimes. Coordinador Técnico y Administrativo Ing. Enver Jaimes. Talento en Formación
Noviembre de 2016
Estructura de la aplicación del proyecto SIAHT INTRODUCCIÓN El software en desarrollo especifica un manejo completo sobre la administración de los proyectos que estén vinculados con los objetivos del SIAHT, debido a que esos proyectos contienen los datos específicos a cada estudio realizado, bajo una estructura determinada y muy simple, basada en un archivo de propiedades dentro de la plataforma; el cual, además, contiene dos carpetas: una que engloba las definiciones de las unidades de estudios y, la otra, que especifica las definiciones lógicas de los estudios realizados, las cuales se detallan más adelante. Esta administración implica la creación, borrado y apertura de los proyectos vinculados al SIAHT y sus unidades lógicas, previamente descritas en los módulos N° 1 y N° 2 del manual del usuario, ejecutando asistentes que guían al usuario para cada uno de los casos, permitiendo la realización de procesos al final de estos, por ejemplo: la manipulación de fuentes de datos, cálculos estadísticos univariados y multivariados, así como aplicaciones del álgebra lineal sobre matrices de datos. En este manual técnico se sintetizan los aspectos operacionales implícitos en los dos módulos que conforman el Sistema de Información Automatizado de Homogeneidad de Tierra (SIAHT); a saber: A. Funcionalidades del sistema. Involucra las siguientes operaciones: A – 1. Administración de proyectos. Abarca la creación, apertura y cierre de proyectos. A – 2. Asistente para la creación de unidades de estudio. Valida el ingreso de los datos. A – 3. Asistente para la creación de estudios, a partir de la validación de los datos. B. Cálculo del Índice de Homogeneidad Múltiple (IHM). Es un procedimiento de cálculo secuencial que se realiza a partir de los datos preparados desde las unidades de estudios. C. Simulación de los estudios del IHM. Se realiza a partir de agrupamientos de las observaciones obtenidas en las unidades de estudio. D. Módulos del SIAHT. Incluye un paquete de programas que fueron integrados de la siguiente forma: D – 1. Administración de proyectos. D – 2. Manejo de datos estadísticos. D – 3. Representaciones gráficas. D – 4. Manejadores de I/O de datos. La plataforma NetBeans permite que las aplicaciones sean desarrolladas a partir de un conjunto de componentes de software llamados módulos. Un módulo es un archivo Java
que contiene clases de java escritas que interactúan con las API’s de NetBeans y un archivo especial (manifest file) que lo identifica como módulo. Las aplicaciones construidas a partir de módulos pueden ser extendidas, agregándole nuevos módulos. Debido a que los módulos pueden ser desarrollados independientemente, las aplicaciones basadas en la plataforma NetBeans pueden ser extendidas fácilmente por otros desarrolladores de software. Ciertamente, NetBeans posee un conjunto de API’s que cumplen con los requerimientos exigidos para el desarrollo del SIAHT, ya que cada componente del mismo, con sus respectivas funciones, está estructurado (empaquetado) en módulos, con lo cual se logra una eficaz aplicabilidad orientada al usuario que, aunado a su portabilidad a cualquier sistema operativo, proporcionan al SIAHT una gran mercado de usuarios. Es pertinente recordar que el SIAHT es una herramienta para realizar los cálculos estadísticos univariados y multivariados para determinar el IHM de cualquier sistema termodinámicamente abierto; sean éstos de tipo social, ambiental, agrícola, económico, educativo, entre otros; implica la integración e interacción de diferentes variables, frecuentemente correlacionadas entre sí, las cuales contribuyen de manera específica en el valor del IHM. A. FUNCIONALIDADES DEL SISTEMA. La funcionalidad del aplicativo fundamentada en los tres aspectos que están indicados en el diagrama siguiente:
A – 1. Administración de Proyectos: Esta funcionalidad forma parte de la plataforma de NetBeans y está conformada por los siguientes procesos: creación, apertura y cierre de proyectos. Esta estructura se ilustra en la siguiente imagen:
De acuerdo con esta figura, un proyecto SIAHT está conformado por tres tipos de archivos:
Propiedades (siahproject. properties), ubicado en la carpeta del proyecto, en el cual se almacenan todas las propiedades del proyecto que pueden variar según el estado del mismo.
Unidades de Estudio, que es un archivo con extensión .xml; el cual almacena la estructura lógica de las unidades de estudios que integran el proyecto
Carpeta de Estudios, con extensión .xml que, igual al anterior, almacena la estructura lógica de los estudios realizados.
A – 2. Asistente para la creación de Unidades de Estudios: Función dedicada a la asistencia del analista al momento de crear una unidad de estudio, este proceso es secuencial y proporciona, al igual que valida, el ingreso de los datos que conformaran la estructura lógica de la unidad. A continuación se visualiza el diagrama de actividades que describe este procedimiento, esto es:
Como se ilustra en la figura anterior, se describe el proceso de crear una unidad de estudio, y como primer paso se captura la intención del analista de crear dicha unidad, lo cual permite accionar el asistente, pidiendo al analista como primer dato si la estructura es importada de un archivo o es una nueva y vacía; luego se establece el modelo de la estructura deseada de la unidad; validando a continuación el tipo de variables de la unidad en creación (discretas o continuas); el siguiente paso es cuando el asistente pide al analista su confirmación para la creación de la unidad de estudio a procesar para, finalmente, crearla e integrarla al proyecto abierto y activo en ese momento. A – 3. Asistente para la creación de estudios. Esta Funcionalidad asiste al analista en la estructuración de los estudios a realizar a partir de los datos ingresados en las unidades de estudios correspondientes al mismo proyecto. Al igual que los otros asistentes, es un procedimiento secuencial y con validadores en cada paso, según se muestra en el diagrama de actividades siguiente, donde se describe el flujo de la función en cuestión:
En el diagrama de actividades se observa el inicio de la funcionalidad con la intención del analista de realizar un estudio con los datos del proyecto activo, con lo que el asistente se activa, solicitando al usuario decidir si el estudio es total o parcial sobre las unidades de estudio del mismo proyecto; el siguiente paso, en el caso parcial, es elegir las unidades de estudio, paso omitido por la opción de estudio total; a continuación el analista debe definir cuáles dimensiones y variables, de las unidades seleccionadas, formaran parte del estudio, paso omitido por la opción de estudio total; existiendo, además, una validación con la que se evalúa si las variables seleccionadas son o no homogéneas, a los fines de evitar errores en el cálculo del IHM del sistema en estudio; por último, se debe establecer el almacén de datos de los resultados obtenidos y finalizar el asistente. B. CALCULO DEL IHM. Es la función principal, y la más importante, de la aplicación, toda vez que se trata de un procedimiento de cálculo secuencial en el cual la estructura del estudio marca la pauta de los cálculos a partir de los datos que son preparados desde las unidades de estudios. Para describir el mencionado procedimiento se muestra el siguiente diagrama de actividades:
Como se puede observar en el diagrama anterior, este proceso se inicia al generar los análisis estadísticos, actividad que se ejecuta al finalizar el asistente para la creación de estudios del proyecto; luego, con base en los datos del estudio, se da inicio a la secuencia de cálculos de los parámetros de la estadística univariada (media aritmética, geométrica, mediana, moda, varianza, desviación estándar y coeficiente de variación); seguido del cálculo de la matriz de correlación, con base a la cual se realiza el cálculo de la matriz de los eigenvalues (valores propios), a partir de la cual se determina el IHM; se continua el proceso, determinando el porcentaje (%) de contribución de estos valores propios; seguido del cálculo de los eigenvector (vectores propios), a partir de la misma matriz de correlación; finalizando con la determinación de la contribución de las variables en el valor del IHM del sistema objeto de estudio; luego se guardan los resultados en el almacén definido en las propiedades del estudio; finalizando esta función con la construcción de las gráficas resultantes de los datos procesados y el despliegue visual de las mismas. C. SIMULACIÓN DE ESTUDIOS IHM. La simulación en los estudios del IHM consiste en realizar todos los agrupamientos posibles del total de las observaciones del estudio objeto de la simulación. Para ello se utiliza la teoría de conjuntos para aplicar el cálculo IHM a todos los grupos de observaciones posibles, obtenidos cuando se elimina una observación de la matriz de datos originales, con la finalidad de obtener un rango de IHM relacionado al estudio simulado. Para la descripción de este proceso, se tiene el siguiente diagrama:
En el diagrama anterior, se observa el inicio del proceso de simulación por parte del analista que al seleccionar un estudio ya generado ejecuta la acción de simulación, esto conlleva a la preparación del repositorio de agrupamientos de observaciones generado por un teorema de conjuntos que determina un “clúster” finito de estos agrupamientos, luego utilizando el modulo de cálculos estadísticos, se realizan los estudios univariados y multivariados para el cálculo de IHM, para continuar con el resguardo de estos resultados individuales en el repositorio generado previamente; este ciclo continua hasta lograr resolver todos los agrupamientos generados a partir del total de observaciones contenidas en el estudio a simular. D. MODULOS DEL SISTEMA. Los Módulos de un sistema son también llamados componentes ya que ellos conforman un paquete de programas, rutinas, librerías, clases y recursos que cumplen una determinada funcionalidad, que integrados entre sí, dan respuesta o una solución completa a los requerimientos exigidos por el SIAHT, integrándolos de la siguiente forma: D – 1. Administración de proyectos. Constituye el principal aspecto de la aplicación, ya que es el encargado de crear, modificar, y eliminar los proyectos que el usuario requiera o decida analizar, permitiendo visualizar la estructura y elementos que se relacionen con los proyectos, además de definir los servicios necesarios para la interacción con otros componentes y librerías, que sean útiles para el despliegue visual de funciones. D – 2. Manejo de datos estadísticos. Es el componente encargado de aplicar todas las funciones estadísticas requeridas para el cálculo del IHM, según los datos ingresados. D – 3. Representaciones gráficas. Es el modulo encargado de generar las representaciones gráficas de los resultados obtenidos de los cálculos del IHM. D – 4. Manejadores de I / O de datos. Componente responsable de leer y escribir flujos de diferentes tipos de almacenes de datos. A continuación se describen en detalle cada uno de estos módulos con sus respectivos aspectos y/o componentes D – 1. Módulo de Administración de Proyectos. Se entiende como el componente modular de la solución, del cual depende la aplicación de toda la funcionalidad requerida para la administración de los proyectos, desde su creación, manipulación de los elementos que lo conforman, hasta la integridad del estado de un proyecto abierto. A continuación se describen estos dos aspectos: Contenedor de proyectos. La administración de proyectos y conservación del estado de estos, se basan en un componente que los contiene y visualiza, tanto a dichos proyectos como a los resultados de comparaciones entre los que se encuentren abiertos. Cada elemento contenido en este componente es un nodo o unidad lógica, que relaciona información sobre el elemento que representa, por ejemplo: un proyecto, un resultado, una gráfica, entre otros. El manejo de estos nodos, y el estado de sus datos, es el aspecto más importante de este elemento, y será parte principal del módulo principal.
CRUD de elementos o nodos de un proyecto. Este aspecto es una de las principales funciones del módulo, enfocándose en la manipulación de los elementos o nodos que conforman la estructura de un proyecto, como lo indica su acrónimo CRUD (Create Read Update Delete), permitiendo almacenar toda la estructura de la información con el objeto de consultarla, modificarla y, en algunos casos, borrarla. Estas partes son: Proyecto. Representa el nodo principal donde se almacena toda la información de un proyecto; es decir, el estado actual del mismo, los arboles de nodos de información que lo conforman, fecha de creación, descripción, fuente de almacenamiento; entre otros. Este nodo está conformado implícitamente por dos carpetas contenedoras: una es la de unidades de estudios y, la otra, la de los estudios realizados. Dichos contenedores no son manipulables por parte del usuario y la información que describa es la generada por sus elementos asociados. Carpeta de unidades de estudios. Es el nodo encargado de contener todas las unidades de estudios relacionadas a un proyecto y no puede ser eliminado ni modificado ya que sus propiedades asociadas son generadas a partir de la demanda de la información derivada de sus elementos, que se representan en las unidades de estudios anteriormente mencionadas. Unidades de Estudios. Esta unidad lógica de estructura dinámica, es definida al momento de crearla, es un nodo que representa la data dinámica y el nombre descriptivo de la unidad de estudio; así como la fecha de creación del mismo. De esta data dinámica se definen dos aspectos importantes: las dimensiones de data y las observaciones obtenidas y/o registradas en el campo de acción de la unidad de estudio. Dimensiones. Nodo definido por una matriz de datos, previamente establecida durante la creación de la unidad de estudio, cuyo dominio puede alcanzar desde 1 hasta la n dimensiones. Observaciones. Nodo que define la data obtenida y/o registrada en el campo de acción de la unidad en cuestión, según su dimensión. Carpeta de estudios. Nodo encargado de contener todos los diferentes resultados de los análisis configurados por el usuario y no puede ser eliminado ni modificado toda vez que sus propiedades asociadas son generadas a partir de la demanda de la información derivada de sus elementos, que se representan en los resultados anteriormente citados. Resultado: Nodo representativo del análisis de los datos configurados por el usuario, contentivo de una descripción detallada del análisis realizado, en el que se incluye la fecha y el nombre del análisis, el listado de las salidas graficas seleccionadas, la configuración establecida (donde se relacionan las unidades de estudios como fuente de datos en el proceso estadístico y los resultados obtenidos), y los datos obtenidos de los cálculos estadísticos para determinar el IHM.
Asistentes del módulo. Asistente de creación de una unidad de estudio. Funcionalidad del módulo para determinar a través de un proceso, la estructura completa de una unidad de estudio. En este proceso se guía al analista a ingresar datos como: el nombre del proyecto; si los datos son importados o es una unidad de estudio vacía; las dimensiones y observaciones que tiene y la representación visual de los datos. Este flujo se detalla más adelante. Asistente de análisis de resultados. Esta funcionalidad tiene como objetivo guiar, paso a paso, al analista-usuario en la determinación de la estructura de los resultados del análisis de los datos, su descripción detallada, la obtención de los parámetros de la estadística univariada y multivariada y los diferentes tipos de representaciones gráficas para visualizar los resultados. Este flujo se detalla más adelante. Funciones utilitarias (definición de servicios). Parte de la implementación de este módulo, tiene como propósito definir las estructuras de los servicios requeridos para llevar a cabo la interacción entre los módulos que conforman esta solución. Entre estos servicios se destacan los siguientes: servicio de cálculos estadísticos, el de data source y el de representaciones gráficas. Los diagramas que se muestran a continuación, explican en detalle el funcionamiento de este componente y como se relacionan las diferentes estructuras y clases que lo conforman, proporcionando un entendimiento más profundo de su implementación e integración a la solución, es decir:
D – 2. Módulo de manejo de datos estadísticos. Componente diseñado para implementar el servicio de cálculos estadísticos de la solución, con base en el uso de librerías utilitarias, para obtener los resultados requeridos; que para el caso específico de esta implementación se utilizó la librería ligera de Apache Commons Math, que tiene la ventaja de estar escrita en lenguaje java y poseer una licencia de distribución apache compatible con GPL. Además, este módulo es la base del cálculo del IHM el cual requiere de la aplicación de métodos de la estadística univariada y multivariada al conjunto de variables del sistema evaluado. En la interface del servicio se definen los métodos estadísticos requeridos para realizar los cálculos y cuáles son los estudios implementados por el proveedor de mencionado servicio, entre los cuales se mencionan los siguientes: Lista de estudios implementados por el modulo. La implementación del módulo debe entregar un listado de los estudios estadísticos que soporta, a objeto de que la solución maneje esa información correctamente. La información de cada estudio se almacena en una estructura de datos llamada Analysis, donde concentra toda la lógica que maneja el mencionado estudio, como el tipo, el nombre, entre otros. Calculo del IHM. Representa la funcionalidad principal del sistema toda vez que su objetivo es realizar el cálculo del IHM, a partir de la evaluación de los datos del sistema objeto de estudio por parte del analista.
Cálculos univariados. Función que se ejecuta para aplicar los métodos estadísticos univariados, definidos por la implementación del módulo, al conjunto de variables que conforman el sistema en estudio. Cálculos multivariados. Función que se ejecuta para aplicar los métodos estadísticos univariados, definidos por la implementación del módulo, al conjunto de variables que conforman el sistema en estudio. Entrega de recursos. Método en la categoría de utilidades, para la entrega de iconos asociados a cada estudio estadístico implementado por el módulo. La solución implementada de este módulo, se representa en los siguientes diagramas que ilustran la composición de este componente a nivel estructural y funcional, a saber:
D – 3. Representaciones gráficas. Constituye la principal función encargada de visualizar los resultados obtenidos por la aplicación de los análisis estadísticos, univariados y multivariados, configurados en la solución a través del módulo de cálculos estadísticos. Por ello solo define un método que recibe como argumento una estructura lógica que encapsula la información que se pretende visualizar a través de un gráfico, el cual es entregado como un componente visual para ser integrado en la solución. Para la implementación específica de esta solución, se utilizó la reconocida librería de código abierto y software libre JFreeChart, la cual está sujeta a los términos GNU Lesser General Public Licence (LGPL); por otro lado, se describe en los siguientes diagramas la estructura del componente y funcionalidad de dicha implementación, esto es
D – 4. Manejadores de i/o de datos. Este componente se encarga de interactuar con cualquier fuente de datos con el fin de salvaguardar y consultar los datos usados por la solución para: la realización de los análisis estadísticos y la obtención del IHM. La implementación del componente en cuestión se rige por la interface de servicio, definida en el módulo de administración; así como la integración permanente a la solución de una implementación basada en el manejo de archivos de Excel. Con el fin de extender el servicio de entrada y salida de datos, la implementación de este módulo debe atender los siguientes procedimientos metodológicos: Guardar datos. Función encargada de guardar los datos en los almacenes configurados; para ello el método requiere como argumento una estructura lógica que define la locación de los datos, de manera específica, y los datos a guardar, como otro argumento. Carga de datos. Funcionalidad dedicada a la lectura de datos desde las fuentes, este procedimiento necesita como argumento solo una estructura de datos que establece la ubicación exacta de los datos solicitados por la solución. Visualizador de configuración de fuente de datos. Método principal de este módulo, diseñado para generar una interface gráfica, con el objeto de determinar la fuente de datos que manipule este componente, el mismo debe implementarse, aceptando como argumento una bandera indicadora del flujo que debe ejecutarse y, un auditor de eventos, capaz de reaccionar según una acción de la solución. Nombre del visualizador. Función sencilla que entrega el nombre de la interface visual de la fuente de origen de datos, utilizado por el asistente de la solución. Nombre de la clase que implementa la fuente de origen de los datos. Método secundario que regresa el nombre de la clase de implementación del módulo. Modificador de bandera indicadora de flujo. Función que modifica la bandera indicadora de flujo en el proceso de definición de fuente de origen. Modificadores y métodos de acceso. Requiere de métodos encargados de modificar y acceder a los datos de la interface visual implementada para este componente. Validador de datos de la interface visual. Este método se encarga de validar los datos ingresados en la interface visual, garantizando la integridad y consistencia de la fuente de datos establecida. Con objeto de describir este componente, en una forma más detallada, se elaboraron diagramas para extender los conceptos del funcionamiento, propiedades y estructuras que lo conforman, para un mayor entendimiento del módulo en cuestión, esto es:
D – 5. Simulador. Este componente es el que implementa la interface Extended Properties, que presenta funcionalidades extendidas a la plataforma SIAHT, en dicho componente se define el proceso que realiza la simulación de un estudio para el cálculo IHM, y con él determinar un rango de variación de este índice según el universo total de observaciones estudiadas. Con objeto de describir este componente, en una forma más detallada, se elaboraron diagramas para extender los conceptos del funcionamiento, propiedades y estructuras que lo conforman, para un mayor entendimiento del módulo en cuestión, esto es: