BIG DATA
MODELOS DE DATOS:
¿qué son y para qué sirven?
Son herramientas utlizadas en muchas disciplinas, diseñadas para procesar mejor la información y obtener resultados coherentes. POR Rubén Adad (ruben.adad@infomedia.com.mx)
Los modelos de datos nos permiten contar con un modelo o esquema que facilita el entendimiento de ciertas acciones o fenómenos, por ejemplo:
1. En Física se utiliza la fórmula de la velocidad (v=d/t) para entender el movimiento de un objeto en línea recta.
2. Los mapas son la base en Geografía para percibir la conformación de una zona geográfica.
3. Los arquitectos emplean planos y maquetas para tener una idea de lo que será un edificio o espacio público.
4. En diseño industrial existen herramientas de CAD (Computer Aided Design, por sus siglas en inglés) para representar alguna pieza o mecanismo.
Y así, cada especialidad cuenta con un modelo para entender los procesos. En el caso de los relacionados con los datos sirven para capturar de manera parcial las propiedades de objetos que pueden ser descritos a través de sus atributos. Los objetos y sus propiedades son representados a través de los datos, mientras que un dato es un valor que representa la propiedad de un objeto en un momento o periodo de tiempo. Por ejemplo, la edad de Juan es de 35 años: 35 años es el valor, la edad es la propiedad y Juan es el objeto al que se asocia dicha propiedad. Este valor es válido sólo durante un periodo de tiempo. 12
I N F ÓS F ERA
ABR I L / M AYO 20 1 7
BIG DATA Entonces, un modelo de datos representa una porción del mundo real a través de objetos con propiedades e interacciones entre ellos. Esta es una representación estática; es decir, describe los objetos en un momento determinado. Para darle movimiento se requieren operaciones que modifiquen dichos objetos, de tal modo que vayan a la par con las transformaciones que ocurren en el mundo real.
Creación de modelos Para crear un modelo de datos es necesario realizar una abstracción, que no es otra cosa que una técnica o metodología que permite diseñar estructuras de datos, la cual se utiliza para simplificar la definición de los objetos al tomar en cuenta las propiedades generales que los describen, omitiendo aquellos aspectos irrelevantes para el objetivo buscado. La abstracción puede ser de dos tipos: Generalización: sirve para asimilar algún concepto; por ejemplo, para distinguir un auto o una casa sin tener que conocer todos los autos o todas las casas. Lo opuesto a generalizar es clasificar.
Por ejemplo, el concepto de un árbol es el resultado de generalizar algunas ocurrencias particulares del mismo, lo cual permite que, al ver un árbol, aunque sea de una especie desconocida para el observador, sea posible clasificarlo como tal. Agregación: sirve para asignar las propiedades de mayor interés en un objeto. Por ejemplo, se deben tomar en cuenta propiedades tales como marca, modelo, color, año de fabricación y precio.
Al integrar variables y objetos es posible tener un modelo de datos, el cual será de gran utilidad en cualquier empresa, ya que permite conocer, organizar, administrar y regular los datos, logrando el mejor aprovechamiento de su activo más valioso: la información.
Esquema de un modelo de datos: Mundo real: Objetos, propiedades, interacciones Describen un estado válido de aquello que representan. Transformaciones Son los cambios en los objetos y sus propiedades. Hay nuevos objetos, otros desaperecen y otros cambian. Objetos, propiedades, interacciones Describen un nuevo estado válido.
Modelo de datos + modelo de procesos (nivel lógico):
DBMS (sistema de gestión de bases de datos) + aplicaciones de TI (nivel de implementación):
Entidades, atributos, conexiones. Se representan en un diagrama entidadrelación. Esto corresponde al ámbito del modelo de datos.
DDL - CREATE, ALTER, DROP El lenguaje de defición de datos (DDL) se usa para crear, borrar o alterar entidades, atributos y conexiones.
Operaciones Cambios a entidades y atributos, por ejemplo dar de alta un cliente o cambiar el estatus de un cliente. Esto corresponde al ámbito del modelo de procesos.
DML- SELECT, INSERT, UPDATE, DELETE El lenguaje de manipulación de datos (DML) se emplea para ejecutar las operaciones que representa las transformaciones de los objetos en el mundo real.
Restricciones de integridad Son limitaciones a las operaciones para propiciar que representen fielmente las transformaciones en el mundo real. Esto corresponde al ámbito del modelo de datos + procesos.
DDL + código aplicativo Con el DDL se limitan algunos aspectos como la unicidad del número de cliente o que los movimientos correspondan a un cliente existente. Con código aplicativo se validan otros aspectos, por ejemplo que la edad de una persona no sea negativa.
Rubén Adad Rubén es un profesional con 30 años de experiencia en el sector de bases de datos, con implementaciones de gran complej idad en México y Latinoamérica, habiendo sido docente y pionero en este campo.
ruben.adad@infomedia.com.mx comunicaciones@infomedia.com.mx
w w w .i n fos feramaga zi ne.com
I N F ÓSF E RA
13