Introducción al Business Intelligence
1
Capítulo 1 Introducción al Business Intelligence
Objetivo Al finalizar el capítulo, el alumno podrá:
Conocer el propósito y necesidades de negocio que satisfacen las soluciones de inteligencia de negocios. Diferenciar los conceptos y terminologías de BI.
Temas 1. 2. 3. 4. 5.
¿Qué es la Inteligencia de Negocios? Necesidades de negocio insatisfechas por las soluciones tradicionales Visión actual: el proceso de la Inteligencia de Negocios Conceptos y terminología comunes en Inteligencia de Negocios Anexos: Casos de éxito en Inteligencia de Negocios
Cibertec Perú S.A.C - Business Intelligence SQL Server 2014
Introducción al Business Intelligence
1.
2
¿Qué es la Inteligencia de Negocios?
La Inteligencia de Negocios o Business Intelligence (BI) se puede definir como el proceso de extraer datos de cualquier fuente: archivos o base de datos para transformarlos en información, de tal manera que esta apoye a la toma de decisiones de las empresas.
BI provee la información que requiere el usuario de negocio en la manera como lo desea y en el momento que lo necesite, mejorando enormemente la efectividad para la toma de decisiones, revelando tendencias de negocio no perceptibles fácilmente.
Cibertec Perú S.A.C - Business Intelligence SQL Server 2014
Introducción al Business Intelligence
2.
3
Necesidades del negocio insatisfechas por las soluciones tradicionales
Las empresas actualmente poseen las siguientes necesidades de negocios que no pueden ser resueltas por los sistemas tradicionales: –
Los reportes concuerdan. • • •
–
provenientes
de
varios
sistemas
transaccionales,
no
Los resultados financieros no concuerdan. Las cantidades de inventario tampoco concuerdan. Los reportes detallados no concuerdan con los reportes consolidados.
La gerencia no tiene acceso a una “imagen global corporativa” de su situación actual: • • • •
¿Cómo están nuestras finanzas? ¿Quiénes son nuestros clientes? ¿Qué nos han comprado? ¿Cuánto inventario tenemos disponible?
–
Tecnología de Información (TI) está saturada con peticiones de reportes a niveles gerenciales.
–
Las unidades de negocios han contratado personal de TI para escribir “reporteadores” dentro de la misma unidad.
“Sacerdotes de datos” aparecen por toda la organización. Compartir datos es raro – BD propietarias son la regla. Producir los reportes cada vez toma más y más tiempo.
Cibertec Perú S.A.C - Business Intelligence SQL Server 2014
Introducción al Business Intelligence
–
4
TI crea múltiples extracciones de archivos de sistemas transaccionales para propósitos analíticos.
Se generan extractos de los extractos. Se pierden las fuentes de datos, no hay rastros de auditoria.
–
La organización no puede determinar la rentabilidad precisa de un cliente o de un producto Se cuestiona la rentabilidad. Las tendencias en ventas o de los hábitos de compra del cliente no pueden determinarse.
–
Pasan mucho tiempo tratando de hacer que los reportes en Excel luzcan bien.
–
Han perdido oportunidades de negocios por recibir información retrasada.
–
No sabe con certeza si sus empleados están alcanzando los objetivos planeados.
Es decir las empresas empiezan a valorar ya no cómo registrar la información sino como recuperarla adecuadamente, ya que han descubierto que siendo esta información más oportuna y exacta, la empresa se volverá más competitiva. Visto así, la información corporativa es un activo importante de la empresa que genera valor y la falta de ella generará pérdidas.
2.1 Las organizaciones y sus requerimientos de sistemas de información Con el fin soportar la gran cantidad de información que maneja una empresa, muchas de ellas despliegan una gran infraestructura tecnológica que soportan Sistemas de Información. El Crecimiento tecnológico tiene varias etapas que van desde la integración de sistemas, el crecimiento y la implementación. Las condiciones actuales de competencia han provocado el que sea necesaria tecnología cada vez más sofisticada para responder a las peticiones muy particulares de información. Sistemas de Procesamiento de Datos (SPD), Sistemas de Manufactura, Administración de Recursos Empresariales (ERP), Sistemas de Información Ejecutiva (EIS), Sistemas de Soporte a las Decisiones (DSS), Manejo de Relación con Clientes (CRM), Suministro de la Cadena de Distribución (SCM), Sistemas en la nube (CLOUD Computing), etc., son algunos de los sistemas que afloran y se ponen de moda y luego desaparecen acorde a la evolución de las empresas. Pero algo que no va a desaparecer es la necesidad de las empresas de consumir información para atender los distintos requerimientos del negocio dependiendo de la función que cada empleado desempeñe en la empresa.
Cibertec Perú S.A.C - Business Intelligence SQL Server 2014
Introducción al Business Intelligence
5
2.2 La información que las empresas necesitan La información se está extendiendo a todo nivel dentro de la organización, áreas donde la toma de decisiones se basaba en la experiencia o la intuición requieren cada vez más de soporte basado en información. Si bien es cierto, los niveles operativos y tácticos siempre han requerido de información para el día a día del negocio, esta no ha estado restringida para su uso. El avance vertiginoso de las tecnologías de la información ha permitido que la información estratégica sea puesta en las computadoras de los directivos, este comportamiento se ha generalizado principalmente motivado no solo por la facilidad y utilidad de la información compartida sino por los softwares de toma de decisiones cada vez más sencillos de usar. Actualmente, la información es enviada a todos los niveles de la empresa con diferentes fines (comunicación, control, administración, evaluación, planeamiento, etc.). Las organizaciones están entendiendo que los niveles directivos tienen una gran responsabilidad al tomar decisiones, ya que ellas recaen sobre toda la empresa, pero también existen más empleados que toman decisiones y, a pesar de que estas no tienen un impacto global, deben ser también adecuadas y oportunas, pues ciertos grupos dependen de las mismas. Directores, gerentes, supervisores, jefes, coordinadores todos aquellos que toman decisiones deben tener suficiente información para apoyarse en su trabajo diario, el lugar que ocupen en la pirámide organizacional se vuelve secundario cuando el enfoque es hacia el manejo de procesos y todos los puestos tienen cierta relación y dependencia entre sí. De manera general dentro de la organización, los requerimientos de información se dividen en 3 partes:
Cibertec Perú S.A.C - Business Intelligence SQL Server 2014
Introducción al Business Intelligence
6
A. Información Estratégica Soporta principalmente las decisiones del primer nivel de la pirámide organizacional, respondiendo a las preguntas estratégicas de la empresa. Su característica principal es que no muestra muchos datos y está asociado a la gerencia visual a través de indicadores que muestran si se están alcanzando los objetivos y metas o no a nivel global. Ello permitirá saber cómo se encuentra la empresa ahora y poder tomar decisiones oportunas. B. Información Táctica Esta información da soporte al segundo nivel de la pirámide organizacional. Está relacionada al plano operativo de la estrategia planteando vías posibles para lograr la estrategia dictada por los ejecutivos y directivos. Esta información corresponde a un área o departamento específico de la empresa, siendo su alcance departamental y se asocia a gerencias o subdirecciones. C. Información Técnico Operacional Este nivel de información corresponde a la parte operativa de la empresa, compuesta por los sistemas de entrada masiva de datos y procesamiento transaccional. Soporta el día a día del negocio y a sus diversas áreas (contabilidad, facturación, almacén, presupuesto y otros sistemas administrativos). Se asocian a las jefaturas o coordinaciones operativas o del tercer nivel
Cibertec Perú S.A.C - Business Intelligence SQL Server 2014
Introducción al Business Intelligence
3.
7
Visión Actual: el proceso de la Inteligencia de Negocios
El proceso de realizar Inteligencia de Negocios es conocido como Datawarehousing y comprenden los siguientes pasos:
1. Extracción El proceso de extracción consiste en estudiar y entender los datos fuente, tomando aquellos que son de utilidad para el Data Warehouse. 2. Transformación Una vez que los datos son extraídos, estos se transforman. Este proceso incluye corrección de errores, resolución de problemas de dominio, borrado de campos que no son de interés, generación de claves, aumento de información, etc. 3. Carga e Índices
Cibertec Perú S.A.C - Business Intelligence SQL Server 2014
Introducción al Business Intelligence
8
Al terminar el proceso de transformación, se cargan los datos en el Data Warehouse. 4. Chequeo de Calidad Una vez ingresada la información al Data Warehouse, se realizan controles de calidad para asegurar que la misma sea correcta. 5. Liberación/Publicación Cuando la información se encuentra disponible, se le informa al usuario. Es importante publicar todo cambio que se hayan realizado. 6. Consulta El usuario final debe disponer de herramientas de consulta y procesamiento de datos. Este proceso incluye consultas ad hoc, reportes, aplicaciones DSS, Data Mining, etc. 7. Feedback Muchas veces es aconsejable seguir el camino inverso de carga. Por ejemplo, puede alimentarse los sistemas legales con información depurada del Data Warehouse o almacenar en el mismo alguna consulta generada por el usuario que sea de interés. 8. Auditoría Los procesos de auditoría permiten conocer de dónde proviene la información así como también qué cálculos la generaron. 9. Seguridad Una vez construido el Data Warehouse, es de interés para la organización que la información llegue a la mayor cantidad de usuarios pero, por otro lado, se tiene sumo cuidado de protegerla contra posibles 'hackers', 'snoopers' o espías. El desarrollo de Internet ha incrementado este dilema. 10. Respaldo y Recuperación Se deben realizar actividades de backup y restore de la información, tanto la almacenada en el Data Warehouse como la que circula desde los sistemas fuente al Data Warehouse
Cibertec Perú S.A.C - Business Intelligence SQL Server 2014
Introducción al Business Intelligence
4.
9
Conceptos y terminología comunes en Inteligencia de Negocios
4.1 OnLine Transacction Processing (OLTP) El sistema OnLine Transaction Processing (OLTP) se encarga de dar soporte a los procesos diarios de ingreso y mantenimiento de datos y son en tiempo real. De esa manera, las aplicaciones OLTP sirven para la captura de las transacciones cotidianas (ventas, compras, control de almacén, cuenta corriente, generación de notas de crédito, control de la producción, contabilidad, etc.) y es la fuente principal de datos de las soluciones analíticas. Entre las diferencias principales tenemos que las aplicaciones OLTP poseen volatilidad de datos (los datos solo permanecen en el sistema por un período corto de tiempo) a diferencia de las soluciones analíticas, que requieren de datos históricos para generar diversas perspectivas de análisis. Otra diferencia es la actualización frecuente de los datos (la información es modificada muchas veces en el día), mientras que las aplicaciones analíticas realizan operaciones normalmente, de solo lectura. Características
Diseño orientado a la transacción Volatilidad de los datos Soporte limitado a la toma de decisiones
Ejemplos
Cobranzas Sistema de control de asistencia Control de almacén
Cibertec Perú S.A.C - Business Intelligence SQL Server 2014
Introducción al Business Intelligence
10
4.2 On Line Analytical Processing (OLAP) On Line Analytical Processing (OLAP) es un proceso en el que se emplean herramientas sofisticadas que permiten agilizar el proceso de análisis de información de la empresa, organizada en perspectivas (dimensiones) y métricas, permitiendo ejecutar análisis complejos de datos en base a los cuales, se tomarán las decisiones del negocio. OLAP permite a los usuarios una fácil y amigable navegación por la información obteniendo el nivel de granularidad (detalle) que requiera para la toma de decisiones. Asimismo, puede generar cálculos adicionales en base a los datos existentes. Los servicios OLAP proveen múltiples formas y niveles de análisis gracias a que los datos se encuentran estructurados con esta finalidad. De esta manera, el usuario puede realizar comparaciones entre períodos anteriores o paralelos, encontrar patrones y tendencias, aislar un grupo de datos con características específicas para realizar un análisis más profundo y sobretodo de una manera amigable, rápida y confiable.
Características OLAP
Es consolidada. La data se centraliza desde diferentes orígenes de datos en un repositorio central único a la cual tienen accesos los usuarios de toda la organización. Es consistente. Los usuarios deben obtener una única versión de los datos no importando de qué área provengan las consultas ni el momento en que ellas se realicen. Es orientada al objetivo. Solo contiene información relevante para la toma de decisiones, de esta manera la orientación está en cómo se usan los datos y no cómo se almacenan. Es histórica. Los sistemas OLAP almacenan toda la información histórica de la empresa permitiendo de esta manera, realizar comparaciones entre períodos actuales e históricos. Es de solo lectura. Los sistemas OLAP se diseñas y optimizan solo para realizar consultas, la operaciones de actualización, borrado, etc. son exclusivos de los sistemas transaccionales.
Cibertec Perú S.A.C - Business Intelligence SQL Server 2014
Introducción al Business Intelligence
11
No es atómica. Los sistemas OLAP contienen datos sumarizados que permiten la velocidad en la consulta.
Como se observa en el gráfico superior en un modelo de datos OLAP, la información es vista como cubos, los cuales consisten de valores cualitativos, atributos (dimensiones) y valores cuantitativos, métricas (medidas). Un analista de negocio ve a una consulta analítica en términos de un cierto número de perspectivas de análisis (dimensiones) tales como productos, cliente, vendedor, tiempo, regiones, fabricantes, o artículos y desea poder analizar un conjunto de valores cuantitativos (cantidades, montos, ratios, etc.), de tal manera que usando estos componentes pueda lograr distintas vistas de una misma consulta. - Ejemplo: Para la cadena de tiendas de alquiler de videos que posee 3 sucursales, el sistema OLAP le permite presentar información consolidada por cada sucursal, compararla y tomar decisiones apropiadamente.
Cibertec Perú S.A.C - Business Intelligence SQL Server 2014
Introducción al Business Intelligence
12
Sin embargo, la tienda de alquiler de videos también desearía ver cómo se desarrollan las ventas en el tiempo. Para hacer esto, se necesitarían varias hojas de cálculo.
De esta manera, las medidas que deseamos visualizar del negocio se encontrarán almacenadas en la intersección de las perspectivas de análisis, en sectores llamados “celdas” del cubo, como se grafica a continuación:
Siguiendo con el ejemplo anterior, con este cubo podemos ahora tomar rebanadas del mismo para responder preguntas como:
¿Cuánto se alquila por categoría de video en cada tienda en un mes dado? Rpta.: Categoría de video por tienda en un mes dado.
¿Qué tiendas han mejorado sus alquileres de video dado a través del tiempo? Rpta.: Tienda por tiempo de una categoría de video dado.
Cibertec Perú S.A.C - Business Intelligence SQL Server 2014
Introducción al Business Intelligence
13
¿Cuánto se alquila por categoría de video a través del tiempo en una tienda dada? Rpta.: Categoría de video por tiempo en una tienda dada.
Sistemas OLTP vs OLAP En cuanto a las soluciones transaccionales y las soluciones Data Warehousing también tenemos diferencias:
Frecuencia de actualización: las soluciones transaccionales se encuentran en tiempo real, manteniendo la data actualizada. En cambio, las soluciones Data Warehousing, poseen una periodicidad de carga: diaria, semanal, mensual, etc., pudiendo estar sus datos en tiempo real o cercano al tiempo real.
Estructurado para responder a las transacciones diarias de la empresa y diseñada para conservar una alta integridad de datos. A diferencia de ello, las soluciones Data Warehousing están estructuradas para proporcionar facilidad y velocidad en la consulta.
Optimizado para las soluciones transaccionales, están optimizados para el registro diario de las operaciones del negocio. Las soluciones Data Warehousing están optimizados para la consulta, de tal forma que se dé la manera más amigable y rápida.
Cibertec Perú S.A.C - Business Intelligence SQL Server 2014
Introducción al Business Intelligence
14
4.3 Data Warehouse Entonces podemos definir que un Data Warehouse es una colección de datos, en la cual se encuentra integrada la información de la Institución y que es usada como soporte para el proceso de toma de decisiones gerenciales. Reunir los elementos de datos apropiados desde diversas fuentes de aplicación en un ambiente integral centralizado, simplifica el problema de acceso a la información y en consecuencia, acelera el proceso de análisis, consultas y disminuye el tiempo de acceso a la información. Las aplicaciones para soporte de decisiones basadas en un Data Warehouse, pueden hacer más práctica y fácil la explotación de datos. De esa forma, podemos obtener una mayor eficacia en la toma de decisiones, que no se logra cuando se usan solo los datos que provienen de las aplicaciones operacionales (que ayudan en la operación de la empresa en sus operaciones cotidianas) en los que la información se obtiene realizando procesos independientes y muchas veces complejos. Un Data Warehouse se crea al extraer datos desde una o más bases de datos de aplicaciones operacionales. La data extraída es transformada para eliminar inconsistencias y resumir si es necesario y luego, cargarlas en el Data Warehouse. El proceso de transformar, crear el detalle de tiempo variante, resumir y combinar los extractos de datos ayuda a crear el ambiente para el acceso a la información institucional. Este nuevo enfoque ayuda a las personas individuales, en todos los niveles de la empresa, a efectuar su toma de decisiones con mayor objetividad.
4.4 Data Mart Características Orientado a un departamento dentro de la organización. Puede ser implementado como una solución para problemas inmediatos. No es necesario para construir un Data Warehouse. Beneficios Implementación rápida y sencilla Menor costo de implementación Cubre necesidades específicas del negocio Respuestas rápidas por el menor volumen de información Asegura la consistencia de los datos El empleo de los Datamarts estará determinado por los que toman decisiones. Por ejemplo, en una empresa, el gerente de ventas necesitará analizar la información de su área, es decir las ventas de la empresa.
Desventajas
Inadvertidamente se pueden usar datos no compatibles con otros Datamarts que luego alarguen el tiempo de unificación
Cibertec Perú S.A.C - Business Intelligence SQL Server 2014
Introducción al Business Intelligence
15
Si el Data Warehouse es construido primero, se requiere de hardware adicional para soportar Datamarts individuales. Datos descentralizados debido a que cada Datamart corresponde a una base de datos individual por tema o por área.
4.5 Metadata La metadata es definida como los datos acerca de los datos, es considerado como el diccionario de datos del Data Warehouse. La Metadata abarca todos los procesos de Data Warehousing y contiene los siguientes elementos:
Nombres de campos y definiciones Mapeo de los datos Tablas Índices Cronogramas de extracción y carga Criterios de selección Cálculos de los datos derivados Transformación de los datos
Existes 3 tipos de Metadatos y se mencionan a continuación:
Metadata del Negocio: Contiene los modelos lógicos y las reglas de negocio.
Metadata Técnica: Contiene los nombres físicos de las tablas, ubicación de almacenamiento, relaciones, llaves, etc.
Metadata Operacional: Contiene la programación de cargas, fechas de refrescos de datos, seguridad.
Cibertec Perú S.A.C - Business Intelligence SQL Server 2014
Introducción al Business Intelligence
5.
16
Anexos: Casos de éxito en Inteligencia de Negocios
5.1 WallMart Pionero en el uso de la información para identificar nuevas oportunidades de mercado. Uso de datamining masivo, solución basada en Teradata. Caso Clásico: Pañales y Cerveza Es, sin duda, uno de los ejemplos más clásicos de la llamada Business Intelligence (BI), utilizado en las escuelas de negocio de todo el mundo para ilustrar cómo el análisis de los datos de los clientes puede llevar a conclusiones interesantes y aprovechables en el contexto del denominado Market-Basket Analysis: la correlación entre los pañales y la cerveza. Estos dos productos, aparentemente sin ninguna relación, protagonizan esta historia que los profesores y estudiantes de marketing suelen atribuir a lo que ocurrió en los hipermercados WalMart, cuando se empezó a utilizar por primera software analítico para combinar el análisis de los datos de compras de algunas personas, obtenidos gracias a sus tarjetas de fidelización. Según la historia, se descubrieron una serie de asociaciones, algunas perfectamente obvias, como que las personas que compraban cereal también compraban leche, o los que compraban ron, también compraban Coca-Cola, y una completamente inesperada: pañales y cerveza.
Cibertec Perú S.A.C - Business Intelligence SQL Server 2014
Introducción al Business Intelligence
17
Aparentemente, los clientes masculinos cuando compraban pañales el fin de semana, tenían además una gran tendencia a adquirir también cerveza. De ahí surgió toda una amplia gama de teorías psicológicas sobre cómo los hombres, cuando eran enviados por pañales al supermercado, asociaban la idea con la de obtener alguna recompensa para ellos, o relacionaban el fin de semana con tomar cerveza y, a pesar de ser ya padres, realizaban una acción de solteros, que seguramente era aprobada en sus hogares ya que la diferencia era que estos hombres bebían dentro de su casa. Como resultado del descubrimiento de esta correlación, según sus estadísticas, el hipermercado decidió mover la cerveza y ponerla al lado de los pañales, y obtuvieron gracias a ello un incremento de ventas bastante importante.
5.2 NBA Un resultado interesante fue uno hasta entonces no observado por los entrenadores de los Knicks de Nueva York. El doble marcaje a un jugador puede generalmente dar la oportunidad a otro jugador de encestar más fácilmente. Mezcla datos de jugadores de baloncesto con imágenes de partidos para encontrar patrones y apoyar a la generación de estrategias. “Advanced Scout”, basado en IBM DB2 Universal Database, IBM DB2 Intelligent Miner y Virtual Gold's VirtualMiner.
5.3 AC MILAN El sistema, creado por Computer Associates International, es alimentado por datos de cada jugador, relacionados con su rendimiento, alimentación y respuesta a estímulos externos, que se obtienen y analizan cada quince días. Actualmente el sistema permite predecir alguna posible lesión. El club está ahorrando dinero evitando comprar jugadores que presenten una alta probabilidad de lesión.
5.4 ODYSSEY Gobierno Español enjuicia a la empresa Odyssey por apoderarse de 18 toneladas de monedas de Oro. Un espectacular sistema de tratamiento de datos llamado «Data Mining». Su funcionamiento es sencillo: se introducen en una base de datos todas las variables imaginables, desde los lugares en los que hay barcos hundidos hasta las corrientes marinas predominantes, los puntos más habituales de tormentas o las rutas que probablemente utilizara cada capitán. De todo ese cóctel, se extrae un modelo que indica, con una fiabilidad impresionante, en qué puntos exactos hay más probabilidades de hallar un tesoro. A partir de ese momento, y después de años de paciente estudio, esa computadora proporciona a Odyssey un detallado y gigantesco mapa del tesoro sin necesidad de escudriñar todo el fondo del Atlántico o el Mediterráneo.
Cibertec Perú S.A.C - Business Intelligence SQL Server 2014
Introducción al Business Intelligence
18
5.4 SUNAT SAS, el líder en Inteligencia de Negocios, anunció hoy que la SUNAT, ha logrado una mejor detección de la subvaloración de mercancías en la principal aduana peruana, al incrementar en 14 puntos porcentuales el éxito en los hallazgos en el Proceso de Selección de Canales de Control. SUNAT es la primera entidad tributaria en Latinoamérica en emplear con éxito técnicas de Minería de Datos en la lucha contra el contrabando y la subvaluación. Solución sobre plataforma SAS, Oracle, Informix, Java.
Cibertec Perú S.A.C - Business Intelligence SQL Server 2014