Seminario Escuela de Ingeniería – EAFIT CAOBA Centro de Excelencia y apropiación en Big Data y Data Analytics Edwin Montoya, emontoya@eafit.edu.co
Enero 25 de 2019 http://www.alianzacaoba .co
Agenda 1. 2.
3.
4.
¿Qué es CAOBA? Y su génesis Participación de EAFIT en CAOBA 1. Gestión 2. Investigación 3. Formación 4. Consultoría y Asesoría Resultados 1. Investigación 2. Formación 3. Consultoría Futuro de EAFIT en CAOBA
¿Qué es CAOBA? Centro de Excelencia y apropiación en Big Data y Data Analytics Primer acuerdo público – privado que promueve el Big Data y la analítica en Colombia.
Nace de la convocatoria Colciencias-MinTIC 2015
En Operación desde 2016
¿Quiénes somos? Participan:
@AlianzaCAOBA http://www.alianzacaoba.co
Misión y Visión CAOBA Misión CAOBA está comprometido con innovar y generar nuevo conocimiento en Analítica y Big Data, que se traduce en soluciones a problemas relevantes para el desarrollo y la competitividad del país, integrando los principios y saberes de sus aliados: academia, empresa y Estado. Generamos valor a través de la investigación aplicada, la consultoría para la apropiación tecnológica, la formación de talento humano y la transferencia de conocimiento.
Visión En el 2021 CAOBA será un centro de excelencia sostenible y reconocido en Colombia capaz de transformar a la sociedad y mejorar la calidad de vida de las personas, con soluciones innovadoras en Analítica y Big Data..
Objetivos CAOBA 2.
1.
Crear soluciones y productos como resultado de procesos de Investigación, desarrollo e innovación…
Crear un modelo de formación y transferencia en tecnologías BD&DA…
5.
Promover y apoyar iniciativas de emprendimiento y spin-offs colombianos … alrededor de las temáticas CAOBA …
Objetivo General
Fortalecer la generación de soluciones de análisis de información apoyada en TIC para problemas en diversos sectores industriales, gubernamentales y académicos, en Colombia y la región.
3.
Generar producción intelectual a partir de las investigaciones, soluciones y productos desarrollados en CAOBA.
4.
Proporcionar servicio de consultoría para las empresas colombianas que faciliten la apropiación de tecnologías, metodologías y herramientas de análisis de información… Imágenes tomadas de https://www.flaticon.com
¿Qué hacemos en CAOBA?
• • • •
Investigación aplicada Formación (MsC, PhD, Extensión) Consultoría Apoyo al emprendimiento Pics licensed under CC BY-NC-ND
Estructura organizacional CAOBA Junta Directiva Director CAOBA Empresa externa gestión infraestructura Oficina de proyectos
Comité de Infraestructura
Comité técnico
Oficina administrativa
Director de Proyectos TC
Líder de analítica TC
Líder de innovación TC
Director Comunicaciones integradas TC
Equipo Proyectos 1
Equipo Proyectos 2
Equipo Proyectos 3
Auxiliar administrativo TC
Líder Local
Líder Local
Líder Local
Profesores Asesores TP
Profesores Asesores TP
Profesores Asesores TP
Profesionales y Estudiantes
Profesionales y Estudiantes
Profesional jurídico TP
Cargo
TC: Tiempo Completo
Área
TP: Tiempo Parcial
Profesionales y Estudiantes
Participaciรณn de EAFIT en CAOBA
http://www.alianzacaoba .co
Equipo Administrativo CAOBA EAFIT Junta Directiva
Mauricio Perfetti Investigadora InHouse CAOBA EAFIT
Silvia Lozano
Comité Técnico y Inv Ppal
Edwin Montoya
Administración Financiera EAFIT
Ricardo Pardo
Investigadores y estudiantes CAOBA EAFIT 2019 Equipo Economía y Finanzas Carolina Crispin Andrés Escobar
Juan Guillermo Lalinde
Santiago Rodriguez
Equipo Ingeniería
Santiago Rodriguez Silvia Lozano Jonathan Munera
Carolina Crispín
Paola Almonacid
Marta Tabares
Profesores Investigadores
Andrés Escobar Juan Carlos Rivera
Equipo Ciencias
Edwin Montoya Silvia Lozano
Equipo Mercadeo
Juan Carlos Monroy
Henry Laniado
Leandro Ariza Ramiro Vélez
Leandro Ariza
Ramiro Vélez
Investigadores y estudiantes CAOBA EAFIT <=2018
Diego Restrepo Santiago Angee
Camilo Torres
Estud. Ing
Rafael Rincón
Rosember Guerra
Andres Ramirez
Est E & F
Jim Sanchez
Profesores Investigadores Javier Correa David Ortiz
Sebastian Garcia
Daniel Sierra-Sosa Julián Arango
Olga Quintero
PostDoc y Est Ciencias
Ramiro Vélez
Resultados de Investigaciรณn, Formaciรณn y Proyecciรณn
http://www.alianzacaoba .co
Los proyectos de investigaciรณn
http://www.alianzacaoba .co
Proyectos de Investigación Estado de avance MAR 2016
JUN
DIC ENE 2016 2017
JUN
DIC ENE 2017 2018
DNP
Aguas DNP Fase I
DIC 2018
Fase II
SIAMED Nutresa Fase I
Nutresa Bancol. Externo
JUN
Segmentación Digital Nutresa
Comunidades Bancolombia Fase I
Fase II Textolítica Bancolombia
DIC 2017
Actualizado a Ene 2019
DIC 2018
En desarrollo
Terminado
En formulación
COMUNIDADES BANCOLOMBIA Titulo del proyecto
Objetivo General
Riesgo y Valor en Comunidades Financieras: Una Aproximación a través de modelos de Interacción Comercial
Estimar y pronosticar el riesgo y rentabilidad de los clientes, basándose en su interacción directa e indirecta con otros clientes bajo diferentes escenarios relacionados con las condiciones económicas y la información transaccional.
Fechas de inicio y fin
• Fase I Abril 2016 – Marzo 2017 • Fase II Abril 2017 – Diciembre 2017
Lideres técnicos: Diego Restrepo - EAFIT Juan Manuel Salamanca - ICESI
Resultados obtenidos • • • • • • •
Organización de los datos teniendo en cuenta información de los clientes, transacciones, estados financieros, información de industria y mercado. Consolidación de la información de variables financieras para los nits de la base de datos. Modelo de detección de comunidades con algoritmos de Louvain e Infomap Modelos econométricos de análisis de rentabilidad y jerarquico Prototipo de interfaz gráfica de usuario para la visualización de algoritmos de comunidades y modelos econométricos. Manuscritos de Procedimiento y Técnicos Transferencia de conocimiento de la arquitectura y código fuente del prototipo realizado por ICESI a EAFIT para futuras implementaciones.
Líder ancla: Juan David Ospina
Entregables • • • • • • • • • •
Archivos de conjuntos de datos organizados RTF-04-Informe Comunidades-Bancolombia.pdf RTF-07-Reporte_Ciencias_EAFIT_CAOBA-12122017.pdf RTF-08-interpretation-results_final.pdf RT-17 Modelos jerárquicos Bancolombia RT-21 Informe_Base_ModeloRiesgo Plataforma de visualización: Netint y Netint-Banca. Prototipo NetInt para la Visualización de Comunidades “standalone” con un incremento de producto relacionado con la funcionalidad de rentabilidad ya operativa. Módulo NetInt_Banca con modelo de cálculo de rentabilidad basado en promedios ponderados y modelo de riesgo y rentabilidad. Prototipo Web de visualización y análisis de sensibilidad
INVERSIONES AGUAS DNP Titulo del proyecto
Objetivo General
Cuantificación del efecto de las inversiones en el sector de agua potable en la prestación del servicio de agua. Fechas de inicio y fin
• Fase I Enero 2018 – Julio 2018 • Fase II Julio 2018 – Diciembre 2018
Líder técnico: Diego Restrepo – EAFIT Líder Ancla: Liliana Fernandez -DNP
Resultados obtenidos • • • • • •
Organización de los datos teniendo en cuenta información de los proyectos de inversión, cobertura, IRCA y continuidad del servicio. Consolidación de la información de variables alrededor de variables como proyectos de inversión, cobertura, IRCA y continuidad del servicio. Algoritmos relacionados con análisis de redes y clusterización de municipios Modelo estocástico espacial para medir el impacto de las inversiones en variables identificadas. Prototipo de interfaz gráfica de usuario para la visualización de algoritmos generados. Manuscritos de Procedimiento y Técnicos
Desarrollar una herramienta que, mediante el empleo de técnicas analíticas sobre los datos disponibles relacionados con los proyectos de agua potable, permita cuantificar de forma diferenciada el impacto de las inversiones en el sector de agua potable en la calidad de la prestación del servicio de acueducto, con el objetivo de apoyar la toma de decisiones relacionadas con la asignación eficiente de recursos y priorización de inversiones en proyectos de agua potable en Colombia.
Entregables • Archivos de conjuntos de datos organizados • Reportes de avance: RT-01 Informe sobre revision BDs [Preliminar] RT-02 Informe Agrupamiento municipios Analisis Redes_v1 RT-03 Presentacion Random_walkbased_methods_for_community_detection_in_networks_v1 RT-04 Informe sobre exploración de datos Inversiones Aguas_v1 RT-05 Informe analisis econometria espacial Max-P_v1 RT-06 Presentacion agrupamiento_preliminar_municipios_usando_análisis_de_redes_v1 RT-07 InformeInversionesAguasDNP_20180702_v1 • Scripts generados para transformación y limpieza de datos • Código fuente de prototipo y componentes software intermedios. • Prototipo web para visualización de información descriptiva y modelos
SIAMED NUTRESA Titulo del proyecto
Objetivo General
Disponer de herramientas que, mediante el empleo de técnicas de analítica descriptiva y predictiva, permitan desplegar y consolidar fuentes dispersas de información de terceros relacionadas con algunas marcas piloto, con el objetivo de brindar información para apoyar las tomas de decisión de las marcas de la empresa.
Sistema de Integración y Análisis para Medios Digitales Fechas de inicio y fin
• Fase I Marzo 2018 – Septiembre 2018 • Fase II Octubre 2018 –2019?
Líder del proyecto: Juan Carlos Monrroy – EAFIT Líder ancla: Hans Pechken- Nutresa
Resultados esperados • •
•
Inventario de la información suministrada por los terceros asociados a las dos marcas piloto, así como las características de la misma Comparación de las opciones tecnológicas disponibles para el despliegue de la información y seleccionar la opción más adecuada para Nutresa, con el acompañamiento del equipo de TI de Servicios Nutresa. Prototipo que integre y permita visualizar la información centralizada.
Avances •
Reformulación de la forma de enfrentar los requerimientos del proyecto (actividad en desarrollo entre Nutresa – Eafit – CAOBA Central)
•
Se pasa de un enfoque inicial en el cual el punto de partida estaba casi en su totalidad basado en el entendimiento de datos a un enfoque mixto en el cual el entendimiento del negocio se vuelve preponderante, sin descuidar el trabajo sobre datos.
•
Este nuevo enfoque implica involucrar más personas por parte de Nutresa para lograr el entendimiento de negocio y el de datos mediante talleres.
SEGMENTACIÓN DIGITAL NUTRESA Objetivo General: Construir un modelo de segmentación y monitoreo de consumidores de productos del Grupo Nutresa a partir de su interacción y comunicación en medios digitales.
TEXTOLITICA BANCOLOMBIA Objetivo General: Utilizar técnicas de analítica para ejecutar análisis sobre textos de comunicaciones con clientes que permitan entender las posibilidades de la analítica de texto para Bancolombia, y poder tomar así acciones basadas en dichos análisis de textos.
Formación y Consultoría
http://www.alianzacaoba .co
Talento humano formado y en formación CAROLINA CRISPIN, PhD LEANDRO ARIZA, PhD SANTIAGO RODRIGUEZ, PhD ANDRÉS ESCOBAR, MsC RAMIRO VÉLEZ, MsC JONATHAN MUNERA, MsC SANTIAGO ANGEE, MsC CAMILO TORRES, MsC SEBASTIÁN GARCÍA, MsC SILVIA LOZANO, MsC JIM SANCHEZ, MsC En formación Graduado
ROSEMBER GUERRA, MsC DAVID ORTIZ, MsC
2016
2017
2018
2019
2020
Estado de formaciรณn de estudiantes EAFIT a 2018-2
Consultorias y Capacitación Estado de avance ENE
MinTIC
2017
DIC. ENE
2018
DIC ENE
Entrenamiento Empresarial en Big Data y Analítica
Capacitación Ciudadano de Datos
Terpel
2019
Ecopetrol
Consultoria para la Unidad de Analítica
Consultoria: Acompañamiento estrategia TD
DIC 2017
Actualizado a Ene 2019
DIC 2018
En desarrollo
Terminado
En formulación
DIC
Prototipos tecnol贸gicos 1.PROYECTO COMUNIDADES BANCOLOMBIA: Url acceso: http://caobapp.dis.eafit.edu.co/comunidadesbancolombia/ C贸digo fuente: https://bitbucket.org/comunidadesbancolombia/proyectocomunidadesbancolombia/src 2.PROYECTO INVERSIONES AGUAS DNP: Url acceso: http://caobapp.dis.eafit.edu.co/dnpdashboardsindex/ C贸digo fuente: https://bitbucket.org/inversionesaguadnp/dashboardvisualization/src 3.PROYECTO TEXTOLITICA BANCOLOMBIA: Colaboraci贸n con Universidad Javeriana en el prototipo generado.
Artículos y Ponencias 1. artículo: Using cognitive software to evaluate Natural Language Classifiers - A Use Case Conferencia: Collaboration, Software and Services in Information Society 2017 (CSS 2017). Esta es la URL donde se pueden encontrar publicados todos los proceedings de la conferencia. https://is.ijs.si/archive/proceedings/2017/files/Zbornik%20-%20G.pdf 2. artículo: Towards an improved ASUM-DM process methodology for cross-disciplinary multi-organization Big Data & Analytics projects Conferencia: Thirteenth International Conference On Knowledge Management In Organisations (KMO 2018) Aceptación: En documento pdf adjunto: Kmo2018 Acceptance Notification 3. ponencia: Government investment and water quality: a spatial stochastic frontier analysis Conferencia: Décima Conferencia Norteamericana de Productividad (NAPW X) Aceptación: Carta de aceptación sin membrete 4. artículo: Sequence Generation using Deep Recurrent Networks and Embeddings: A study case in music Paper: Journal of New Music Research Aceptación: Solo se tiene el Submission Confirmation, aun no se tiene la aceptación.
EAFIT-CAOBA motivador para la Maestría en Ciencias de Datos y Analítica • Las cuatro escuelas se unen en 2017, con los profes de EAFIT-CAOBA, para formular el proyecto de la MCDA.
Síntesis de la participación de EAFIT en CAOBA • • • • •
• • •
Ubicación de CAOBA en EAFIT, bloque 18, 4º piso 8 profesores, 1/8 de tiempo, de 4 escuelas (equiv. a un TC de Prof. Inv.) 5 Estudiantes de Maestría, 3 de Doctorado y 1 postdoc Participación en Proyectos de Investigación con las Anclas (Bancolombia, Nutresa y DNP) Asesorias, Consultorías y Capacitación • Terpel (en ejecución) • Ecopetrol (en formulación) • Curso de Ciudadano Científico de Datos (2 docentes) 2 Escuelas de Verano en Bogotá sobre Big Data y Analítica (2017 y 2018) • Se movilizó todos los profes y estudiantes, todo incluiodo Participación en Conferencia Mundial del TDWI en Chicago/USA 2017 • Un cupo, con todo incluido. Producción científica a tavés de artículos y ponencias
Futuro de EAFIT en CAOBA • • • •
Nuevos estudiantes de maestría Más proyectos de consultoría y asesoría Nuevo programa de capacitación hacia las empresas Nuevos proyectos para 2019 con las anclas
Presentación • • • • • • • • • • •
Edwin Montoya-Múnera, emontoya@eafit.edu.co Ingeniero de Sistemas PhD en Telecomunicaciones Jefe del Depto de Informática y Sistemas, Escuela de Ingeniería • Anteriormente Jefe Programa Ing de Sistemas, Coordinador de la Especialización en Teleinformática. Miembro Comité de la Maestría en Ciencias de Datos y Analítica, EAFIT Investigador grupo GIDITIC Línea de Investigación: Big Data, Analítica, Sistemas Distribuidos, Contenidos Digitales en Educación. Miembro de ACM & IEEE desde 1997. Representante por Colombia ante el Centro Latinoamericano de Estudios en Informática (CLEI) Miembro del Comité Técnico, CAOBA Miembro del Comité Técnico, ARTICA
ÂżPreguntas?