CAOBA, Centro de Excelencia y apropiación en Big Data y Data Analytics

Page 1

Seminario Escuela de Ingeniería – EAFIT CAOBA Centro de Excelencia y apropiación en Big Data y Data Analytics Edwin Montoya, emontoya@eafit.edu.co

Enero 25 de 2019 http://www.alianzacaoba .co


Agenda 1. 2.

3.

4.

¿Qué es CAOBA? Y su génesis Participación de EAFIT en CAOBA 1. Gestión 2. Investigación 3. Formación 4. Consultoría y Asesoría Resultados 1. Investigación 2. Formación 3. Consultoría Futuro de EAFIT en CAOBA


¿Qué es CAOBA? Centro de Excelencia y apropiación en Big Data y Data Analytics Primer acuerdo público – privado que promueve el Big Data y la analítica en Colombia.

Nace de la convocatoria Colciencias-MinTIC 2015

En Operación desde 2016


¿Quiénes somos? Participan:

@AlianzaCAOBA http://www.alianzacaoba.co


Misión y Visión CAOBA Misión CAOBA está comprometido con innovar y generar nuevo conocimiento en Analítica y Big Data, que se traduce en soluciones a problemas relevantes para el desarrollo y la competitividad del país, integrando los principios y saberes de sus aliados: academia, empresa y Estado. Generamos valor a través de la investigación aplicada, la consultoría para la apropiación tecnológica, la formación de talento humano y la transferencia de conocimiento.

Visión En el 2021 CAOBA será un centro de excelencia sostenible y reconocido en Colombia capaz de transformar a la sociedad y mejorar la calidad de vida de las personas, con soluciones innovadoras en Analítica y Big Data..


Objetivos CAOBA 2.

1.

Crear soluciones y productos como resultado de procesos de Investigación, desarrollo e innovación…

Crear un modelo de formación y transferencia en tecnologías BD&DA…

5.

Promover y apoyar iniciativas de emprendimiento y spin-offs colombianos … alrededor de las temáticas CAOBA …

Objetivo General

Fortalecer la generación de soluciones de análisis de información apoyada en TIC para problemas en diversos sectores industriales, gubernamentales y académicos, en Colombia y la región.

3.

Generar producción intelectual a partir de las investigaciones, soluciones y productos desarrollados en CAOBA.

4.

Proporcionar servicio de consultoría para las empresas colombianas que faciliten la apropiación de tecnologías, metodologías y herramientas de análisis de información… Imágenes tomadas de https://www.flaticon.com


¿Qué hacemos en CAOBA?

• • • •

Investigación aplicada Formación (MsC, PhD, Extensión) Consultoría Apoyo al emprendimiento Pics licensed under CC BY-NC-ND


Estructura organizacional CAOBA Junta Directiva Director CAOBA Empresa externa gestión infraestructura Oficina de proyectos

Comité de Infraestructura

Comité técnico

Oficina administrativa

Director de Proyectos TC

Líder de analítica TC

Líder de innovación TC

Director Comunicaciones integradas TC

Equipo Proyectos 1

Equipo Proyectos 2

Equipo Proyectos 3

Auxiliar administrativo TC

Líder Local

Líder Local

Líder Local

Profesores Asesores TP

Profesores Asesores TP

Profesores Asesores TP

Profesionales y Estudiantes

Profesionales y Estudiantes

Profesional jurídico TP

Cargo

TC: Tiempo Completo

Área

TP: Tiempo Parcial

Profesionales y Estudiantes


Participaciรณn de EAFIT en CAOBA

http://www.alianzacaoba .co


Equipo Administrativo CAOBA EAFIT Junta Directiva

Mauricio Perfetti Investigadora InHouse CAOBA EAFIT

Silvia Lozano

Comité Técnico y Inv Ppal

Edwin Montoya

Administración Financiera EAFIT

Ricardo Pardo


Investigadores y estudiantes CAOBA EAFIT 2019 Equipo Economía y Finanzas Carolina Crispin Andrés Escobar

Juan Guillermo Lalinde

Santiago Rodriguez

Equipo Ingeniería

Santiago Rodriguez Silvia Lozano Jonathan Munera

Carolina Crispín

Paola Almonacid

Marta Tabares

Profesores Investigadores

Andrés Escobar Juan Carlos Rivera

Equipo Ciencias

Edwin Montoya Silvia Lozano

Equipo Mercadeo

Juan Carlos Monroy

Henry Laniado

Leandro Ariza Ramiro Vélez

Leandro Ariza

Ramiro Vélez


Investigadores y estudiantes CAOBA EAFIT <=2018

Diego Restrepo Santiago Angee

Camilo Torres

Estud. Ing

Rafael Rincón

Rosember Guerra

Andres Ramirez

Est E & F

Jim Sanchez

Profesores Investigadores Javier Correa David Ortiz

Sebastian Garcia

Daniel Sierra-Sosa Julián Arango

Olga Quintero

PostDoc y Est Ciencias

Ramiro Vélez


Resultados de Investigaciรณn, Formaciรณn y Proyecciรณn

http://www.alianzacaoba .co


Los proyectos de investigaciรณn

http://www.alianzacaoba .co


Proyectos de Investigación Estado de avance MAR 2016

JUN

DIC ENE 2016 2017

JUN

DIC ENE 2017 2018

DNP

Aguas DNP Fase I

DIC 2018

Fase II

SIAMED Nutresa Fase I

Nutresa Bancol. Externo

JUN

Segmentación Digital Nutresa

Comunidades Bancolombia Fase I

Fase II Textolítica Bancolombia

DIC 2017

Actualizado a Ene 2019

DIC 2018

En desarrollo

Terminado

En formulación


COMUNIDADES BANCOLOMBIA Titulo del proyecto

Objetivo General

Riesgo y Valor en Comunidades Financieras: Una Aproximación a través de modelos de Interacción Comercial

Estimar y pronosticar el riesgo y rentabilidad de los clientes, basándose en su interacción directa e indirecta con otros clientes bajo diferentes escenarios relacionados con las condiciones económicas y la información transaccional.

Fechas de inicio y fin

• Fase I Abril 2016 – Marzo 2017 • Fase II Abril 2017 – Diciembre 2017

Lideres técnicos: Diego Restrepo - EAFIT Juan Manuel Salamanca - ICESI

Resultados obtenidos • • • • • • •

Organización de los datos teniendo en cuenta información de los clientes, transacciones, estados financieros, información de industria y mercado. Consolidación de la información de variables financieras para los nits de la base de datos. Modelo de detección de comunidades con algoritmos de Louvain e Infomap Modelos econométricos de análisis de rentabilidad y jerarquico Prototipo de interfaz gráfica de usuario para la visualización de algoritmos de comunidades y modelos econométricos. Manuscritos de Procedimiento y Técnicos Transferencia de conocimiento de la arquitectura y código fuente del prototipo realizado por ICESI a EAFIT para futuras implementaciones.

Líder ancla: Juan David Ospina

Entregables • • • • • • • • • •

Archivos de conjuntos de datos organizados RTF-04-Informe Comunidades-Bancolombia.pdf RTF-07-Reporte_Ciencias_EAFIT_CAOBA-12122017.pdf RTF-08-interpretation-results_final.pdf RT-17 Modelos jerárquicos Bancolombia RT-21 Informe_Base_ModeloRiesgo Plataforma de visualización: Netint y Netint-Banca. Prototipo NetInt para la Visualización de Comunidades “standalone” con un incremento de producto relacionado con la funcionalidad de rentabilidad ya operativa. Módulo NetInt_Banca con modelo de cálculo de rentabilidad basado en promedios ponderados y modelo de riesgo y rentabilidad. Prototipo Web de visualización y análisis de sensibilidad



INVERSIONES AGUAS DNP Titulo del proyecto

Objetivo General

Cuantificación del efecto de las inversiones en el sector de agua potable en la prestación del servicio de agua. Fechas de inicio y fin

• Fase I Enero 2018 – Julio 2018 • Fase II Julio 2018 – Diciembre 2018

Líder técnico: Diego Restrepo – EAFIT Líder Ancla: Liliana Fernandez -DNP

Resultados obtenidos • • • • • •

Organización de los datos teniendo en cuenta información de los proyectos de inversión, cobertura, IRCA y continuidad del servicio. Consolidación de la información de variables alrededor de variables como proyectos de inversión, cobertura, IRCA y continuidad del servicio. Algoritmos relacionados con análisis de redes y clusterización de municipios Modelo estocástico espacial para medir el impacto de las inversiones en variables identificadas. Prototipo de interfaz gráfica de usuario para la visualización de algoritmos generados. Manuscritos de Procedimiento y Técnicos

Desarrollar una herramienta que, mediante el empleo de técnicas analíticas sobre los datos disponibles relacionados con los proyectos de agua potable, permita cuantificar de forma diferenciada el impacto de las inversiones en el sector de agua potable en la calidad de la prestación del servicio de acueducto, con el objetivo de apoyar la toma de decisiones relacionadas con la asignación eficiente de recursos y priorización de inversiones en proyectos de agua potable en Colombia.

Entregables • Archivos de conjuntos de datos organizados • Reportes de avance: RT-01 Informe sobre revision BDs [Preliminar] RT-02 Informe Agrupamiento municipios Analisis Redes_v1 RT-03 Presentacion Random_walkbased_methods_for_community_detection_in_networks_v1 RT-04 Informe sobre exploración de datos Inversiones Aguas_v1 RT-05 Informe analisis econometria espacial Max-P_v1 RT-06 Presentacion agrupamiento_preliminar_municipios_usando_análisis_de_redes_v1 RT-07 InformeInversionesAguasDNP_20180702_v1 • Scripts generados para transformación y limpieza de datos • Código fuente de prototipo y componentes software intermedios. • Prototipo web para visualización de información descriptiva y modelos



SIAMED NUTRESA Titulo del proyecto

Objetivo General

Disponer de herramientas que, mediante el empleo de técnicas de analítica descriptiva y predictiva, permitan desplegar y consolidar fuentes dispersas de información de terceros relacionadas con algunas marcas piloto, con el objetivo de brindar información para apoyar las tomas de decisión de las marcas de la empresa.

Sistema de Integración y Análisis para Medios Digitales Fechas de inicio y fin

• Fase I Marzo 2018 – Septiembre 2018 • Fase II Octubre 2018 –2019?

Líder del proyecto: Juan Carlos Monrroy – EAFIT Líder ancla: Hans Pechken- Nutresa

Resultados esperados • •

Inventario de la información suministrada por los terceros asociados a las dos marcas piloto, así como las características de la misma Comparación de las opciones tecnológicas disponibles para el despliegue de la información y seleccionar la opción más adecuada para Nutresa, con el acompañamiento del equipo de TI de Servicios Nutresa. Prototipo que integre y permita visualizar la información centralizada.

Avances •

Reformulación de la forma de enfrentar los requerimientos del proyecto (actividad en desarrollo entre Nutresa – Eafit – CAOBA Central)

Se pasa de un enfoque inicial en el cual el punto de partida estaba casi en su totalidad basado en el entendimiento de datos a un enfoque mixto en el cual el entendimiento del negocio se vuelve preponderante, sin descuidar el trabajo sobre datos.

Este nuevo enfoque implica involucrar más personas por parte de Nutresa para lograr el entendimiento de negocio y el de datos mediante talleres.



SEGMENTACIÓN DIGITAL NUTRESA Objetivo General: Construir un modelo de segmentación y monitoreo de consumidores de productos del Grupo Nutresa a partir de su interacción y comunicación en medios digitales.

TEXTOLITICA BANCOLOMBIA Objetivo General: Utilizar técnicas de analítica para ejecutar análisis sobre textos de comunicaciones con clientes que permitan entender las posibilidades de la analítica de texto para Bancolombia, y poder tomar así acciones basadas en dichos análisis de textos.


Formación y Consultoría

http://www.alianzacaoba .co


Talento humano formado y en formación CAROLINA CRISPIN, PhD LEANDRO ARIZA, PhD SANTIAGO RODRIGUEZ, PhD ANDRÉS ESCOBAR, MsC RAMIRO VÉLEZ, MsC JONATHAN MUNERA, MsC SANTIAGO ANGEE, MsC CAMILO TORRES, MsC SEBASTIÁN GARCÍA, MsC SILVIA LOZANO, MsC JIM SANCHEZ, MsC En formación Graduado

ROSEMBER GUERRA, MsC DAVID ORTIZ, MsC

2016

2017

2018

2019

2020


Estado de formaciรณn de estudiantes EAFIT a 2018-2


Consultorias y Capacitación Estado de avance ENE

MinTIC

2017

DIC. ENE

2018

DIC ENE

Entrenamiento Empresarial en Big Data y Analítica

Capacitación Ciudadano de Datos

Terpel

2019

Ecopetrol

Consultoria para la Unidad de Analítica

Consultoria: Acompañamiento estrategia TD

DIC 2017

Actualizado a Ene 2019

DIC 2018

En desarrollo

Terminado

En formulación

DIC


Prototipos tecnol贸gicos 1.PROYECTO COMUNIDADES BANCOLOMBIA: Url acceso: http://caobapp.dis.eafit.edu.co/comunidadesbancolombia/ C贸digo fuente: https://bitbucket.org/comunidadesbancolombia/proyectocomunidadesbancolombia/src 2.PROYECTO INVERSIONES AGUAS DNP: Url acceso: http://caobapp.dis.eafit.edu.co/dnpdashboardsindex/ C贸digo fuente: https://bitbucket.org/inversionesaguadnp/dashboardvisualization/src 3.PROYECTO TEXTOLITICA BANCOLOMBIA: Colaboraci贸n con Universidad Javeriana en el prototipo generado.


Artículos y Ponencias 1. artículo: Using cognitive software to evaluate Natural Language Classifiers - A Use Case Conferencia: Collaboration, Software and Services in Information Society 2017 (CSS 2017). Esta es la URL donde se pueden encontrar publicados todos los proceedings de la conferencia. https://is.ijs.si/archive/proceedings/2017/files/Zbornik%20-%20G.pdf 2. artículo: Towards an improved ASUM-DM process methodology for cross-disciplinary multi-organization Big Data & Analytics projects Conferencia: Thirteenth International Conference On Knowledge Management In Organisations (KMO 2018) Aceptación: En documento pdf adjunto: Kmo2018 Acceptance Notification 3. ponencia: Government investment and water quality: a spatial stochastic frontier analysis Conferencia: Décima Conferencia Norteamericana de Productividad (NAPW X) Aceptación: Carta de aceptación sin membrete 4. artículo: Sequence Generation using Deep Recurrent Networks and Embeddings: A study case in music Paper: Journal of New Music Research Aceptación: Solo se tiene el Submission Confirmation, aun no se tiene la aceptación.


EAFIT-CAOBA motivador para la Maestría en Ciencias de Datos y Analítica • Las cuatro escuelas se unen en 2017, con los profes de EAFIT-CAOBA, para formular el proyecto de la MCDA.


Síntesis de la participación de EAFIT en CAOBA • • • • •

• • •

Ubicación de CAOBA en EAFIT, bloque 18, 4º piso 8 profesores, 1/8 de tiempo, de 4 escuelas (equiv. a un TC de Prof. Inv.) 5 Estudiantes de Maestría, 3 de Doctorado y 1 postdoc Participación en Proyectos de Investigación con las Anclas (Bancolombia, Nutresa y DNP) Asesorias, Consultorías y Capacitación • Terpel (en ejecución) • Ecopetrol (en formulación) • Curso de Ciudadano Científico de Datos (2 docentes) 2 Escuelas de Verano en Bogotá sobre Big Data y Analítica (2017 y 2018) • Se movilizó todos los profes y estudiantes, todo incluiodo Participación en Conferencia Mundial del TDWI en Chicago/USA 2017 • Un cupo, con todo incluido. Producción científica a tavés de artículos y ponencias


Futuro de EAFIT en CAOBA • • • •

Nuevos estudiantes de maestría Más proyectos de consultoría y asesoría Nuevo programa de capacitación hacia las empresas Nuevos proyectos para 2019 con las anclas


Presentación • • • • • • • • • • •

Edwin Montoya-Múnera, emontoya@eafit.edu.co Ingeniero de Sistemas PhD en Telecomunicaciones Jefe del Depto de Informática y Sistemas, Escuela de Ingeniería • Anteriormente Jefe Programa Ing de Sistemas, Coordinador de la Especialización en Teleinformática. Miembro Comité de la Maestría en Ciencias de Datos y Analítica, EAFIT Investigador grupo GIDITIC Línea de Investigación: Big Data, Analítica, Sistemas Distribuidos, Contenidos Digitales en Educación. Miembro de ACM & IEEE desde 1997. Representante por Colombia ante el Centro Latinoamericano de Estudios en Informática (CLEI) Miembro del Comité Técnico, CAOBA Miembro del Comité Técnico, ARTICA


ÂżPreguntas?


Turn static files into dynamic content formats.

Create a flipbook
Issuu converts static files into: digital portfolios, online yearbooks, online catalogs, digital photo albums and more. Sign up and create your flipbook.