Taller de Proyectos III

Page 1

UNIVERSIDAD PERUANA DE CIENCIAS APLICADAS FACULTAD DE INGENIERÍA PROGRAMA ACADÉMICO DE INGENIERÍA DE SISTEMAS

Diseño de una solución tecnológica basada en el algoritmo Regresión Logística de Machine Learning y Robotic Process Automation para mejorar la eficiencia del proceso Captación de Clientes de la empresa Gurú Soluciones. TALLER DE PROYECTOS III

AUTOR(ES) García Moreano, Alejandro Francisco (0000-0003-2257-1827) Cruz Carpio, Nicolas Benjamin (0000-0002-9755-4223) Alzamora Juro, Maziel Elizabeth (0000-0003-3479-2133) Ochoa La Cruz, Elmer Alexander (0000-0003-3193-6613) Cerda Garay, Neydin (0000-0002-3868-6015)

ASESOR Moreno Molina, Joel (0000-0001-8556-307X) Lima, 22 de marzo de 2021.


DEDICATORIA

El presente trabajo de investigación está dedicado a nuestros padres, quienes con su amor y apoyo incondicional nos motivan a persistir en el logro de nuestras metas personales.

1


AGRADECIMIENTOS

Nuestros agradecimientos al profesor Joel Moreno Molina por su asesoría en el desarrollo del presente trabajo de investigación y, a todos quienes apoyaron y creyeron en el mismo.

2


RESUMEN

Hoy en día obtener una ventaja competitiva para las empresas es muy importante, pues ayuda a consolidar la rentabilidad y el cumplimiento de sus objetivos. Dentro de los factores que ayudan al cumplimiento de sus pilares las organizaciones deben fortalecer su cartera de clientes, porque es una fuente de oportunidades para obtener compradores de calidad. La estrategia de la empresa Gurú Soluciones va en la línea de mejorar la eficiencia de la adquisición de clientes B2B para el impulso de sus servicios como Marketing, CEO, e-Commerce, entre otros. En el presente proyecto se analiza el proceso de captación de clientes de la empresa Gurú soluciones y se plantea el desarrollo de un modelo que contribuya con el aumento de la eficiencia en la captación de compradores de calidad, a fin de reducir el nivel de morosidad que ha afectado a los indicadores de ingresos dentro de la compañía. Por tal motivo, el presente trabajo analiza una mejora de dicho proceso, con el uso de las tecnologías de Robotic Process Automation (RPA) y Machine Learning con servicios Cloud. Es así que, se muestra la construcción de un modelo que ayudará a cumplir los indicadores esperados para cada uno de los objetivos trazados para la mejora de dicho proceso. Finalmente, gracias a la propuesta de solución se evalúa la efectividad en la mejora de la captación de clientes en Gurú Soluciones haciendo uso de Arquitecturas de Solución, para el flujo del proceso mejorado, para la solución RPA y para la solución con Machine Learning. Todo lo anterior, utilizando análisis presupuestarios y medición de indicadores de viabilidad económica para garantizar su correcta aplicación e implementación dentro de la organización con la investigación realizada.

Palabras clave: Credit risk; credit scroring; default loan; default payments; nonperforming loan; machine learning; logistic regression; robotic process automation; rpa industry. 3


Design of a technological solution based on the Logistic Regression algorithm of Machine Learning and Robotic Process Automation to improve the efficiency of the Customer Acquisition process of the company Gurú Soluciones. ABSTRACT

Nowadays, obtaining a competitive advantage for companies is very important, as it helps to consolidate profitability and the fulfillment of its objectives. Among the factors that help the fulfillment of its pillars, organizations must strengthen their client portfolio, because it is a source of opportunities to obtain quality buyers. The strategy of the company Gurú Soluciones is in the line of improving the efficiency of the acquisition of B2B clients to promote its services such as Marketing, CEO, e-Commerce, among others. This project analyzes the customer acquisition process of the company Gurú Soluciones and proposes the development of a model that contributes to increasing efficiency in attracting quality buyers, in order to reduce the level of delinquency that It has affected the revenue indicators within the company. For this reason, this work analyzes an improvement of this process, with the use of Robotic Process Automation (RPA) and Machine Learning technologies with Cloud services. Thus, the construction of a model is shown that will help to meet the expected indicators for each of the objectives set for the improvement of said process. Finally, thanks to the solution proposal, the effectiveness in improving customer acquisition in Gurú Soluciones is evaluated using Solution Architectures for the improved process flow, for the RPA solution and for the Machine Learning solution. All of the above, using budget analysis and measurement of economic viability indicators to guarantee its correct application and implementation within the organization with the research carried out.

4


Keywords: Credit risk; credit scroring; default loan; default payments; nonperforming loan;

machine

learning;

logistic

regression;

robotic

process

automation;

rpa

industry.Machine Learninnts; Nonperforming loan; Bad payers

5


TABLA DE CONTENIDOS

1

2

CAPÍTULO I: PLANTEAMIENTO DEL PROBLEMA.........................................1 1.1

ENUNCIADO DEL PROBLEMA.........................................................................1

1.2

FORMULACIÓN DEL PROBLEMA...................................................................4

1.3

OBJETIVO GENERAL.........................................................................................4

1.4

OBJETIVOS ESPECÍFICOS.................................................................................5

1.5

JUSTIFICACIÓN..................................................................................................6

1.6

LIMITACIONES....................................................................................................6

CAPÍTULO II: ESTADO DEL ARTE.......................................................................6 2.1

METODOLOGÍA..................................................................................................6

2.2

PLANIFICACIÓN.................................................................................................7

2.3

DESARROLLO.....................................................................................................9

2.4

RESULTADOS....................................................................................................10

2.5

ANÁLISIS............................................................................................................13

2.5.1

Q1: ¿Qué modelos predictivos de morosidad se han desarrollado en otras

organizaciones?............................................................................................................13 2.5.2

¿Qué tecnologías se pueden usar para construir modelos predictivos de

morosidad?...................................................................................................................17

3

2.5.3

Q3: ¿Cuál es el mejor algoritmo para predecir la morosidad?.........................18

2.5.4

¿Qué tecnologías se pueden usar para construir soluciones RPA?..................23

2.5.5

¿Qué soluciones RPA se han desarrollado en otras organizaciones?...............25

CAPÍTULO III: MARCO TEÓRICO.....................................................................31 3.1

CAPTACIÓN DE CLIENTES B2B.....................................................................31

3.1.1

Definición.........................................................................................................31

3.1.2

Tipos de captación de clientes..........................................................................31

3.1.3

Modelos de captación de clientes B2B............................................................32

3.1.4

Desempeño de captación de clientes B2B.......................................................33

3.2

REGRESIÓN LOGÍSTICA.................................................................................35

3.2.1

Definición.........................................................................................................35

3.2.2

Tipos de regresión logística..............................................................................36 6


3.2.3

Modelos de Regresión Logística......................................................................37

3.2.4

Desempeño del modelo....................................................................................41

3.3

4

ROBOTIC PROCESS AUTOMATION...............................................................45

3.3.1

Definición.........................................................................................................45

3.3.2

Tipos de tecnologías de RPA............................................................................46

3.3.3

Elementos del RPA...........................................................................................48

3.3.4

Desempeño del RPA.........................................................................................50

CAPÍTULO IV: PROPUESTA DE SOLUCIÓN TECNOLÓGICA.....................52 4.1

DESCRIPCIÓN DEL PROCESO ACTUAL....................................................................52

4.2

DESCRIPCIÓN DEL PROCESO FUTURO....................................................................53

4.3

ARQUITECTURA DE LA SOLUCIÓN.........................................................................56

4.4

FACTIBILIDAD ECONÓMICA...................................................................................58

4.4.1

Beneficios económicos.....................................................................................59

4.4.2

Cálculo de costo total de propiedad de implementación de la solución...........62

4.4.3

Cálculo del ROI................................................................................................65

5

REFERENCIAS.........................................................................................................66

6

ANEXOS.....................................................................................................................68

7


ÍNDICE DE TABLAS

Tabla 1. Matriz Vester.............................................................................................................2 Tabla 2. Cadenas de búsqueda...............................................................................................9 Tabla 3. Criterios de selección.............................................................................................10 Tabla 4. Cantidad de papers encontrados por metabuscador y año de publicación...........11 Tabla 5. Cantidad de papers seleccionados por metabuscador y año de publicación........11 Tabla 6. Lista de papers seleccionados................................................................................12 Tabla 7. Modelos predictivos de morosidad.........................................................................17 Tabla 8. Tecnologías usadas en la construcción modelos predictivos de morosidad..........19 Tabla 9. Detalle del área bajo la curva................................................................................22 Tabla 10. Mejores algoritmos para predecir la morosidad..................................................23 Tabla 11. Tecnologías usadas en la construcción de soluciones RPA..................................25 Tabla 12. Soluciones RPA.....................................................................................................31 Tabla 13. Tipos de regresión logística..................................................................................39 Tabla 14. Comparación de tecnologías RPA y objetivos asociados a IA.............................48 Tabla 15. Cálculo de beneficio 1..........................................................................................50 Tabla 16. Cálculo de beneficio 2..........................................................................................50 Tabla 17. Cálculo de beneficio 3..........................................................................................50 Tabla 18. Resumen de beneficios económicos......................................................................50 Tabla 19. Detalle Inversión Machine Learning...................................................................50 Tabla 20. Detalle de Inversión RPA.....................................................................................50 Tabla 21. Presupuesto de componentes Microsoft Azure Estimate......................................50 Tabla 22. Presupuesto de componente Microsoft Power Automate.....................................50 Tabla 23. Detalle del costo de operación anual...................................................................50 Tabla 24. Presupuesto Microsoft Azure Estimate.................................................................50 Tabla 25. Detalle del costo de mantenimiento del proveedor ML........................................50 Tabla 26. Detalle del costo de mantenimiento del proveedor RPA......................................50 Tabla 27. Detalle del costo de mantenimiento anual...........................................................50 Tabla 28. Resumen de costos................................................................................................50 Tabla 29. Flujo de caja elaborado.......................................................................................50

8


ÍNDICE DE FIGURAS

Figura 1. Aspectos para considerar al seleccionar clientes potenciales. Adaptado de “¿Qué necesita una empresa para captar nuevos clientes?”, por Quiroa, 2020.................................1 Figura 2. Descripción gráfica de situación problemática. Elaboración propia......................2 Figura 3. Clasificación de problemas en Matriz Vester. Elaboración propia........................3 Figura 4. Árbol de Problemas................................................................................................3 Figura 5. Árbol de Objetivos.................................................................................................5 Figura 6. Preguntas de investigación. Elaboración propia....................................................8 Figura 7. Proceso Selección de Papers. Elaboración propia...............................................10 Figura 8. Cantidad de papers por país de investigación. Elaboración propia......................12 Figura 9. Modelo conceptual de modelo predictivo propuesto. Adaptado de “Conceptual model of the dynamic model”, por Moradi y Mokhatab, 2019............................................15 Figura 10. Modelo conceptual para la modelización del riesgo de crédito. Adaptado de “Conceptual framework for credit risk modelling”, por Papouskova y Hajek, 2019..........17 Figura 11. Diagrama de flujo de comparativa para clasificar el crédito del consumidor. Adaptado de “The Flow Chart of Classification Method”, por Azaria, Dedy y Suhartono, 2019......................................................................................................................................20 Figura 12. Descripción curva ROC. Adaptado de "Receiver operating characteristic (ROC) curve: (a) for SE models; (b) for MiE models”, por Kanapickiene y Spicas, (2019)..........22 Figura 13. Modelo de programación híbrido para automatización de procesos robóticos (RPA). Adaptado de “Hybrind Scheduling Model”, por Kocsi, Matonya, Pusztai y Budai, 2020......................................................................................................................................27 Figura 14. Subproceso de optimización MB – GA. Adaptado de “Developed Subprocess”, por Kocsi, Matonya, Pusztai y Budai, 2020.........................................................................28 Figura 15. Marco de trabajo para la implementación de una solución RPA. Adaptado de “The framework”, por Huang y Vasarhelvy, 2019...............................................................29 Figura 16. Modelo del proceso automatizado con RPA. Adaptado de “To-be process model designed in Enate”, por Šimek y Šperka, 2019....................................................................30 Figura 17 Modelo del embudo de segmentación del clientes. Adaptado de "The customer targeting funnel model", por Yo Y. y Cai Sh. (2007)..........................................................35

9


Figura 18. Modelo de regresión logística. Adaptado por (3), por Kanapickiene y Spicas, (2019)...................................................................................................................................42 Figura 19. Modelo de calificación crediticia propuesto. Adaptado por "The Credit Scoring model", por Bennouna y Tkiouat, (2019).............................................................................43 Figura 20. Fórmula para calcular la Sensibilidad. Adaptado de (29), por Azaria et al., (2019)...................................................................................................................................44 Figura 21. Fórmula para calcular la Especificidad. Adaptado de (30), por Azaria et al., (2019)...................................................................................................................................44 Figura 22. Fórmula para calcular el FPrate. Adaptado de (31), por Azaria et al., (2019)...44 Figura 23. Fórmula para calcular el AUC. Adaptado de (32), por Azaria et al., (2019).....44 Figura 24. Matriz de confusión. Adaptado de "ConfunsionMatrix", por Azaria et al., (2019)...................................................................................................................................44 Figura 25. Curva de ROC: (a) para modelos SE y (b) para modelos MiE. Adaptado de "Receiver operating characteristic (ROC) curve: (a) for SE models; (b) for MiE models ", por Kanapickiene y Spicas, (2019)......................................................................................45 Figura 26 La curva ROC del modelo Credit Scoring. Adaptado de "The ROC curve of the Credit Scoring model", por Bennouna y Tkiouat, (2019)....................................................46 Figura 27. Una descripción general de RPA y desarrollo de robots. Adaptado de “Taking a look at Robotic Process Automation and its potential application in digital forensics”, por Asquith y Horsman, 2019....................................................................................................48 Figura 28. Principales tecnologías RPA en el mercado. Elaboración propia.......................48 Figura 29. Componentes básicos del RPA. Adaptado de “Components of RPA”, por Tripathi, 2018.......................................................................................................................48 Figura 30. Diagrama de proceso actual. Elaboración propia...............................................48 Figura 31. Diagrama de subproceso actual. Elaboración propia.........................................48 Figura 32. Diagrama de proceso futuro. Elaboración propia..............................................48 Figura 33. Arquitectura Machine Learning de Gurú Soluciones. Elaboración propia........50 Figura 34. Arquitectura Robotic Process Automation de Gurú Soluciones. Elaboración propia....................................................................................................................................50

10


1 1.1

CAPÍTULO I: PLANTEAMIENTO DEL PROBLEMA ENUNCIADO DEL PROBLEMA

Toda empresa que quiera mantenerse en el mercado y aumentar sus utilidades con la venta de sus productos debe interesarse en aumentar su número de clientes. El proceso encargado de incorporar nuevos clientes a la empresa es Captación de Clientes. Para este fin, según Figura 1, la empresa debe conocer 3 aspectos importantes de sus clientes: sus necesidades, sus deseos y su capacidad de pago. El tercer aspecto es muy importante, porque se debe asegurar un retorno recurrente de dinero por el pago de los productos contratados. No es beneficioso para la empresa contar con este pago el primero mes y el resto de los meses no contarlos (Quiroa, 2020).

Figura 1. Aspectos para considerar al seleccionar clientes potenciales. Adaptado de “¿Qué necesita una empresa para captar nuevos clientes?”, por Quiroa, 2020. Por otro lado, en un mundo tan dinámico y competitivo como este, es menester disponer, en el menor tiempo posible, de esta base de clientes potenciales. No hacerlo a tiempo podría resultar en pérdida de cuota de participación del mercado y afectar los intereses económicos de la empresa. Gurú Soluciones es una empresa que ofrece servicios de publicidad digital a pequeñas y medianas empresas. El proceso Captación de Clientes pertenece al área de Marketing y esta está estrechamente relacionado con el proceso Ventas del área Comercial. Actualmente, el proceso Captación de Clientes es ineficiente. Por un lado, se dispone de una deficiente identificación de malos pagadores al generar la base de clientes potenciales. 1


Las actividades definidas consideran excluir el cliente potencial solo si el RUC o algún Representante Legal relacionado con este se encuentra registrado en la base Lista Negra. En la base Lista Negra se encuentran registrados los RUC’s que tienen más de 1 mes de atraso en el pago de sus productos contratados y permanecen ahí hasta registrar puntualidad en sus pagos por 3 meses consecutivos. El filtro realizado es limitado porque no permite identificar un mal pagador si este no tiene relación alguna con los clientes de Gurú Soluciones. Asimismo, el ser Representante Legal de otra empresa que sí tiene un buen comportamiento de pago en Gurú Soluciones no garantiza que el cliente potencial vaya a tener el mismo comportamiento de pago y no caer en morosidad en los meses próximos. Por otro lado, existe una elevada cantidad de actividades operativas dentro del proceso que generan demora en la entrega de la base de clientes potenciales al área Comercial para la ejecución de sus campañas de ventas.

Figura 2. Descripción gráfica de situación problemática. Elaboración propia. Tabla 1. Matriz Vester

Elaboración propia. 2


Figura 3. Clasificación de problemas en Matriz Vester. Elaboración propia. En la Tabla 1 y Figura 3, se presentan y clasifican los problemas encontrados en la situación problemática según desarrollo de Matriz Vester. A continuación, se presenta el Árbol de Problemas elaborado a partir de los resultados obtenidos en la Matriz Vester. Se identifican los problemas causas, problema central y problemas efectos.

Figura 4. Árbol de Problemas 3


La mayoría de las investigaciones realizadas sobre problemáticas en la predicción de morosidad son estudiadas y abordadas en el proceso Otorgamiento de Créditos de entidades financieras, como la investigación de Moradi y Mokhatab (2019) referido al diseño y desarrollo de un modelo dinámico predictivo de morosidad para entidades financieras. Moderno modelo capaz de adaptarse a factores externos, como los políticos y económicos, para lograr predicciones más precisas. Por otro lado, las investigaciones realizadas sobre problemáticas de automatización de actividades refieren el uso de Robotic Process Automation (RPA) en su solución, como la investigación de Huang y Vasarhelvy (2019) referido al diseño y validación de un marco de trabajo para implementar una solución RPA. Los autores caracterizan el marco de trabajo propuesto con el desarrollo de un proyecto piloto aplicado a un procedimiento de auditoria. La solución logra reducir un 90% del tiempo total de ejecución (de 30 minutos a 3 minutos). Se propone mejorar la identificación de malos pagadores en clientes potenciales usando Machine Learning, y reducir los tiempos de entrega de base de clientes potenciales al área Comercial para la ejecución de sus campañas de ventas usando Robotic Process Automation. Se busca reducir la cartera morosa a fin de aumentar la liquidez de la empresa, y garantizar la ejecución oportuna de las campañas de ventas a fin de incrementar las ventas. Así, ante lo anteriormente expuesto, la pregunta principal que guía la presente investigación es la siguiente: ¿Cómo mejorar la eficiencia del proceso Captación de Clientes de la empresa Gurú Soluciones mediante una solución tecnológica basada en el algoritmo Regresión Logística de Machine Learning y Robotic Process Automation?

1.2

FORMULACIÓN DEL PROBLEMA

A continuación, se presenta la formulación del problema: ¿Cómo mejorar la eficiencia del proceso Captación de Clientes de la empresa Gurú Soluciones mediante una solución tecnológica basada en el algoritmo Regresión Logística de Machine Learning y Robotic Process Automation?

4


1.3

OBJETIVO GENERAL

A continuación, se presenta el objetivo general: Diseñar una solución tecnológica basada en el algoritmo Regresión Logística de Machine Learning y Robotic Process Automation para mejorar la eficiencia del proceso Captación de Clientes de la empresa Gurú Soluciones. Complementariamente, se presenta el Árbol de Objetivos desarrollado en la presente investigación. Se observa cómo el objetivo central definido guarda relación con el problema central del Árbol de Problemas y con el objetivo general formulado en la investigación.

Figura 5. Árbol de Objetivos 1.4

OBJETIVOS ESPECÍFICOS

A continuación, se presentan los objetivos específicos: 

Analizar el proceso Captación de Clientes para identificar oportunidades de mejora con el algoritmo Regresión Logística de Machine Learning y Robotic Process

Automation. Definir la arquitectura de la solución basada en el algoritmo Regresión Logística de Machine Learning y Robotic Process Automation.

5


Rediseñar el proceso de Captación de Clientes considerando la aplicación de la solución basada en el algoritmo Regresión Logística de Machine Learning y

Robotic Process Automation. Evaluar el impacto económico de la solución en la mejora de la eficiencia del proceso Captación de clientes.

1.5

JUSTIFICACIÓN

El presente proyecto es importante porque permite que el proceso Captación de Clientes, de la empresa Gurú Soluciones, sea más eficiente solucionando dos problemas causa principales identificadas: demora en la entrega de la base de clientes potenciales al Equipo Comercial y deficiente identificación de malos pagadores. Ambos problemas impactan a la rentabilidad de la empresa. La primera genera retraso en la ejecución de las campañas de venta del Equipo Comercial ocasionando una baja cantidad de ventas. La segunda genera incremento de la cartera morosa que impacta reduciendo la liquidez de la empresa. La solución tecnológica propuesta en el presente trabajo de investigación brinda los siguientes beneficios: 

Reducción del 100% del costo por servicio laboral asociado a la ejecución del proceso: Permitirá que el rol responsable de la ejecución del proceso se dedique a

tareas creativas, innovadoras y estratégicas en beneficio de la empresa. Reducción del 80% del costo por servicio externo de cobranza: Identificando eficientemente a los malos pagadores se evitará venderles productos que luego no puedan pagar. Teniendo una reducida cartera morosa el costo del servicio externo

de cobranza se reduce significativamente. Incremento de porcentaje de venta efectiva líquida a un 80%: Actualmente, de las ventas realizadas, llegado el fin de mes, solo el 40% cumple con sus pagos. La solución busca incrementar este porcentaje a un 80%. Ello será posible ejecutándose el proceso captación de clientes de forma diaria y filtrando eficientemente a los malos pagadores.

Por otro lado, consideramos que la solución propuesta puede servir de guía para implementarse en otras empresas con similar situación problemática a fin de brindar a sus procesos un enfoque de hiperautomatización, automatizando tareas repetitivas con RPA

6


que permitan a los colaboradores dedicarse a tareas creativas e innovadoras y, dando pase a la tecnología para tomar decisiones con Machine Learning. 1.6

LIMITACIONES

Las limitaciones definidas para la presente investigación son las siguientes:   

El estudio se realiza solo en la empresa Gurú Soluciones. El estudio involucra las siguientes áreas: Marketing, Comercial y Contabilidad. El estudio tiene un alcance hasta la etapa Diseño de la Solución; es decir, no se

aborda etapas posteriores como Desarrollo, Pruebas y Despliegue. El estudio no garantiza la efectividad de la solución al replicarse en otra empresa. Muy posiblemente requiera realizarse cambios según el contexto.

2

CAPÍTULO II: ESTADO DEL ARTE

En este capítulo se presenta la metodología a usar para el desarrollo del Estado de Arte. La metodología está compuesta por 3 fases y son desarrolladas a detalle a lo largo del capítulo. Por último, se realiza un análisis de los papers seleccionados para la presente investigación a fin de responder las preguntas planteadas en la fase de Planificación. 2.1

METODOLOGÍA

La metodología abordada para el desarrollo del presente Estado del Arte está comprendida por 3 fases. En la primera fase se planifica el Estado del Arte, en la segunda fase se ejecuta esta planificación, y en la última fase se presentan los resultados obtenidos (Guevara, 2016). El desarrollo del Estado de Arte de la presente investigación es abordado de la siguiente manera: 

Planificación: Se definen las preguntas de investigación, palabras clave, periodos de búsqueda y criterios de selección. Seguidamente se estructura las cadenas de

búsqueda y se identifican los metabuscadores a emplear en la búsqueda de papers. Desarrollo: Se ejecuta la Planificación elaborada en la fase anterior. Se filtra,

revisa y selecciona los papers considerados finalmente en la investigación. Resultados: Se presenta las estadísticas de los papers seleccionados.

7


2.2

PLANIFICACIÓN

La Planificación del Estado de Arte se elaboró siguiendo las siguientes actividades: En primer lugar, se definieron 5 preguntas de investigación según el aporte y técnica propuesta en la presente investigación. En la Figura 6 se muestra las preguntas de investigación definidas.

Figura 6. Preguntas de investigación. Elaboración propia. En segundo lugar, se seleccionaron los siguientes metabuscadores para realizar la búsqueda de información:  

ScienceDirect Scopus

En tercer lugar, se definieron las siguientes palabas claves según la presente investigación:         

Credit risk Credit scoring Default loan Default payments Nonperforming loan Machine learning Logistic regression Robotic Process Automation RPA industry

A continuación, se construyeron las cadenas de búsqueda en base a las palabras clave definidas, periodos de búsqueda y criterios de selección; los dos últimos definidos en la cuarta y quinta actividad, respectivamente. En la Tabla 2 se muestran las cadenas de búsqueda construidas para cada metabuscador seleccionado.

8


Tabla 2. Cadenas de búsqueda Metabuscador Cadena de búsqueda ScienceDirect TEMA: (credit scoring) AND IDIOMA: ("English" OR "Spanish") AND TIPO-ACCESO: ("Open Access") AND AÑO-PUBLICACIÓN: (2021 OR 2020 OR 2019)

Scopus

TEMA: (robotic process automation) AND IDIOMA: ("English" OR "Spanish") AND TIPO-ACCESO: ("Open Access") AND AÑO-PUBLICACIÓN: (2021 OR 2020 OR 2019) TITLE-ABS-KEY(credit scoring) AND (LIMIT-TO (OA,"all")) AND (LIMIT-TO(PUBSTAGE,"final")) AND (LIMIT-TO(DOCTYPE,"ar")) AND (LIMITTO(PUBYEAR,2021) OR LIMIT-TO(PUBYEAR,2020) OR LIMIT-TO(PUBYEAR,2019)) AND (LIMITTO(LANGUAGE,"English") OR LIMITTO(LANGUAGE,"Spanish")) TITLE-ABS-KEY(robotic process automation) AND (LIMIT-TO(OA,"all")) AND (LIMITTO(PUBSTAGE,"final")) AND (LIMITTO(DOCTYPE,"ar")) AND (LIMITTO(PUBYEAR,2021) OR LIMIT-TO(PUBYEAR,2020) OR LIMIT-TO(PUBYEAR,2019)) AND (LIMITTO(LANGUAGE,"English") OR LIMITTO(LANGUAGE,"Spanish"))

Elaboración propia. En cuarto lugar, se definieron los periodos de búsqueda de información. Se consideró los 3 últimos años: 2019, 2020 y 2021. Por último, se definieron criterios de selección para filtrar los papers. En la Tabla 3 se muestra los criterios de inclusión y exclusión definidos. Tabla 3. Criterios de selección Criterios de inclusión Criterios de exclusión Tipo de acceso: Open Access. Antigüedad: Mayor a 3 años. Antigüedad: Hasta 3 años. Idiomas: Diferente a inglés y español. Idiomas: Inglés y español. Tipo de fuentes: Revistas y Diarios. Tipo de fuentes: Artículos. Áreas de investigación: Matemáticas, Estado de la publicación: Finalizado. Ciencias Sociales. Áreas de investigación: Economía, Finanzas, Negocios, Ingeniería. Nota: Criterios de inclusión y exclusión aplicados en los metabuscadores. Elaboración propia.

9


2.3

DESARROLLO

El desarrollo de la Planificación inició con la búsqueda de los papers a analizar para responder las preguntas de investigación definidas en el paso anterior. La búsqueda fue realizada en los metabuscadores seleccionados haciendo uso de las cadenas de búsqueda (las cuales consideraron las palabras claves definidas, periodos de búsqueda, y los criterios de inclusión y exclusión) definidas en la Tabla 2. En este primer filtro se obtuvo 349 papers. Seguidamente, se procedió a revisar los abstract para validar su nivel de referencia con la presente investigación. En este segundo filtro quedaron 50 papers. Por último, se revisó la introducción y conclusiones de este último grupo de papers para seleccionar finalmente los 10 mejores papers según su aporte a la investigación.

Figura 7. Proceso Selección de Papers. Elaboración propia. Según Figura 7, se observa que el filtro “Revisión de Abstracts” reduce la cantidad de papers inicialmente obtenida hasta un poco más del 85% (reduce de 349 papers a 50 papers). 2.4

RESULTADOS

Luego de realizar las consultas en los metabuscadores con las cadenas de búsquedas definidas se obtuvo 319 resultados en Scopus y 30 resultados en ScienceDirect. Los resultados fueron clasificados por año de publicación. A continuación, se presenta la tabla resultante. Tabla 4. Cantidad de papers encontrados por metabuscador y año de publicación Metabuscador 2019 2020 2021 Total ScienceDirect 4 23 3 30 Scopus 134 153 32 319 Total 138 176 35 349 Elaboración propia.

10


Posteriormente, los papers fueron filtrados según la alineación de sus Abstract, Introducción y Conclusiones con la presente investigación. Se seleccionó los 10 mejores papers. Los resultados fueron clasificados por año de publicación. A continuación, se presenta la tabla resultante.

Tabla 5. Cantidad de papers seleccionados por metabuscador y año de publicación Metabuscador 2019 2020 2021 Total ScienceDirect 2 0 0 2 Scopus 6 2 0 8 Total 8 2 0 10 Elaboración propia. Según la Figura 8, se observa la cantidad de papers seleccionados por los países dónde se llevaron a cabo las investigaciones. A excepción de República Checa, el resto de los países es representado por un solo paper. Asimismo, según la Tabla 5, el 80% de papers seleccionados corresponde al año 2019 y el 20% de los papers corresponde al año 2020.

Figura 8. Cantidad de papers por país de investigación. Elaboración propia. Por último, para el posterior análisis de la presente investigación, en la siguiente tabla se muestra los 10 papers seleccionados y las preguntas a las que responde cada una de ellas. Tabla 6. Lista de papers seleccionados N Título Título (español) ° 1 Research and Investigación y

Autores

Año

Kanakov, F.,

2020

Prg . P5 11


2

development of software robots for automating business processes of a commercial bank. Real-time decisionsupport system for high-mix low-volume production scheduling in industry 4.0.

3

Credit scoring to classify consumer loan using machine learning.

4

Scoring in microfinance credit risk management tool Case of Morocco.

5

Applying robotic process automation (RPA) in auditing: A framework.

6

Credit risk assessment model for small and micro-enterprises: The case of Lithuania.

7

A dynamic credit risk assessment model with data mining techniques: evidence from Iranian banks.

8

Two-stage consumer credit risk modelling using heterogeneous ensemble learning.

9

Robotic Process Automation and Artificial Intelligence

desarrollo de robots software para la automatización de procesos de un banco comercial. Sistema de apoyo a la toma de decisiones en tiempo real para la programación de producción de gran volumen y bajo volumen en la industria 4.0. Score crediticio para clasificar a los consumidores utilizando machine learning. Scoring en microfinanzas: herramienta de gestión del riesgo de crédito -Caso de Marruecos. Aplicando automatización de procesos robóticos (RPA) en auditoría: un marco de trabajo. Modelo de evaluación del riesgo crediticio para pequeñas y microempresas: el caso de Lituania. Un modelo dinámico de evaluación del riesgo crediticio con técnicas de extracción de datos: evidencia de bancos iraníes. Modelado del riesgo crediticio del consumidor en dos etapas utilizando el aprendizaje por conjuntos heterogéneos. Automatización robótica de procesos e inteligencia artificial en

Prokhorov, I.

Kocsi, B., Matonya, M., Pusztai, L., Budai, I.

2020

P4 P5

Azaria, N., Dedy, P., Suhartono

2019

P3

Bennouna, G., Tkiouat, M.

2019

P1 P2 P3

Huang, F., Vasarhelvy, M.

2019

P4 P5

Kanapickiene , R., Spicas, R.

2019

P1 P3

Moradi, S., Mokhatab Rafiei, F.

2019

P1 P2

Papouskova, M., Hajek, P.

2019

P1

Ribeiro, J., Lima, R., Eckhardt, T.,

2019

P4

12


in Industry 4.0 – A Literature review. 10 How Robot/human Orchestration Can Help in an HR Department: A Case Study From a Pilot Implementation.

la industria 4.0: revisión de la literatura. Cómo la orquestación robot / humana puede ayudar en un departamento de recursos humanos: un estudio de caso de una implementación piloto.

Paiva, S. Šimek, D., Šperka, R.

2019

P5

Elaboración propia. 2.5 2.5.1

ANÁLISIS Q1: ¿Qué modelos predictivos de morosidad se han desarrollado en otras organizaciones?

Bennouna y Tkiouat (2019), construyeron un modelo predictivo de morosidad utilizando técnicas de Regresión Logística y Análisis Discriminatorio Multivariable. El modelo combina datos descriptivos de comportamiento de los prestatarios (edad, actividad, nivel de educación, estado civil, etc.), y datos relacionados con la entidad financiera (monto de crédito, duración del crédito, número de préstamos concluidos por gestor de cartera, etc.). Basándose en el análisis de una base de 1500 clientes, el modelo realiza una puntuación final de los clientes antiguos según análisis financiero discriminatorio de sus respectivas conductas descriptivas y de comportamiento. Lo anteriormente indicado facilita la predicción de morosidad de las personas que no tienen ningún historial crediticio. Los resultados del modelo utilizando Regresión Logística fueron satisfactorios y ajustados a los comportamientos crediticios reales obteniéndose, a través de la curva ROC, una precisión de 0.148 en las pruebas y una precisión de 0.226 en el aprendizaje.

Moradi y Mokhatab (2019), propusieron un nuevo modelo predictivo de morosidad crediticia adaptable a factores inciertos cambiantes, por ejemplo, asociados con crisis político-económicas; y factores más estables utilizados en modelos estáticos.

13


Figura 9. Modelo conceptual de modelo predictivo propuesto. Adaptado de “Conceptual model of the dynamic model”, por Moradi y Mokhatab, 2019. Según Figura 9, los autores describen el modelo conceptual de su modelo predictivo propuesto. En primer lugar, se consolida mensualmente en una tabla los datos de los clientes morosos (aquellos con atraso de más de 2 meses). En segundo lugar, se agrupan los clientes con características similares aplicando Fuzzy c-means (FCM, por sus siglas en inglés). En este paso se conoce los patrones de comportamiento del conjunto de datos. En tercer lugar, se entrena un Sistema de Inferencia Difusa basado en Red Adaptable (ANFIS, por sus siglas en inglés) y se construye un modelo dinámico basado en los datos de esta tabla. Este modelo se utiliza luego para evaluar el riesgo crediticio de los clientes en el momento del registro. Solo si se evalúa que el cliente está libre de riesgos según los modelos estáticos del conjunto de datos que contiene la información de todos los clientes, se le da crédito al cliente. De lo contrario, si se determina que el cliente es demasiado arriesgado, no se le da crédito. Por último, y alternativamente, si el cliente pertenece al segmento de riesgo medio en el análisis que utiliza el modelo dinámico, comienza una segunda ronda de evaluación utilizando un Sistema de Inferencia Difusa (FIS, por sus siglas en inglés) basado en las reglas predefinidas. La base de reglas es creada usando un conjunto de factores existentes, factores inciertos (es decir, propensos a cambiar en el tiempo) y factores desatendidos que podrían afectar el comportamiento de pago de los

14


clientes. Asimismo, la base de reglas puede ser gestionada a medida según la coyuntura del momento. El sistema clasifica a los clientes en tres grupos de riesgo: bajo, medio y alto. El análisis finaliza si aún se demuestra que el cliente es demasiado arriesgado. Sin embargo, si se demuestra que el cliente pertenece al grupo de riesgo medio, se puede asignar crédito condicional; si se clasifica en el grupo de bajo riesgo según la segunda ronda de análisis, el cliente recibe crédito y el análisis finaliza.

Kanapickiene, R. y Spicas, R. (2019), propusieron un nuevo modelo estadístico de evaluación del riesgo crediticio del comercio empresarial (ECTRA) para las pequeñas y microempresas (PYME) en Lituania. El modelo se desarrolló teniendo presente las características de precisión, sencillez y alta interpretabilidad de resultados. El resultado del modelo probabilístico fue determinar la probabilidad de incumplimiento de pago; es decir, la probabilidad de que el deudor se declare insolvente dentro de un período de tiempo específico. Se usó una muestra de 734 datos correspondiente a empresas comerciales usando dos tipos de variables, variables no financieras y financieras (por ejemplo, número de pagos válidos y el tiempo promedio de demora en las deudas atrasadas). En la muestra hubo 309 morosos y 425 buenos deudores. Durante el período 2010 - 2012 las empresas morosas se declararon en quiebra o iniciaron procesos de quiebra, o tenían deudas importantes. Se usó estas condiciones como definición de deudor incobrable. Las empresas catalogadas como buenos deudores fueron aquellas que no quebraron o iniciaron procesos de quiebra y no tuvieron deudas significativas durante el período 2010 - 2012, y durante el período de control (2015 – 2016) continuaron sus actividades y no tuvieron indicios de fallas en la actividad. El modelo se desarrolló utilizando el algoritmo Regresión Logística. El resultado obtenido fue satisfactorio lográndose cumplir las características inicialmente especificadas. Papouskova, M. y Hajek, P. (2019), plantean que, para modelar el riesgo crediticio del consumidor, proceso complejo para los bancos y las instituciones no bancarias, se determinan los préstamos de consumo en términos de pérdida esperada (EL). Se toma en cuenta el parámetro PD (probabilidad de incumplimiento), el parámetro EAD (exposición al incumplimiento), el parámetro LGD (pérdida en caso de incumplimiento) y la fórmula PD x EAD x LGD. Los autores indican que, las investigaciones sobre riesgo crediticio tienden a modelar estos parámetros de forma independiente generando resultados 15


deficientes. En contraste a ello, proponen un modelo integrado de riesgo crediticio basado en dos etapas usando machine learning que tome en cuenta estos tres parámetros en la evaluación. En la primera etapa, el modelo de predicción de la PD utiliza conjuntos de clasificación para distinguir entre préstamos con mora (EL > 0) y préstamos sin mora (EL = 0). Por otro lado, en la segunda etapa, los modelos de predicción PD y EAD se unen y apoyan del LGD para predecir las pérdidas.

Figura 10. Modelo conceptual para la modelización del riesgo de crédito. Adaptado de “Conceptual framework for credit risk modelling”, por Papouskova y Hajek, 2019. Según Figura 10, se observa las dos etapas del modelo. En la etapa uno se predice el PD para identificar los préstamos con mora y los préstamos sin mora, y en la etapa dos se realiza la predicción del EAD para obtener el cálculo del EL.

Tabla 7. Modelos predictivos de morosidad Modelo predictivo Descripción Modelo predictivo de Modelo desarrollado empleando 2 fuentes de morosidad crediticia datos. La primera referida a la información utilizando Regresión descriptiva del cliente, y la segunda referida Logística y Análisis al comportamiento histórico con la entidad Discriminatorio financiera. Multivariable. Modelo estadístico Modelo predictivo de incumplimiento de de evaluación de pago usado en otorgamiento de crédito riesgo crediticio para comercial para pequeñas y microempresas.

Referencia Bennouna y Tkiouat (2019).

Kanapickiene y Spicas (2019).

16


pequeñas y microempresas (PYME). Modelo predictivo de morosidad crediticia adaptable a factores inciertos cambiantes.

Modelo preciso, interpretabilidad.

simple

y

de

alta

Modelo preciso, flexible y dinámico para la predicción de morosidad crediticia capaz de adaptarse a factores inciertos en constante cambio como, por ejemplo, los generados después de las sanciones internacionales políticas y económicas. Modelo predictivo de Modelo basado en evaluación de la riesgo crediticio del probabilidad de incumplimiento, exposición consumidor basado al incumplimiento y pérdida en caso de en dos etapas. incumplimiento, con el propósito de predecir el riesgo crediticio del consumidor. Elaboración propia.

2.5.2

Moradi y Mokhatab (2019).

Papouskova y Hajek (2019).

¿Qué tecnologías se pueden usar para construir modelos predictivos de morosidad?

Bennouna y Tkiouat (2019), utilizaron el software SPSS (Stadistical Package for Social Science) para desarrollar su modelo que usa dos fuentes de datos. La primera, relacionada con la información descriptiva del cliente, y la segunda, referida con el perfil del comportamiento histórico de pago de este con la entidad financiera.

Moradi y Mokhatab (2019), emplearon el software MATLAB R2015b para el procesamiento de datos y construcción del Sistema de Inferencia Difusa (FIS) y del Sistema de Inferencia Difusa basado en Red Adaptable (ANFIS) de su modelo propuesto. Asimismo, sugirieron el empleo de Java y Oracle para un desarrollo a mayor escala.

Tabla 8. Tecnologías usadas en la construcción modelos predictivos de morosidad Tecnología Descripción Referencia SPSS Stadistical Package for Social Science, Bennouna y utilizado para desarrollar el modelo Tkiouat (2019). predictivo de morosidad crediticia propuesto. MATLAB Software usado para el procesamiento de Moradi y R2015b datos y construcción del Sistema de Mokhatab Inferencia Difusa (FIS) y del Sistema de (2019). Inferencia Difusa basado en Red Adaptable (ANFIS). 17


Elaboración propia.

2.5.3

Q3: ¿Cuál es el mejor algoritmo para predecir la morosidad?

Azaria, Dedy y Suhartono (2019), propusieron un diagrama de investigación para evaluar la precisión de clasificación de los siguientes 5 algoritmos: 

Dos algoritmos de técnica paramétrica más usados en las últimas décadas: Análisis

Discriminante (DA) y Regresión Logística Binaria (BLR). Dos algoritmos de aprendizaje automáticos no paramétrico más populares en las últimas dos décadas: Red Neuronal Artificial (ANN) y Support Vector Machine

(SVM). Un algoritmo de aprendizaje profundo estudiada ampliamente para la clasificación crediticia: Deep Neural Network (DNN).

La evaluación se realizó con variables continuos y categóricos pertenecientes a un banco comercial en Indonesia (Banco X).

Figura 11. Diagrama de flujo de comparativa para clasificar el crédito del consumidor. Adaptado de “The Flow Chart of Classification Method”, por Azaria, Dedy y Suhartono, 2019

18


En la Figura 11 se observa el diagrama de flujo para la comparativa entre los algoritmos de clasificación. Se evaluó la performance de cada algoritmo según su AUC. A continuación, se presenta los resultados: Aunque el Análisis Discriminante y la Regresión Logística Binaria dieron buenos resultados en el valor AUC (0.709 y 0.669, respectivamente) ninguna predicción del Análisis Discriminante se cumplió. En el caso de Regresión Logística Binaria solo unos cuantos parámetros en la prueba fueron de valor significativo. Por otra parte, Support Vertor Machine (SVM, por sus siglas en inglés) no dio un valor AUC significativo, 0.504, porque el uso del parámetro de ajuste no mejoró dicho valor. Sin embargo, la Red Neuronal Artificial dio un valor AUC más alto que SVM con un 0.611. Se hace mención que, solo dio ese valor con un numero de neuronas de 3, ya que, si se le aumentaba 2 más, daba un peor resultado. Por último, Deep Neural Network tuvo un valor AUC de 0.638. Se probó 4 diferentes tipos de modelos. El último modelo probado que utiliza la función de activación Tanh, con dos capas ocultas y con una disminución de neuronas de 10 a 3, la consideró como buen clasificador de deudor de crédito. Según los autores, este fue el mejor algoritmo en su investigación.

Bennouna y Tkiouat (2019), propusieron un modelo predictivo de morosidad crediticia aplicado a personas que no cuentan con historial crediticio. El modelo se desarrolló usando el algoritmo Regresión Logística porque este demostró ser eficiente para predecir clases binarias cuyo resultado se enfoca en valores dicotómicos. Asimismo, el modelo se apoya en el índice GINI y el coeficiente K-S basado en la función de distribución de probabilidades acumuladas. El índice GINI, como indicador económico, mide el nivel de desigualdad de los ingresos que existe entre los clientes que recibieron los microcréditos, donde X es la proporción acumulada de la población e Y es la proporción acumulada de ingresos según la siguiente fórmula.

19


El modelo demostró ser significativamente superior a otros modelos al obtenerse un índice GINI igual a 0.7 para la muestra de entrenamiento y 0.55 para la muestra de prueba.

Kanapickiene, R. y Spicas, R. (2019), usaron Regresión Logística en el desarrollo de su modelo para predecir la probabilidad que un deudor muestre comportamiento de pago indeseable en el futuro. La principal razón para usar el algoritmo sobre otros es porque consideraron que este proporciona un equilibrio adecuado de precisión, eficiencia e interpretabilidad de los resultados. En el desarrollo del modelo se usó una muestra correspondiente a 734 empresas, de las cuales había 309 morosos y 425 buenos deudores. Durante el período 2010 y 2012 estas empresas se declararon en quiebra o iniciaron procesos de quiebra, o tenían deudas importantes. Se usó estas condiciones como definición de deudor incobrable. Las empresas catalogadas como buenos deudores fueron aquellas que no quebraron o iniciaron procesos de quiebra y no tuvieron deudas significativas durante el período considerado entre 2010 y 2012, y durante el período de control (2015 – 2016) continuaron sus actividades y no tuvieron indicios de fallas en la actividad.

Figura 12. Descripción curva ROC. Adaptado de "Receiver operating characteristic (ROC) curve: (a) for SE models; (b) for MiE models”, por Kanapickiene y Spicas, (2019). Tabla 9. Detalle del área bajo la curva

20


Nota: Resultados del poder predictivo del modelo desarrollado. Adaptado de “Area under the curve (for SE and MiS models)”, por Kanapickiene y Spicas, (2019). Según Figura 12 y Tabla 9, los autores validan la precisión obtenida por el modelo desarrollado evidenciando una mejor clasificación con el algoritmo Regresión Logística. Concluyen demostrando la efectividad y precisión del modelo a ser usado en el otorgamiento de créditos comerciales a pequeñas y microempresas.

Según las investigaciones realizadas, se observa que el algoritmo Regresión Logística y Deep Neural Network son buenos algoritmos para predecir la morosidad crediticia. Sin embargo, el segundo algoritmo solo tiene buenos resultados cuando se requiere estimar muchos parámetros en una gran cantidad de datos. No es bueno si el objetivo es predecir muchos parámetros con pocos datos. Obtendría resultados defectuosos. Por otro lado, Regresión Logística es un algoritmo eficiente, sencillo y altamente interpretable al realizar predicciones de tipo ¿Es A o es B? o ¿Es buen o mal pagador? Por lo anteriormente expuesto, para la presente investigación se descarta el uso del algoritmo Deep Neural Network porque no se adapta al caso de estudio al no disponerse de mucha variedad de datos para el desarrollo del modelo predictivo de morosidad. Por tanto, el algoritmo seleccionado es Regresión Logística.

Tabla 10. Mejores algoritmos para predecir la morosidad Mejor algoritmo Resultado Condiciones Deep Neural Valor AUC para Datos proporcionados por el Network. entrenamiento: Banco X de Indonesia. Se 0.6427 usó una muestra de 988 Valor AUC para préstamos personales (792

Referencia Azaria, Dedy y Suhartono (2019). 21


pruebas: 0.638 Regresión Logística.

Índice GINI para entrenamiento: 0.7 Índice GINI para pruebas: 0.55

Regresión Logística.

Accuracy: +80% Precision: +80% Recall: +80% F-measure: +80%

préstamos buenos y 196 préstamos incobrables). Extraído de la fase de validación de una muestra de 1500 prestatarios.

Datos proporcionados por empresa Creditinfo Lietuva durante el periodo 2010 -2012. Se usó una muestra de 734 pequeñas y microempresas empresas utilizando variables financieras y no financieras.

Bennouna y Tkiouat (2019).

Kanapickie y Spicas (2019).

Elaboración propia.

2.5.4

¿Qué tecnologías se pueden usar para construir soluciones RPA?

Kocsi, Matonya, Pusztai y Budai (2020), presentan un caso y solución respectiva basada en RPA y machine learning con el objetivo de implementar un sistema de soporte de decisiones de programación de producción en tiempo real, avanzado y eficaz. Los autores refieren que, la empresa citada en la investigación optó implementar la solución con RPA Blue Prism, porque este ofrece una buena estabilidad, fácil adaptabilidad con otras tecnologías y simplicidad para solucionar errores. La solución permite ahorrar tiempo y reducir errores humanos.

Huang y Vasarhelvy (2019), propusieron un marco de trabajo para la implementación de una solución Robotic Process Automation (RPA). El marco de trabajo fue caracterizado mediante el desarrollo de un proyecto piloto referido al área de auditoria. La solución RPA fue desarrollado con el software UiPath. Los autores refieren UiPath como un software popular de RPA que proporciona licencias gratuitas a desarrolladores individuales, equipos profesionales pequeños y entidades educativas.

Ribeiro, Lima, Eckhardt y Paiva (2019), presentan diferentes tecnologías RPA. En primer lugar, refieren UiPath e indican su estructura conformada por tres módulos: UiPath Studio,

22


UiPath Robot y UiPath Orchestrator. Explican cada uno de ellos y brindan información de compatibilidad con otras herramientas como SQL Server de Microsoft, Kibana, Elastic Search, entre otros. En segundo lugar, refieren Kofax capaz de permitir ejecución de flujos de procedimiento entre aplicaciones para optimizar actividades de sistemas ERP, clasificación de documentos OCR y análisis de contenido de correos electrónicos y páginas web. En tercer lugar, refieren WinAutomation para la automatización de correos electrónicos y archivos en varios formatos como por ejemplo PDF, Excel, OCR y otras características asociadas con el entorno de trabajo como scriptings, visión informática, sincronización avanzada, auditoría, entre otros. Su módulo Cognitive integra funcionalidades con motores de análisis de información analítica de Microsoft, IBM y Cognitive Google. Por último, los autores concluyen que, la mayoría de las herramientas implementan algoritmos asociados con los objetivos de Inteligencia Artificial y, el reconocimiento, optimización, clasificación y extracción de conocimientos de documentos en los procesos de RPA. La combinación de todos estos conceptos y tecnologías trae consigo un cambio en los procesos de las empresas, no solo de tecnologías, sino también de los procesos digitales y no digitales de las empresas que apuestas por la industria 4.0.

Tabla 11. Tecnologías usadas en la construcción de soluciones RPA Tecnología Descripción Referencia Software RPA que ofrece buena Kocsi, Matonya, estabilidad, fácil adaptabilidad con otras Blue Prism Pusztai y Budai tecnologías y simplicidad para (2020). solucionar errores. Software popular de RPA que proporciona licencias gratuitas a Huang y UiPath desarrolladores individuales, equipos Vasarhelvy profesionales pequeños y entidades (2019). educativas. Software RPA de Microsoft. Su módulo Cognitive integra funcionalidades con Ribeiro, Lima, WinAutomation motores de análisis de información Eckhardt y analítica de Microsoft, IBM y Cognitive Paiva (2019). Google. Ribeiro, Lima, Plataforma RPA con integración IA para Kofax Eckhardt y tecnologías empresariales. Paiva (2019). Automation Software RPA parte de IBM Ribeiro, Lima, Anywhere Automation Platform for Digital Eckhardt y Business. Permite orquestar flujos de Paiva (2019).

23


trabajos. Elaboración propia. 2.5.5

¿Qué soluciones RPA se han desarrollado en otras organizaciones?

Kanakov y Prokhorov (2020), proponen una solución RPA para el proceso adquisición de servicios financieros de calidad del sector bancario. La solución busca ahorrar tiempo y dinero, y cumplir con los niveles de servicio (SLA) ofreciendo un servicio 24 x 7, control flexible de la productividad operativa, cero errores y rapidez en la ejecución de tareas. El resultado obtenido fue satisfactorio al cumplir las expectativas iniciales y lograr una reducción del 40% - 80% en costos directos propios de la ejecución del proceso.

Kocsi, Matonya, Pusztai y Budai (2020), presentan un caso y solución respectiva basada en RPA y machine learning con el objetivo de implementar un sistema de soporte de decisiones de programación de producción en tiempo real, avanzado y eficaz. El modelo que se desarrolló para la automatización con RPA consta de 4 partes: 1. Optimización por MB-GA (corazón del sistema): método de programación con enfoque de filtro de múltiples capas considerando carga de trabajo y relaciones de costo de trabajo del sistema. Flexible y fácil de operar por la industria 4.0. 2. Análisis de riesgo: uso de técnica de decisión en tiempo real combinada con el modo de falla (FMEA) basado en tiempo, costo y análisis de defectos controlados por RPA. 3. Simulación del programa de producción óptimo: permite visualizar posibles resultados. 4. Monitoreo del proceso de producción. Según Figura 13, el modelo recibe los datos de entrada del sistema ERP, RPA verifica el estado de los recursos (es decir, si hay suficientes materiales, máquinas y operadores) y, si toda la información está disponible, el motor de optimización inicia la búsqueda de la mejor solución a aplicar.

24


Figura 13. Modelo de programación híbrido para automatización de procesos robóticos (RPA). Adaptado de “Hybrind Scheduling Model”, por Kocsi, Matonya, Pusztai y Budai, 2020.

25


Según Figura 14, se observa el subproceso de optimización del algoritmo MB-GA.

Figura 14. Subproceso de optimización MB – GA. Adaptado de “Developed Subprocess”, por Kocsi, Matonya, Pusztai y Budai, 2020. Finalmente, los autores concluyen que el modelo proporciona mejor rendimiento total mínimo global y, ofrece una reducción predominante y significativa del tiempo de reprogramación en más del 50% y un aumento en la precisión superior al 90%.

Huang y Vasarhelvy (2019), propusieron un marco de trabajo para aplicar Robotic Process Automation (RPA) en el área de auditoria. Los autores indicaron que este sector se encontraba rezagado por factores regulatorios en contraste con el avance en los sectores banca, telecomunicaciones y, hasta, contabilidad. Según Figura 15, el marco propuesto está conformado por 4 etapas: selección de procedimientos; modificación del procedimiento; aplicación y; evaluación y operación. Para la primera etapa, presentan 3 factores a evaluar para seleccionar los procedimientos: criterios RPA (los procedimientos deben ser bien 26


definidos, altamente repetitivos y maduros); compatibilidad de datos (preferentemente, los datos que interactúan en el procedimiento deben ser estructurados y digitales); complejidad del procedimiento (para proyectos piloto recomiendan seleccionar procedimientos de baja complejidad). Para la segunda etapa, evalúan modificar el procedimiento seleccionado a fin de que este se adapte a una posible solución mediante un software RPA. Para la tercera etapa, refieren que el aprendizaje de estas herramientas es sencillo, y recomiendan realizar una implementación interna a fin de tener un alto nivel de control de la solución y mejor protección de la información confidencial. Para la cuarta y última etapa, consideran evaluar y monitorear la solución a fin de garantizar los resultados esperados. Las etapas 1, 2 y 3 serán repetidas mientras el resultado sea adverso.

Figura 15. Marco de trabajo para la implementación de una solución RPA. Adaptado de “The framework”, por Huang y Vasarhelvy, 2019. Los autores caracterizaron cada una de las etapas del marco propuesto anteriormente mediante el desarrollo de un proyecto piloto a fin de demostrar la viabilidad en la práctica de una solución RPA en el área de auditoria. Dentro del proceso de auditoria de estados financieros preseleccionaron 2 procedimientos (confirmación y prueba de corte de inventario) que cumplían con el factor 1 de la etapa 1 del marco de trabajo; sin embargo, al ser evaluado por el factor 2 solo quedó el procedimiento de confirmación. El otro procedimiento fue excluido porque los datos con los que interactúa son imposibles de utilizarse por un software RPA debido a que su fuente de origen es el papel y digitalizarlo conllevaría un costo extra que impactaría en la rentabilidad de la solución. El procedimiento seleccionado fue especificado como baja complejidad según evaluación del factor 3 de la etapa 1. En etapa 2 se redefinió el procedimiento a fin de que el software RPA tenga una lectura más fácil de los datos. Principalmente se cambió el tipo de archivo del formulario de solicitud (un Word por un Excel) y se desagregó el nombre completo en apellido paterno, apellido materno y nombres. En la etapa 3, la solución fue implementada

27


internamente con UiPath. Por último, luego de concluir las etapas 4 y 5, los autores observaron una reducción de tiempo del 90% (de 30 minutos a 3 minutos) en la ejecución del procedimiento.

Šimek y Šperka (2019), presentaron un proyecto piloto de implementación RPA que involucra a una empresa especializada en brindar servicios de ciencia de datos y RPA, y a otra empresa cliente cuyo negocio consiste en proporcionar procesos y servicios comerciales. La solución RPA se implementa en el proceso incorporación de personal correspondiente al área de recursos humanos. El proceso inicia con la solicitud del postulante. Luego de aprobarse la solicitud, este se asigna a un reclutador para la realización de las entrevistas. Si las entrevistas son exitosas se ofrece la oferta de trabajo y se selecciona al candidato. A continuación, el candidato procede a ingresar sus datos personales en el portal de la empresa. Los mismos datos también son ingresados en un sistema exclusivo de recursos humanos para validarlos en una fuente externa. La verificación es en términos de involucramiento en terrorismo, delitos financieros, etc. RPA se aplica sobre los siguientes pasos: descarga de información del candidato del portal de la empresa, ingreso de datos del postulante en el sistema de recursos humanos y verificación de datos en el sistema externo. En el desarrollo de la solución se usa UiPath y Blue Prism. Los autores demuestran que la solución reduce el tiempo de ingreso de datos en el sistema de recursos humanos de 15 minutos a 3 minutos sin ninguna intervención humana y reduce el tiempo de verificación de 5 minutos a 1 minuto. A nivel global observan un ahorro de tiempo de 10 horas por mes.

28


Figura 16. Modelo del proceso automatizado con RPA. Adaptado de “To-be process model designed in Enate”, por Šimek y Šperka, 2019. Según Figura 16, se observa el uso de RPA en la revisión y extracción de datos y, en la inserción de estos en otras fuentes de datos.

Tabla 12. Soluciones RPA Solución RPA Descripción Solución RPA en el Los autores proponen una solución RPA sector bancario. para el proceso adquisición de servicios financieros de calidad del sector bancario logrando reducir un 40% - 80% los costos directos propios de la ejecución del proceso. Solución RPA para Los autores desarrollan un modelo de implementar un sistema de soporte de decisiones de sistema de apoyo de programación de producción en tiempo decisiones en tiempo real, avanzado y eficaz. El modelo ofrece real. una reducción del tiempo de reprogramación de más del 50% y una precisión superior al 90%. Solución RPA en el Los autores proponen un marco de área de auditoría. trabajo para implementar una solución RPA. El marco de trabajo es caracterizado con el desarrollo de un proyecto piloto referido a un procedimiento de auditoria. La solución logra reducir un 90% del tiempo de ejecución (de 30 minutos a 3 minutos). Solución RPA en el Los autores desarrollan un proyecto área de recursos piloto RPA en el proceso incorporación humanos. de personal del área de recursos humanos

Referencia Kanakov y Prokhorov (2020).

Kocsi, Matonya, Pusztai y Budai (2020).

Huang y Vasarhelvy (2019).

Šimek y Šperka (2019).

29


de una empresa. La solución logra un ahorro de tiempo de 10 horas por mes. Elaboración propia.

3

CAPÍTULO III: MARCO TEÓRICO

3.1

CAPTACIÓN DE CLIENTES B2B

3.1.1

Definición

Captación de clientes es un proceso complejo en el sentido de estar en el entorno B2B. Debido a que, dentro de las organizaciones, se toman decisiones de compra desde un grupo selecto llamado “Unidad de Toma de Decisiones”, los cuales basan su criterio en presupuesto y costo. Por lo general, el proceso se define en las siguientes etapas. Según Meire y Ballings (2017), el modelo de captación de clientes B2B se aplica de una forma iterativa en un estudio a gran escala, donde se evalúa la calidad de la probabilidad que los prospectos puedan convertirse en potenciales clientes, de acuerdo con la similitud de sus clientes actuales. El rol de las redes sociales desempeña un papel importante para potenciar la escalabilidad de dicho modelo. Según Palencia, R. (2015), la captación de clientes es una actividad que existe en diferentes modalidades. Según el enfoque de e-commerce es importante destacar el uso de base de datos como CRM para trabajar en la segmentación de nuestros usuarios. Con referencia a la calidad de los datos, se tiene en cuenta en primer lugar la calidad del usuario captado, es decir que correspondan a usuarios reales existentes. En segundo lugar, se considera la calidad de la información captada, es decir, se hace énfasis a la cantidad para tener una data enriquecida y evitar mails falsos, por ejemplo.

3.1.2

Tipos de captación de clientes

Según Cuesta (2001), existen los siguientes tipos de captación de clientes: 

Captación indiscriminada o masiva: Tiene como propósito capturar el máximo número de clientes y luego realizar acciones que permitan pasarlo de cliente no selectivo a cliente fidelizado.

30


Captación selectiva: Tiene como objetivo identificar y capturar solo aquellos clientes que tienen cierta proximidad al perfil que se ha definido previamente. Este es el cliente ideal que nos generaría mucho valor.

Cabe mencionar que ambas opciones responden a situaciones distintas. La primera, es una alternativa cuando se busca maximizar la cuota de mercado de forma rápida a través de diferentes medios y recursos. La segunda, por su parte toma mayor tiempo de conceptualizarlo, pero otorgará una relación más estable con a la empresa, además de brindar una influencia positiva en la empresa. Por otro lado, según Promove Consultoria e Rormación SLNE (2012), sostiene que todas aquellas personas que actualmente no son clientes lo son potencialmente. En ese sentido, es importante captar los clientes, es decir, que puedan ser clientes del establecimiento ahora y en el futuro. Así mismo, menciona que es preciso hacer el ejercicio de reflexión y pensar en que otros tipos de clientes podrían dirigirse el negocio además de los actuales, ante ello, menciona que, se pueden encontrar lo siguiente:    

3.1.3

Clientes fáciles de captar y de retener. Clientes fáciles de captar, pero difíciles de retener. Clientes difíciles de captar, pero fáciles de retener. Clientes difíciles de captar y de retener.

Modelos de captación de clientes B2B

Según Matthijs et al. (2017) nos comenta que no existe un modelo formal o análisis de los datos de redes sociales en un entorno B2B como los que existen en clientes B2C. Es decir, que con el crecimiento de las redes sociales se puede obtener un mejor perfil de prospectos, creando así mejores modelos de predicción de captación de clientes. Por ello, toman en cuenta el evaluar el valor predictivo de los datos extraídos de las páginas de las redes sociales de los clientes potenciales versus los datos extraídos de sus páginas web y los datos que el prospecto de empresa compra a un proveedor especializado. Para realizar un modelo de captación de clientes para un entorno B2B es un poco más complejos que otros entornos. Ya que los autores mencionados anteriormente hacen énfasis al proceso de captación de clientes, “Embudo de Ventas” de D’Haen y Van den Poel (2013), la cual se divide en cuatro etapas que son las siguientes:

31


En la primera etapa, solo hay una lista de sospechosos de nuevos clientes

potenciales. En la segunda etapa, la lista inicial se reduce a una lista de prospectos que pueden

ser identificados. En la tercera etapa, consiste en calificar estos prospectos, lo que arroja una lista de prospectos, mayormente la calificación se basa en la intuición, el instinto y regla

simples como, pruebas aleatorias, elaboración de perfiles, etc. En la cuarta etapa, el cliente potencial se convierte en un cliente real.

Los autores de este paper para la elaboración del modelo de este proceso se basaron en las etapas del “Embudo de Ventas” explicado anteriormente, la cual ellos lo ven como dos fases: 

Los modelos de fase I, la cual se denomina modelo de semejanza o elaboración de perfiles, ya que como primera instancia no hay conocimiento sobre los prospectos que se convirtieron en clientes potenciales verdaderos versus prospectos que no se convirtieron. Para este modelo utilizaron el algoritmo Random Forest para las tareas de clasificación y como resultado se obtuvo una o varias listas de prospectos de clientes potenciales en base a los datos de clasificación. Luego de esto se procedió a verificar prospecto por prospecto si realmente se convertían en un futuro cliente potencial. o Los modelos de fase II, la cual se denomina modelo de adquisición de clientes, gracias a los Modelos de la fase I que se obtuvo la información de prospectos que se convirtieron en clientes potenciales versus prospectos que no se convirtieron, Para esta fase, aparte de que tiene lo mismo que los modelos de la fase I, tiene como un plus el modelado de prospectos convertidos en clientes potenciales versus los no convertidos. Y con esta segunda fase se pudo estimar cuales prospectos estaban fuera de la muestra y así mejorar el modelo predictivo.

3.1.4

Desempeño de captación de clientes B2B

Dentro de este marco, Tiene como finalidad evaluar y segmentar la eficiencia de captación de clientes con técnicas de marketing. Esto nos permitirá verificar si es que el Cliente se vuelve un verdadero cliente potencial.

32


Según Yu Y. y Cai Sh. (2007),nos comenten que el concepto de “embudo de ventas” se utiliza para gestionar la transición de un posible cliente potencial a un cliente en sí. Es decir que mientras más profundo se encuentre el cliente en los niveles del embudo, existen más probabilidades que se este se pueda convertir en un cliente potencial. Cabe resaltar que esto se suele realizar en la etapa de pre-venta, es decir, antes que el prospecto de cliente se vuelva un verdadero cliente. En base a este marco de trabajo se tiene la focalización de clientes en el marketing de B2B que hace referencia a los clientes potenciales y los existentes. A continuación, se presenta el “modelo de embudo de focalización”.

Figura 17 Modelo del embudo de segmentación de clientes. Adaptado de "The customer targeting funnel model", por Yo Y. y Cai Sh. (2007)

Esta figura muestra una estructura de capas de múltiples niveles la cual hace referencia a un estado de relación con el cliente, es decir si el cliente se realmente se vuelve un cliente potencial para la empresa. Los criterios para que el cliente pueda ingresar a cierto nivel, principalmente depende de las acciones de este como la confirmación de la intención de compra o la emisión de un contrato de venta. En conclusión, para cada nivel existen una lista de tácticas de marketing adecuadas. Luego el autor Barquero J. (2007), nos indican que el desempeño de capación de cliente ayuda a la conocer la satisfacción de los aspectos del cliente las cuales son lo siguiente: 33


1. Las necesidades del cliente Dentro de este marco, para atraer nuevos clientes es enfocarse en las necesidades insatisfechas del mercado. Además, una vez que haya sido captado el cliente, la gestión del servicio tiene como objetivo detectar sus requerimientos. (Barquero C, José D, 2007). 2. Los deseos del cliente Por otro parte, el deseo del cliente es la manera como específicamente cada cliente quiere satisfacer una necesidad, en paralelo muchas personas enfrenten una misma necesidad cada persona tiene la idea de un satisfactor específico para poderla cubrir. Además, si la empresa desarrolla un satisfactor pensando en los deseos específicos de sus clientes, logrará cubrir de una manera superior la necesidad del cliente. (Barquero C, José D, 2007). 3. La capacidad adquisitiva del cliente Según Barquero C, José D, (2007). Se debe considerar que no es suficiente que en un mercado encontremos una necesidad insatisfecha y tener definida la forma como ese mercado quiere cubrir esa necesidad, también es fundamental determinar si el mercado tiene capacidad de demanda, es decir que tenga poder adquisitivo para poder pagar los precios. Asimismo, una vez que el cliente potencial entra en contacto con la empresa tenemos que mantener procurando que se repita la compra de un producto o servicio durante el mayor tiempo posible. se calcula mediante la siguiente fórmula: -

Tasa de adquisición: Permite conocer el número de nuevos clientes en un periodo de tiempo determinado.

-

Ingresos de adquisición: Permite conocer el retorno de la inversión, es decir, la cantidad de dinero ingresada por cada unidad invertida.

34


-

Promedio de adquisición: Permite conocer de forma general cómo está funcionando la estrategia de adquisición, y si su presupuesto se está invirtiendo de forma adecuada. Refleja lo que está costando adquirir a cada uno de los nuevos clientes.

-

Tasa de conversión: Permite conocer qué número de clientes que se interesaron por el producto finalmente compraron éste. Se puede utilizar también como indicador del esfuerzo de ventas.

3.2 3.2.1

REGRESIÓN LOGÍSTICA Definición

Regresión logística es un algoritmo de clasificación que se utiliza para predecir la probabilidad de una respuesta binaria. Sus resultados son interpretables y es muy usada en el mercado. Funciona muy bien cuando hay muchísimos datos y las interrelaciones entre ellos no son muy complejas. Según Aithal y Jathanna (2019), la regresión logística se puede clasificar como una técnica estadística en la que se puede modelar un resultado binomial con variables explicativas. Los datos se ajustan a un modelo de regresión lineal; se utiliza una función logística para predecir la variable dependiente categórica. Un algoritmo de regresión logística binaria puede predecir solo dos resultados posibles para una respuesta categórica. Un algoritmo de regresión logística multinomial puede predecir tres o más categorías sin ningún orden. La función de regresión logística ordinal se utiliza para predecir tres o más categorías con orden. En esta técnica, se utilizan modelos lineales generalizados (GLM), que está 35


diseñado para ejecutar la regresión del modelo lineal generalizado en la salida de datos binarios. Por otro lado, Han, J., Choi, J., Kim, M., & Jeong, J. (2018), afirman que la principal razón para el uso continuo de la regresión logística sobre otros métodos de estimación es que proporciona un equilibrio adecuado de precisión, eficiencia e interpretabilidad de los resultados para detectar las variables que mejor permiten predecir el éxito o fracaso. El método es simple y universal. El propósito del análisis consiste en: predecir la probabilidad de que a alguien le ocurra cierto “evento”: por ejemplo, estar desempleado = 1 o no estarlo = 0, ser pobre = 1 o no pobre = 0. Según Berlanga y Vilà (2014), los modelos de regresión logística son modelos estadísticos en los que se desea conocer la relación entre una variable dependiente cualitativa dicotómica (regresión logística binaria o binomial) y una o más variables explicativas independientes, o covariables, ya sean cualitativas o cuantitativas. También es posible analizar una variable dependiente cualitativa con más de dos valores (regresión logística multinomial). El algoritmo de Regresión Logística tiene las siguientes finalidades: 

Cuantificar la importancia de la relación existente entre cada una de las covariables y la variable dependiente. Esto lleva implícito clarificar la existencia de interacción y confusión entre covariables respecto a la variable dependiente, es decir, conocer

la odds ratio para cada covariable. Clasificar individuos dentro de las categorías (presente/ausente) de la variable dependiente, según la probabilidad que tenga de pertenecer a una de ellas dada la presencia de determinadas covariables.

3.2.2

Tipos de regresión logística

A continuación, se presentan los tres tipos de regresiones logísticas: Tabla 13. Tipos de regresión logística N° Tipos Descripción

36


1

2

Regresión Logística Técnica estadística que tiene como objetivo comprobar Binaria hipótesis o relaciones causales cuando la variable dependiente (resultado) es una variable binaria, es decir, que solo tiene dos resultados posibles, también conocidas como dummy o dicotómica. Regresión Logística Puede contener más de una variable independiente. Las Multinomial variables independientes pueden ser discretas o continuas, pero el desarrollo que sigue se centrará en el caso en que todas las variables independientes son continuas.

3

Regresión Logística La variable que tiene tres o más categorías ordinales, es Ordinal decir, que corresponde a la escala ordinal, si sus categorías poseen un orden de importancia o jerárquica. Elaboración propia. Regresión logística binomial Berlanga y Vilà (2014), afirma que en la regresión logística binaria la variable dependiente debe tomar exactamente dos valores (Sí-No, 0-1, Verdadero-Falso, etc.). Las variables independientes pueden estar a nivel de intervalo o ser categóricas. Si son categóricas, deben ser variables dummy o estar codificadas como indicadores (existe una opción en el procedimiento para recodificar automáticamente las variables categóricas). En el caso de que exista alguna variable independiente cuantitativa no es necesario que sigan la Ley Normal, pese a que la solución puede ser más estable si los predictores tienen una distribución normal multivariante. Regresión logística multinomial (Hosmer y Lemeshow, 1989), son modelos con variable dependiente de tipo nominal con más de dos categorías (politómica) y es una extensión mul-tivariante de la regresión logística binaria clásica. Las variables independientes pueden ser tanto continuas (regresores) como categóricas (factores). Regresión logística ordinal Jobany J Heredia Rico1, Aida G Rodríguez Hernández y José A Vilalta Alonso (2012). La regresión logística ordinal en su forma es más simple, es decir, con una respuesta binaria, propone que el logaritmo de la “razón de probabilidad” (odds según su denominación en inglés), entendida como el cociente entre la probabilidad de éxito y la de fracaso en un ensayo de Bernoulli, es igual a una función lineal en los parámetros, denominada

37


usualmente predictora lineal. Asimismo, el objetivo es estimar y establecer la significancia estadística de los factores frente a una respuesta observada, y al operar con la inversa del logaritmo de la razón de probabilidad en función de la predictora lineal, se predicen las probabilidades de éxito en cada combinación de niveles de los factores.

3.2.3

Modelos de Regresión Logística

La regresión logística es una técnica estadística que permite predecir el resultado de una variable categórica en base a variables dependientes o predictoras. Los modelos con este algoritmo resultan útiles para situaciones prácticas más frecuentes de resultados binarios, es decir, una decisión en base a dos valores; como en nuestra investigación si el cliente es un buen o mal pagador. Según el Hilbe, J. (2009), considera que, el algoritmo de regresión logística es considerado para modelar respuestas binarias permitiendo estimar las probabilidades del modelo. Asimismo, menciona que, sus áreas de aplicación están en modelos logísticos, logit, etc. Por otro lado, Moradi y Mokhatab (2019), resaltan que, la construcción de un modelo depende de cada caso a evaluarse, ya que se tiene que definir objetivos, salidas deseadas, así como también definir la recopilación de los datos, porque no todas las estructuras se adecuan a un mismo modelo. Asimismo, se debe elegir los indicadores en los que se va a basar el modelo, los protocolos en los que van a evaluar. Luego estaría la preparación de los datos como tal y, en base a esa estructura, se debe elegir el modelo la cual tiene similitud con la estructura y ajustarlo para conseguir el mejor rendimiento posible. A continuación, se tiene algunos modelos que se asemejan a nuestra investigación en base al algoritmo escogido: Según Kanapickiene, R. y Spicas, R. (2019), propusieron un nuevo modelo estadístico de evaluación del riesgo crediticio del comercio empresarial de regresión logística (ECTRA) para las pequeñas y microempresas (PYME) en Lituania. Este modelo sirve como una herramienta técnica utilizada durante el proceso de toma de decisiones de los proveedores, la cual les ayudó a estimar la probabilidad de incumplimiento del crédito comerciar potencial de los clientes utilizando sus datos iniciales y tomando la decisión sobre la prórroga del pago vencido. El modelo se desarrolló teniendo presente las siguientes características: 38


   

Precisión: Alto poder discriminatorio. Sencillez en la aplicación: Revisión, calibración e interpretabilidad del modelo. Alta interpretabilidad de resultados Modelo probabilístico en el que el resultado deba ser la probabilidad de incumplimiento.

El modelo ETCRA se basa en tres aspectos: 

En primer lugar, cuando el proveedor elige a los clientes de crédito comercial

objetivo, es decir, cuando el cliente pasa a ser un deudor de crédito incobrable. En segundo lugar, elegir variables independientes adecuadas como variables

financieras y no financieras de las empresas. En tercer lugar, que el modelo desarrollado se caracterice por una alta interpretabilidad de los resultados, precisión y simplicidad.

También se puede decir que el modelo es flexibilidad, es decir, los proveedores pueden optar por evaluar a los clientes del crédito comercial utilizando solo ratios financieras o también variables no financieras, aunque estas últimas no mejoran las características del modelo de forma sustancial. Para la formación del modelo ETCRA constó de dos etapas: 

La selección de variables independientes, la cual se realizó de la siguiente manera: o En primer lugar, se realizó el análisis de los valores perdidos en la que se basa en analizar los números de los valores perdidos de las variables independientes como también en las razones por la que no se calculó la relación. o En segundo lugar, se realizó un análisis del poder discriminatorio de las variables

independientes

para

la

evaluación

de

las

cualidades

discriminatorias individuales de las ratios y un método valor de la 

información. Desarrollo del modelo de regresión logística en el modelo, la cual se seleccionó la regresión logística por su popularidad para la predicción predeterminada.

El modelo de regresión logística ETCRA se formó calculando los coeficientes de las variables independientes seleccionadas. El modelo de regresión logística se escribe como la siguiente figura:

39


Figura 18. Modelo de regresión logística. Adaptado por (3), por Kanapickiene y Spicas, (2019) En esta investigación se crearon diferentes modelos ETCRA para cada grupo de empresas:  

Para pequeñas empresas (Modelos SE). Para microempresas (Modelos MiE).

Además, cada grupo de empresas había desarrollado tres modelos que difieren según el uso de ratios financieros y variables no financieras. Por último, Bennouna G. y Tkiout M. (2019), desarrollaron un modelo de calificación crediticia mediante regresión logística y análisis discriminante multivariante la cuál fue aplicado a 1500 préstamos individuales de IMF marroquíes. Este modelo es una combinación de dos notaciones basadas en dos fuentes de datos, una relacionada con la información descriptiva del cliente (edad, actividad, nivel de estudios, número de deudas impagas, número de préstamos, etc.) y la otra basada en su comportamiento histórico con la institución (monto del crédito, duración del crédito, número de préstamos concertados por gestor de cartera, etc.). Se adopta este enfoque para mejorar el umbral de predicción del modelo y analizar la demanda de concesión de nuevos y antiguos clientes. Para este modelo se utilizaron dos técnicas estadísticas:  Análisis discriminante  Regresión logística. También se usó el software SPSS (Statistical Package for Social Science) para implementar las técnicas estadísticas mencionadas anteriormente. A continuación, se visualiza el modelo de lo explicado anteriormente en la siguiente figura.

40


Figura 19. Modelo de calificación crediticia propuesto. Adaptado por "The Credit Scoring model", por Bennouna y Tkiouat, (2019). 3.2.4

Desempeño del modelo

Para poder determinar que un algoritmo es exitoso y es el que mejor se adapta a las necesidades de un proyecto, es necesario poder evaluar la información disponible que se tiene y el modelo que procesará lo datos de este. Luego se necesitará una evaluación del rendimiento del modelo en base a métricas apropiadas, según sea el caso del tipo de algoritmo, para que a partir de ello se pueda obtener diferentes tipos de indicadores, la cual servirá para evaluar el desempeño de este. Según el paper de Azaria et al. (2019) nos comenta que el modelo de selección que se usa para poder medir la precisión en base a la clasificación de datos desequilibrados es el área bajo la curva ROC (AUC). Este último se forma entre el valor de sensibilidad y el valor FPrate (1-especificidad) calculado a partir de una categoría basada en todos los umbrales posibles (τ) valor. La fórmula para calcular la sensibilidad, especificidad y el AUC son los siguientes:

Figura 20. Fórmula para calcular la Sensibilidad. Adaptado de (29), por Azaria et al., (2019)

41


Figura 21. Fórmula para calcular la Especificidad. Adaptado de (30), por Azaria et al., (2019)

Figura 22. Fórmula para calcular el FPrate. Adaptado de (31), por Azaria et al., (2019)

Figura 23. Fórmula para calcular el AUC. Adaptado de (32), por Azaria et al., (2019) También nos explica que el AUC se calcula en base al área bidimensional por debajo de la curva ROC completa que tiene una figura trapezoidal, la cuál es hecha por TPrate y FPrate. Y que para simplificarnos con el cálculo de los valores ya mencionados anteriormente se hace uso de la matriz de confusión.

Figura 24. Matriz de confusión. Adaptado de "ConfunsionMatrix", por Azaria et al., (2019) La cuál explica que TP es el número de miembros de la clase 0 que es calculado correctamente, FP es el número de miembros de la clase 1 incorrectamente calculados. La cuál explica lo siguiente: 

TP es el número de miembros de clase 0 que se calcula correctamente, mientras que

FP es el número de miembros de clase 1 que son incorrectamente calculados. FN es el número de miembros de clase 0 que se calculan incorrectamente, mientras que TN es el número de miembros de clase 1 que son calculados correctamente.

En base a lo mencionado anteriormente, los papers que se hicieron mención para los modelos de regresión logística utilizan también el método de selección del área bajo la curva ROC (AUC). En el caso del modelo desarrollado por Kanapickiene, R. y Spicas, R. (2019), para evaluar el desempeño se eligió la curva ROC (Receiver Operating Characteristic), la cual permitirá luego comparar los modelos entre ellos. 42


Se comenzó con 61 variables, de las cuales 8 fueron no financieras y 53 financieras. Se seleccionó una variable de control, es decir, el número de empleados que describe el tamaño de la empresa.

Figura 25. Curva de ROC: (a) para modelos SE y (b) para modelos MiE. Adaptado de "Receiver operating characteristic (ROC) curve: (a) for SE models; (b) for MiE models ", por Kanapickiene y Spicas, (2019) De la figura anterior podemos resaltar que el área bajo la curva y los intervalos de confianza de los modelos con un 95% asintótico, son los siguientes: Para el caso de las pequeñas empresas (a): 

Para el modelo SE1 fue el área fue de 0.814 y su intervalo de confianza fue (0,783,

0, 844) Para el modelo SE2 fue el área fue de 0.825 y su intervalo de confianza fue (0,795,

0,854) Para el modelo SE3 fue el área fue de 0.840 y su intervalo de confianza fue (0,811, 0,868).

En el caso de los modelos de microempresa (b): 

Para el modelo MiE1 fue el área fue de 0.821 y su intervalo de confianza fue

(0.791, 0.851) Para el modelo MiE2 fue el área fue de 0,831 y su intervalo de confianza fue

(0,802, 0,860) Para el modelo MiE3 fue el área fue de 0.847 y su intervalo de confianza fue (0.819, 0.875)

Con esto se puede concluir que la regresión logística clasificó al grupo significativamente mejor para el caso de esta investigación. Los modelos formados cumplieron con el

43


requisito de precisión, ya que se caracterizaron por alto poder discriminatorio y los valores de AUC estaban por encima de 80. Esto quiere decir que se pueden utilizar los modelos ETCRA para evaluar el riesgo de crédito comercial de los clientes de crédito comercial Y para evaluar el desempeño del modelo de calificación crediticia de Bennouna G. y Tkiout M. (2019), también eligió la curva ROC (Receiver Operating Characteristic), la cual permitirá luego comparar los modelos entre ellos.

Figura 26 La curva ROC del modelo Credit Scoring. Adaptado de "The ROC curve of the Credit Scoring model", por Bennouna y Tkiouat, (2019)

De estas dos curvas en la figura anterior, deducimos el índice de GINI (= 1-2 * Área), la cual nos permite tener una visibilidad sobre la validez del modelo. El índice de Gini varía en [0,1], esto quiere decir que cuanto más tiende el índice a 1, más fuerte es la relación entre la probabilidad de incumplimiento y el perfil del cliente (Bueno / Malo) y, a la inversa, cuanto más tiende el índice a 0, más débil o inexistente es la relación. Para la muestra de aprendizaje, el índice de GINI = 0,7 y para la muestra de prueba este índice es igual a 0,55, de ahí la existencia de una fuerte relación entre las variables y por tanto el buen poder predictivo sobre el fracaso de los clientes. Con esto se puede concluir que los resultados obtenidos muestran que las características vinculadas al prestatario, a la institución y al comportamiento del cliente en relación con su historial crediticio determinan la tasa de morosidad de estos.

44


3.3 3.3.1

ROBOTIC PROCESS AUTOMATION Definición

La automatización robótica de procesos (RPA, por sus siglas en inglés) es la tecnología que permite hacer aplicaciones de computadoras para mejorar la producción de bienes y servicios en las empresas con una mínima intervención humana o sin ella. Según Asquith y Horsman (2019), RPA es la automatización de tareas de servicio que anteriormente eran realizadas por humanos. Describen RPA como una forma emergente de tecnología de automatización de procesos empresariales basada en la noción de robots de software o trabajadores de inteligencia artificial (IA). RPA se convierte en el nuevo lenguaje de negocios. RPA es una tecnología muy poderosa entre las tecnologías del siglo XXI porque permite a cualquier persona configurar software de computadora o "robot" emulando e integrando las acciones de un ser humano y su interacción con la computadora para completar las tareas repetitivas que se realizan con precisión en las aplicaciones. El programa RPA realiza las instrucciones establecidas por el desarrollador comunicándose con los sistemas mediante la grabación en pantalla y las variables.

Figura 27. Una descripción general de RPA y desarrollo de robots. Adaptado de “Taking a look at Robotic Process Automation and its potential application in digital forensics”, por Asquith y Horsman, 2019.

Uso y aplicación de RPA en las organizaciones En la actualidad aún se están adaptando algunas políticas en las organizaciones para gestionar de forma correcta las horas correspondientes a la automatización y las horas

45


correspondientes al trabajador mediante reglas claras para no perder el foco estratégico en las empresas. Según Nam (2019), las leyes, las culturas y las actitudes ciudadanas no han evolucionado para hacer frente a los cambios provocados por las olas tecnológicas. Hace falta desarrollar políticas para enfrentar estos cambios y reflejar más las preferencias políticas de los ciudadanos que están en riesgo potencial o inminente de desempleo tecnológico. Sin embargo, la automatización de procesos robotizados (RPA) debe generar un aumento en la optimización de los resultados de las empresas que apuestan por la tecnología y las personas deben perder el temor a que las tecnologías usurpen sus funciones y horas de trabajo. Investigaciones demuestran que el RPA contribuye a elevar el nivel de performance en la empresa. Según Ivanov, Kuyumdzhiev y Webster (2020), las empresas deben organizar reuniones con los empleados en el caso de que se introduzcan tecnologías de automatización para abordar posibles temores de perder sus puestos de trabajo. Deben resaltar los impactos positivos de la automatización que busca eliminar cuellos de botella operativos y brindar más tiempo a los empleados humanos para que se concentren en actividades creativas y generadoras de ingresos.

3.3.2

Tipos de tecnologías de RPA

Ribeiro, Lima, Eckhardt y Paiva (2019), elaboran la siguiente tabla comparativa de las herramientas RPA más representativas en el mercado. Se observa los objetivos de Inteligencia Artificial (IA, por sus siglas en inglés) y los algoritmos respectivos a fines a cada tecnología presentada. Tabla 14. Comparación de tecnologías RPA y objetivos asociados a IA.

46


Nota: Principales tecnologías RPA y su relación con IA. Adaptado de “Comparison of technologies and goals associated to IA”, por Ribeiro, Lima, Eckhardt y Paiva (2019). A continuación, según Tripathi (2018), se presentan las principales características de las tecnologías más representativas del mercado. 

UiPath: Herramienta con muchas funciones y mucha documentación. Tiene varios complementos que se pueden programar permitiendo la adaptabilidad a otras

aplicaciones como PowerShell, SAP ERP, Oracle y Microsoft Dynamics. Kofax: Su plataforma Kapow RPA es capaz de automatizar y entregar procesos repetitivos basados en reglas. Utiliza robots para extraer y consolidar información. La plataforma de software consta de una consola de administración para

implementar y administrar el rendimiento de los robots y monitorear el sistema. Automation Anywhere: Herramienta orientada a la automatización de procesos con la particularidad de proporcionar información sobre la aplicabilidad de técnicas

y/o algoritmos de IA. WinAutomation: Herramienta con un conjunto de características asociadas a los procesos de automatización que se incorporan con RPA como, por ejemplo, automatización de correos electrónicos, archivos en varios formatos (PDF, Excel, entre otros), OCR y otras características asociadas con el entorno de trabajo de los

empleados (escritorio o web). Blue Prism: Proporciona automatización escalable según las necesidades de las empresas.

Según Figura 28, se observa las principales tecnologías RPA en el mercado.

47


UIPATH Proporciona licencias gratuitas a desarrolladores individuales, equipos profesionales pequeños y entidades educativas.

COMERCIAL

BLUE PRISM

KOFAX Plataforma RPA para automatización inteligente con IA integrada a tecnologías empresariales.

INTELIGENCIA ARTIFICIAL

Automation Anywhere Software de RPA parte de IBM Automation Platform for Digital Business. Orquesta flujos de trabajo con bots.

IBM

WINAUTOMATIO N

Blue Prism ofrece a los negocios y organizaciones un software de Automación Robótica de Procesos (RPA) para una fuerza de trabajo más ágil.

Software RPA de Microsoft para escritorio de gran data y fácil uso.

AGILIDAD

MICROSOFT

Figura 28. Principales tecnologías RPA en el mercado. Elaboración propia 3.3.3

Elementos del RPA

Según Tripathi (2018), existe un común denominador en los componentes básicos que conforman una solución RPA. Estos se identifican en la mayoría de las plataformas RPA.

48


Figura 29. Componentes básicos del RPA. Adaptado de “Components of RPA”, por Tripathi, 2018. A continuación, se describe los componentes básicos de una plataforma RPA. 

Recorder: Parte del estudio usado para la configuración de los robots. Se encarga de registrar los pasos, los movimientos del mouse y el teclado en la interfaz del usuario. Mediante la reproducción de la grabación permite seguir y realizar los

mismos pasos. Development studio: Parte del estudio usado para la creación, configuración y entrenamiento de los robots. Se codifica un conjunto de instrucciones y lógicas de toma de decisiones para que los robots las ejecuten. Algunas plataformas proporcionan capacidades de diagramas de flujo como Visio; mientras que otras, no

y requieren ser codificadas. Extensions and plugins: Debido a que, en muchas aplicaciones, como es el caso de Java o SAP, no es fácil identificar individualmente los controles de la interfaz de usuario mediante técnicas tradicionales, los proveedores de RPA han creado

complementos y extensiones para facilitar esta tarea. Bot runner: Permite hacer referencia al robot y, mediante otros componentes,

hacerlo funcionar. Control center: Permite supervisar y controlar el funcionamiento de un robot en una red; iniciar y detener robots; implementar programas; mantener y publicar código; y administrar licencias y credenciales.

Por otro lado, los autores Enríquez, Jiménez, Domínguez y García (2020), desde un enfoque distinto, dan mayor importancia a las fases que compete el ciclo de vida del RPA. A continuación, se presentan las fases planteadas:

49


Fase de análisis: Consiste en analizar y determinar la viabilidad de llevar a cabo la automatización de un determinado proceso mediante un análisis detallado del esfuerzo que implica la automatización de dicho proceso considerando las

características de ejecución del mismo. Fase de diseño (del proceso): El propósito de esta fase es detallar el conjunto de acciones, flujo de datos, actividades, etc., que deben implementarse en el proceso

de RPA. Fase de construcción: Consiste en implementar cada una de las partes

automatizables de cada proceso identificado en la fase de diseño. Fase de implementación: Los robots necesitan un entorno donde ejecutarse, de la misma forma que un operador humano necesita un entorno donde pueda realizar su trabajo. Este entorno, en el contexto de RPA, suele corresponder a una computadora que tiene una instalación de uno o más sistemas de información. Cada robot debe ejecutarse en su propio entorno de ejecución, ya que la sustitución entre el operador

humano y el software es directa. Fase de control y seguimiento: Esta fase supervisa el control y seguimiento del rendimiento de cada robot. En esta fase se lanza la ejecución de los robots, se detiene en caso de errores graves, se monitoriza el estado de ejecución, etc., hasta

3.3.4

que han finalizado su trabajo. Fase de evaluación y desempeño: Se evalúa el desempeño de los robots.

Desempeño del RPA

Según Tripathi (2018), el desempeño de una solución RPA puede evaluarse desde los siguientes tópicos: 

Precisión: La detección de errores es mucho más sencillo en RPA en comparación con la ejecución humana, debido que el RPA tiene un registro del paso a paso.

Reduciendo el número de errores se logra una mejor precisión. Costos: Debido a que la ejecución de un robot puede llevarse a cabo las 24 horas del día, en contraste con el trabajo de una persona, que es aproximadamente de 8 horas diarias, se presenta un aumento de disponibilidad y productividad. A mayor demanda los costos operativos no se elevarían porque no sería necesario contratar más personal humano.

50


Velocidad: Va de la mano con la velocidad de los componentes con los que se interactúe; sin embargo, el robot presenta una mayor rapidez en comparación con

 

una persona y, dado ello, realizan un mayor volumen de tareas. Cumplimiento: El robot cuenta con un flujo de trabajo estructurado que impide desviarse de lo establecido garantizando un mejor nivel de cumplimiento, en contraste con una persona que está expuesto a cometer errores. Escalabilidad: RPA escala rápidamente, a modo de aumento o reducción, de acuerdo con la demanda. Su configuración es sencilla y la calidad del trabajo no se ve afectada. Por otro lado, sin RPA se requeriría encontrar a las personas,

capacitarlas y, posiblemente se requiera de un tiempo adicional para que se adapten. Tiempo: Las tareas ejecutadas por el RPA no solo se llevan a cabo en menor tiempo, sino que, ante cambios en los sistemas con los cuales interactúa o cambios en el proceso, solo bastaría con añadir estos cambios en el flujo de trabajo. Por otro lado, sin RPA, posiblemente podría tomar un tiempo adicional al personal adaptarse

a los nuevos cambios. Gestión: RPA permite una mejor administración, implementación y monitoreo, debido que presenta una plataforma centralizada, en comparación con la complejidad de administrar el trabajo del personal.

Desde otra perspectiva, Taulli, T. (2020), destaca que el ROI es el punto de comparación más comentado en el mundo que justifica la viabilidad de las inversiones. Según el informe “Computer Economics Technology Trends 2019”, encuesta a 250 empresas de diversas industrias cuyos ingresos van desde los $ 20 millones a miles de millones, alrededor del 12% implementó RPA dentro de sus organizaciones y la mitad de ellos dijeron tener un ROI positivo en 18 meses (el resto estaba, en su mayoría, en el punto de equilibrio). Asimismo, comparte la perspectiva de la consultora AT Kearney respecto a que el precio promedio de un robot es menor que la tercera parte de lo que se le pagaría a una persona en el extranjero y, lo refuerza describiendo otros beneficios del RPA como eficiencia en el trabajo, mayor cumplimiento de requisitos reglamentarios, alta calidad y flexibilidad para la escalabilidad.

4 4.1

CAPÍTULO IV: PROPUESTA DE SOLUCIÓN TECNOLÓGICA Descripción del proceso actual

A continuación, se describe el proceso actual:

51


El Analista de Base de Datos del área de Marketing es el responsable de generar la base de clientes potenciales de manera recurrente cada lunes de cada semana; sin embargo, de manera excepcional y a solicitud, la base también puede ser generado otro día de la semana. Esta tarea le toma, en promedio, 8 horas. Cada lunes ingresa al portal SUNAT, descarga el archivo zipeado actualizado del Padrón Reducido, lo descomprime y carga en la Base de Datos Marketing (BD MKT) de la empresa. A continuación, descarga una base de clientes actuales de la empresa (solo los RUC’s) en formato plano del ERP SAP y lo carga en la BD MKT. Seguidamente, inicia las tareas de filtrado de datos cuya finalidad es identificar una pre-base de clientes potenciales. Principalmente, excluye los clientes actuales de Gurú Soluciones del nuevo padrón cargado de SUNAT, y los RUC’s incluidos directamente o los relacionados por algún representante legal con los RUC’s de la base Lista Negra. En esta base Lista Negra se encuentran los RUC’s que han decidido expresamente no se les contacte, ya sea por una mala experiencia con los productos que ofrece la empresa o porque han comunicado no estar interesado en contratar producto alguno. Asimismo, también se encuentran los RUC’s que tienen más de 1 mes de atraso en el pago de sus productos contratados, y permanecen hasta registrar puntualidad en sus pagos por 3 meses consecutivos. Actualmente, este es el único filtro que se dispone dentro del área para identificar malos pagadores en la base de clientes potenciales. A continuación, se enriquece, la pre-base obtenida, con teléfonos de contacto válidos del titular del RUC (en caso se trate de una persona natural) o de los representantes legales. Posteriormente, se realizan las tareas de limpieza y estandarización de datos referidos a los números de teléfonos y direcciones. Por el lado de los teléfonos, se asegura la contactabilidad validándose y autocompletándose datos faltantes (de ser necesario) de los números telefónicos fijos y celulares. Por el lado de las direcciones, esta se estandariza para la fácil localización del cliente potencial por parte del Asesor Comercial. Únicamente son cargados al software Edithor los clientes potenciales que cuenten con al menos un teléfono de contacto válido o dirección estandarizada. Por último, el Analista de Base de Datos extrae un reporte del software Edithor con las cantidades de clientes potenciales cargados por región y envía un correo electrónico a cada buzón de Equipo Comercial comunicando la cantidad de fichas de clientes potenciales cargadas. Los Asesores Comerciales con el correo de confirmación de fichas de clientes potenciales cargadas al software Edithor inician la ejecución de sus campañas de ventas. Los Asesores

52


Comerciales están divididos en 5 equipos según las regiones definidas en Gurú Soluciones: Perú Norte, Perú Sur, Perú Este, Perú Centro y Perú Lima.

Figura 30. Diagrama de proceso actual. Elaboración propia

Figura 31. Diagrama de subproceso actual. Elaboración propia. Problemas que enfrenta el proceso actual El proceso actual enfrenta los siguientes problemas: 

Demora en la entrega de base de clientes potenciales al Equipo Comercial: Ejecutar el proceso actual toma, en promedio, 8 horas y, requiere ser atendido constantemente por una persona. Debido a la demanda de otras tareas dentro del área, el Analista de Base de Datos de Marketing, responsable de la ejecución del proceso, lo ejecuta, en promedio, 2 veces por semana. Si bien el área pone todos los esfuerzos posibles, el Equipo Comercial recién puede ejecutar sus campañas de

ventas al siguiente día y, muchas veces, con retraso. Elevado número de tareas repetitivas: Ejecutar el proceso actual demanda que la persona esté, prácticamente, 100% de su tiempo enfocado en ello. Muchas veces 2 de los 5 días de la semana son improductivas para el área en términos de creatividad, innovación y otras tareas del rol. Considerando que, el responsable del proceso percibe una remuneración de s/.6,000 mensual, se destina 8 horas para la ejecución del proceso y el proceso se ejecuta 2 veces por semana, el proceso tiene un costo de servicio laboral asociado a su ejecución de $105.26 semanal con un tipo de cambio de dólar igual a 3.8. 53


Deficiente identificación de malos pagadores: La empresa tiene una alta tasa de morosidad debido a que el filtro en la captación de clientes es deficiente. Solo etiqueta como mal pagador si el nuevo RUC no tiene relación alguna (por representante legal) con algún RUC ya identificado como mal pagador. Se requiere de innovadoras técnicas y uso de tecnología para reducir la gorda cartera morosa. Actualmente se viene pagando mensualmente s/.10,000 por servicio externo de cobranza.

4.2

Descripción del proceso futuro

Como proceso futuro se propone que este se ejecute automática y desatendidamente con un enfoque de hiperautomatización. A continuación, se describe el proceso futuro. La aplicación RPA se ejecuta automáticamente, y de manera desatendida, todos los lunes y miércoles a las 7 de la mañana, o en cualquier otro día y hora según solicitud a demanda. Según Figura 31, iniciada la aplicación RPA, se valida los accesos a los software’s o servicios web con lo que interactúa. Si algún acceso es denegado, se envía correo a IT notificando la incidencia respectiva y finaliza la ejecución de la aplicación RPA; sin embargo, si todos los accesos están disponibles, se realizan los siguientes pasos: 1. Obtener Padrón reducido: La aplicación RPA abre un navegador web e ingresa al portal SUNAT para descargar el Padrón reducido actualizado. El archivo .zip descargado es descomprimido y movido a una ruta específica como copia de respaldo. 2. Obtener pre-base de clientes potenciales: El archivo Padrón reducido en formato .txt es importado a la base de datos Marketing (BD MKT). A continuación, se accede al ERP SAP y se descarga los RUC’s de los clientes actuales de Gurú Soluciones en un archivo .txt. Este archivo es cargado a la BD MKT para luego ser cruzado con el Padrón reducido e identificar los RUC’s que aún no son clientes de la empresa. Seguidamente, los RUC’s son filtrados con la Lista Negra a fin de excluir RUC’s que mantienen deuda con la empresa (ex clientes). Por último, se exporta la base de pre-clientes potenciales generada luego de aplicarse los filtros mencionados. 3. Identificar malos pagadores: La base de pre-clientes potenciales se carga al portal Solución ML (servicio web para consumir la solución Machine Learning) con el fin

54


de predecirles la morosidad a los RUC’s. A continuación, se descarga la base con las etiquetas “buen pagador” o “mal pagador”. 4. Obtener base de clientes potenciales: La base de pre-clientes potenciales etiquetada se importa a la BD MKT. Se excluyen los RUC’s etiquetados como “malos pagadores”. A continuación, se obtienen datos de teléfono de los RUC’s resultantes. Seguidamente, los datos de teléfonos y direcciones son limpiadas, estandarizadas y validadas. Por último, se exporta la base de clientes potenciales generada con los RUC’s que tienen al menos un teléfono o dirección válida. 5. Cargar clientes potenciales en Edithor: La base de clientes potenciales se carga a Edithor. A continuación, se descarga el reporte de carga y se prepara 5 correos para confirmar la cantidad de clientes potenciales asignados a cada uno de los 5 Equipos Comerciales. Por último, antes de finalizar la ejecución de la aplicación RPA, se procede a cerrar cada una de los software’s y portales web abiertos.

Impacto de la solución tecnológica Machine Learning y RPA La solución tecnológica propuesta tiene los siguientes beneficios: 

Reducción del 100% del costo por servicio laboral asociado a la ejecución del proceso: Permite que el rol responsable de la ejecución del proceso actual se dedique a tareas creativas, innovadoras y estratégicas de mayor valor para la

empresa. Reducción del 80% del costo por servicio externo de cobranza: Identificando eficientemente a los malos pagadores se evitará venderles producto alguno que luego no puedan pagar. Se logrará reducir significativamente la cartera morosa y,

con ello, el costo por servicio externo de cobranza. Incremento de porcentaje de venta efectiva líquida a un 80%: En el proceso actual se desperdicia balas ofreciendo productos a clientes potenciales con problemas de pago y las campañas de ventas se ejecutan a destiempo. Con la solución tecnológica, el Equipo Comercial será proveído, en el mejor escenario, diariamente de base de clientes potenciales para dinamizar sus campañas de ventas y, haciendo referencia al principio Pareto, donde el 20% de tus clientes potenciales te ofrece el 80% de tus ingresos por venta, se dispondrá de una base eficientemente filtrada de malos pagadores. Lo anteriormente mencionado revertirá el actual 40% que se tiene de porcentaje de venta efectiva líquida a un 80%. Quiere decir que, de 55


10 ventas efectuadas, garantizará el pago de al menos 8 de ellas, contribuyendo con ello a mejorar la liquidez de la empresa.

56


Figura 32. Diagrama de proceso futuro. Elaboración propia.

57


4.3

Arquitectura de la solución

Arquitectura de Machine Learning (ML) A continuación, se presenta la arquitectura de Machile Learning. La misma se diseñó utilizando los siguientes componentes: 

Azure Data Factory: Servicio ETL en la nube de Azure para la integración y la

transformación de datos escalables sin servidor. Blob Storage: Proporciona almacenamiento para crear potentes aplicaciones nativas de la nube óptimo para almacenamiento flexible para cargas de trabajo de

Machine Learning. Azure Databriks: Servicio de inteligencia artificial y datos integrado con Azure Data Factory y Azure Machine Learning para almacenar todos los datos en un lago simple abierto y unificar todas las cargas de trabajo de análisis e inteligencia

artificial. Azure Function: Servicio en la nube de Microsoft para desarrollar aplicaciones

serverless. Diseña una arquitectura escalable y fácil de implementar. Analysis Services: Proporciona un modelo de datos de forma más fácil y rápida para que los usuarios realicen análisis de datos ad hoc utilizando herramientas de

visualización como dasboards. AKS: Entorno de Kubernetes administrable y alojado, rápido, fácil de implementar

y administrar aplicaciones en orquestación de contenedores. API Managment Services: Plataforma de administración de API multi-nube y

escalable para proteger, publicar y analizar API. Azure Machine Learning: Solución de ciencia de datos integrada para científicos

de datos para modelar e implementar aplicaciones de ML. Azure Key Vault: Protege las claves criptográficas y otros secretos usados por las aplicaciones y los servicios en la nube.

58


Figura 33. Arquitectura Machine Learning de Gurú Soluciones. Elaboración propia A continuación, se presenta el flujo de la arquitectura: 1. A través de distintos medios como archivos de texto, ERP de SAP, Bases de datos y Systemas Legacy, agregamos los inputs de los clientes a ser evaluados. 2. Se pasa por una autenticación de seguridad para acceder a la plataforma de Azure. 3. Los datos son ingresados al servicio Azure Data Factory para la extracción y tratamiento de los datos. 4. Se guardan los features correspondientes en una instancia de Blob Storage. 5. La información del paso 4 es extraída al servicio de Azure Databriks donde se aplica ciencia de datos, se prepara y enriquece la data antes de pasar por el entrenamiento. 6. Los datos son aplicados al servicio Azure Machine Learning donde se ha configurado la lógica para la predicción de clientes potenciales y futuros buenos pagadores. 7.a Se aplican instrucciones para mandar los resultados obtenidos al servicio de Analysis Services. 8.a Aquí es donde se construirán reportes que ayudarán al análisis de los datos a nivel macro mediante un Dashboard interactivo. 9.a Se visualizará la información por medio de gráficos, análisis estadísticos e indicadores para la toma de decisiones. 10. Finalmente los usuarios llegarán a visualizarlo desde sus dispositivos finales. 59


7.b El servicio de Azure Machine Learning, donde se crea el modelo de datos entrenado, se comunicará con el de Azure Kubernetes Service, donde se desplegarán los contenedores de la API expuesta referente al modelo "Clientes potenciales". 8.b Del paso anterior la arquitectura tendrá salida a una Api Managment para su acceso desde cualquier aplicación externa que contenga las credenciales para ser consumida.

Arquitectura de Robotic Process Automation (RPA) A continuación, se presenta la arquitectura de Robotic Process Automation.

Figura 34. Arquitectura Robotic Process Automation de Gurú Soluciones. Elaboración propia. En la Figura 33, correspondiente a la arquitectura de Robotic Process Automation se muestran los componentes, artefactos que intervienen y la interacción entre los mismos.

4.4

Factibilidad económica

Los cálculos realizados en el presente apartado fueron realizados según las siguientes especificaciones. -

El flujo de caja se elabora para 3 años en referencia con la vida útil de la solución. Se define 6 meses como periodo del proyecto y 30 meses (2.5 años) como periodo 60


de la operación de la solución. La solución tecnológica Machine Learning será 4.4.1

implementada en 6 meses y la solución tecnológica RPA, en 2 meses. Cambio de dólar igual a S/. 3.80 nuevos soles. Beneficios económicos

A continuación, se presentan los 3 beneficios principales a obtenerse al implementar la solución tecnológica. 1. Reducción del 100% del costo por servicio laboral asociado a la ejecución del proceso. Según Tabla 15, se observa que el costo por servicio laboral asociado a la ejecución del proceso tiene un importe de $105.26 semanales considerándose dos ejecuciones por semana del proceso (cada una con una duración promedio de 8 horas). El colaborador responsable de la ejecución del proceso es el Analista de Base de Datos de Marketing. Se le paga por sus servicios el importe de s/. 6,000 soles mensuales. Con la implementación de la solución tecnológica RPA desatendida el proceso no requiere intervención humana lográndose reducir en un 100% el costo por servicio laboral asociado a la ejecución de este proceso. El tiempo que ya no se va a invertir en esta tarea podría ser utilizando en tareas creativas, innovadoras y estratégicas para bien del área y empresa, en general. Tabla 15. Cálculo de beneficio 1.

Elaboración propia. 2. Reducción del 80% del costo por servicio externo de cobranza. Debido a la tasa elevada de morosidad, la empresa contrata el servicio de cobranza de una empresa externa a fin de evitar que la deuda sea castigada e, incluso, no pagada. El servicio tiene un costo promedio de S/. 10,000 soles mensuales. Con la implementación de 61


la solución tecnología Machine Learning se busca reducir lo máximo posible la venta de productos a clientes potenciales morosas. La base de clientes potenciales que se entregará al Equipo Comercial será, prácticamente, exento de malos pagadores. Por tanto, se estima que el costo por servicio externo de cobranza se reduzca en un 80% generando un ahorro promedio mensual de $ 2,105.26 según Tabla 16. Tabla 16. Cálculo de beneficio 2.

Elaboración propia. 3. Incremento de porcentaje de venta efectiva líquida a un 80%. Se considera venta efectiva líquida a la venta que termina pagándose. Actualmente el porcentaje de venta efectiva líquida es del 40%. Quiere decir que, por ejemplo, de 10 ventas, 4 ventas terminan pagándose. Con la implementación de la solución tecnológica ML y RPA, según Tabla 17, se estima incrementar este porcentaje en un 100%; es decir, lograr un 80% de porcentaje de venta efectiva líquida. Siguiendo el ejemplo anterior, lograr que, de 10 ventas, 8 terminen pagándose. Debido a que el proceso captación de clientes se ejecuta en promedio 2 veces por semana, las campañas de venta también mantienen el mismo periodo de ejecución. Con la implementación de la solución tecnológica se buscar lograr, en primer lugar, de ser posible, que el proceso se ejecute de forma diaria a fin de poder brindar más oportunidades de venta al Equipo Comercial. En segundo lugar y, considerando el principio de Pareto, donde el 80% de tus ingresos están en el 20% de tus clientes potenciales, se busca perfilar mejor la base de clientes potenciales a fin de ofrecer los productos únicamente a los que previamente se ha identificado como buenos pagadores debido a que garantizan poder adquisitivo. En otras palabras, en el

62


proceso actual posiblemente se desperdicia balas en clientes potenciales nada efectivos para los intereses económicas de la empresa. Tabla 17. Cálculo de beneficio 3

Elaboración propia. Por lo anteriormente expuesto, se presenta la siguiente tabla resumen de los beneficios económicos. Tabla 18. Resumen de beneficios económicos

Elaboración propia. 4.4.2

Cálculo de costo total de propiedad de implementación de la solución

A continuación, se detalla la inversión y costos asociados a la implementación y operación de la solución tecnológica propuesta. Inversión

63


La implementación de la solución tecnológica será tercerizada a empresas expertas en el sector. La solución Machine Learning será implementada por la empresa Vex Soluciones E.I.R.L. por el importe único de $ 50,210.53 y, la solución RPA será implementado por la empresa Sofbotic S.A. por un importe único de $ 4,989.47. La inversión total ascenderá a $ 55,200. El detalle de los importes se observa en la Tabla 18 y Tabla 19, respectivamente. Tabla 19. Detalle Inversión Machine Learning

Elaboración propia. Tabla 20. Detalle de Inversión RPA

Elaboración propia. Costo de Operación Anual A continuación, se presenta el detalle de los costos de operación mensual de los componentes de la solución Machine Learning. Se excluye el concepto Soporte porque el costo por este se incluye en el apartado de Costos de Mantenimiento. El detalle del costo de cada componente se encuentra en el apartado de Anexos. Tabla 21. Presupuesto de componentes Microsoft Azure Estimate

64


Elaboración propia. Seguidamente, se presenta el detalle del costo de operación mensual del componente de la solución RPA. El detalle del costo del componente se encuentra en el apartado de Anexos. Tabla 22. Presupuesto de componente Microsoft Power Automate

Elaboración propia. Finalmente, se presenta el detalle de costos de operación anual por los servicios Microsoft Azure Estimate y Power Automate a usar. Tabla 23. Detalle del costo de operación anual

Elaboración propia. Costo de Mantenimiento Anual

65


Los siguientes costos son considerados para el cálculo del costo de mantenimiento anual: el costo de mantenimiento de la tecnología Microsoft Azure Estimate y los costos de mantenimiento de los proveedores de la solución Machine Learning y RPA. Los detalles de cada uno de los costos se observan en las Tabla 20, Tabla 21 y Tabla 22, respectivamente. Se considera el costo de mantenimiento de la tecnología Microsoft Azure Estimate por la dependencia que se tiene de consumir servicios cloud del proveedor relacionado con la solución Machine Learning. Asimismo, se desiste del pago de mantenimiento de la tecnología Microsoft Power Automate considerando que la solución se ejecutará en un ambiente on premise y ya se dispondrá del mantenimiento del proveedor de la solución RPA para atender cualquier incidente. Por otro lado, se considera el costo de mantenimiento de los proveedores ML y RPA a fin de atender cualquier incidencia o cambio menor en la solución a implementar. Tabla 24. Presupuesto Microsoft Azure Estimate

Elaboración propia. Tabla 25. Detalle del costo de mantenimiento del proveedor ML

Elaboración propia. Tabla 26. Detalle del costo de mantenimiento del proveedor RPA

Elaboración propia. 66


A continuación, se presenta el cuadro resumen con el detalle del costo de mantenimiento anual de la solución tecnológica a implementar. Tabla 27. Detalle del costo de mantenimiento anual

Elaboración propia. Por último, se presenta un cuadro resumen de los costos de la solución tecnológica a implementar. Tabla 28. Resumen de costos

Elaboración propia. 4.4.3

Cálculo del ROI

A continuación, se presenta el flujo de caja elaborado con los importes de inversión, costos y beneficios calculados en los apartados anteriores. Seguidamente se calcula el ROI de la implementación de la solución tecnológica. Tabla 29. Flujo de caja elaborado

Elaboración propia. Según Tabla 29, se observa un ROI de 159% demostrando que la presente propuesta de solución tecnológica es rentable. El ROI obtenido de 159% nos indica que el retorno de la 67


inversión del proyecto es de 1.59 veces la inversión inicial respecto de la ganancia acumulada obtenida en los 3 años.

5

REFERENCIAS

Aithal, V., & Jathanna, R. (2019). Credit Risk Assessment using Machine Learning Techniques. International Journal of Innovative Technology and Exploring Engineering, 9(1), 220-224. doi: http://doi.org/10.35940/ijitee.A4936.119119 Asquith, A., & Horsman, G. (2019). Let the robots do it! – Taking a look at Robotic Process Automation and its potential application in digital forensics. Forensic Science International: Reports, 1(100007), 1-6. doi: http://doi.org/10.1016/j.fsir.2019.100007 Azaria, N. & Dedy, P. (2019). Credit scoring to classify consumer loan using machine learning. AIP Conference Proceedings, 2194(020070), 1-14. doi: https://doi.org/10.1063/1.5139802 Bennouna, G., & Tkiouat, M. (2019). Scoring in microfinance: credit risk management tool - Case of Morocco. Procedia Computer Science, 148, 522-531. doi: https://doi.org/10.1016/j.procs.2019.01.025 Berlanga, V. & Vilà, R. (2014). Cómo obtener un Modelo de Regresión Logística Binaria con SPSS. [En línea] REIRE, Revista d’Innovació i Recerca en Educación, 7 (2), 105-118. Accesible en: https://doi.org/10.1344/reire2014.7.2727 Bernal, C. (2010). Metodología de la investigación administración, economía, humanidades y ciencias sociales. Colombia: Pearson. Cuesta, F. (2001). Gestión de la Cartera Gestión de la Cartera de Clientes. Madrid: Imprenta Modelo. David, W., Borko, J. & Stanley L. (1989), Best Subsets Logistic Regression. Biometrics, 45, 1265-1270. doi: https://doi.org/10.2307/2531779 Enríquez, J., Jiménez, A., Domínguez, F., & García, J. (2020). Robotic Process Automation: A Scientific and Industrial Systematic Mapping Study. IEEE Access, 8, 39113-39129. doi: https://doi.org/10.1109/ACCESS.2020.2974934 Guevara, R. (2016). El estado del arte en la investigación: ¿análisis de los conocimientos acumulados o indagación por nuevos sentidos?. Folios, 2(44), 165-179. doi: https://doi.org/10.17227/01234870.44folios165.179 Hilbe, J. (2009). Logistic regression models. ProQuest Ebook Central. 15-44: https://ebookcentral.upc.elogim.com

68


Huang, F., & Vasarhelvy, M. (2019). Applying robotic process automation (RPA) in auditing: A framework. International Journal of Accounting Information Systems, 35, 1-11. doi: https://doi.org/10.1016/j.accinf.2019.100433 Ivanov, S., Kuyumdzhiev, M., & Webster, C. (2020). Automation fears: Drivers and solutions. Technology in Society, 63, 1-57. doi: https://doi.org/10.1016/j.techsoc.2020.101431 J. D'Haen , D. Van den Poel, D. Thorleuchter. (2013). Predecir la rentabilidad del cliente durante la adquisición: encontrar la combinación óptima de fuente de datos y técnica de minería de datos. Experts Systems with Applications. 40(6), 2007 - 2012. doi: http://dx.doi.org/10.1016/j.eswa.2012.10.023 Kanapickiene, R., & Spicas, R. (2019). Credit risk assessment model for small and microenterprises: The case of Lithuania. Risks, 7(2), 1-23. doi: https://doi.org/10.3390/risks7020067 Meire, M., & Ballings, M. (2017). The added value of social media data in B2B customer acquisition systems: A real-life experiment. Decision Support Systems, 104, 26-37. doi: https://doi.org/10.1016/j.dss.2017.09.010 Moradi, S., & Mokhatab, F. (2019). A dynamic credit risk assessment model with data mining techniques: evidence from Iranian banks. Financial Innovation, 5(1), 1-27. doi: https://doi.org/10.1186/s40854-019-0121-9 Nam, T. (2019). Citizen attitudes about job replacement by robotic automation. Futures, 109, 39-49. doi: https://doi.org/10.1016/j.futures.2019.04.005 Palencia, R. (2015). Libro Blanco de marketing de resultados en e-commerce. Observatorio eCommerce. Madrid: Asociación Española de Comercio Electronico. Papouskova, M., & Hajek, P. (2019). Two-stage consumer credit risk modelling using heterogeneous ensemble learning. Decision Support Systems, 118, 33-45. doi: https://doi.org/10.1016/j.dss.2019.01.002 Caruanambo, P. & Tenorio, K. (2012). Promove Consultoria e Información SLNE para Atraer y Fidelizar Clientes. Santiago de Compostela: C.E.E.I Galicia. Quiroa, M. (2020). Captación de clientes. Recuperado de https://economipedia.com/definiciones/captacion-de-clientes.html [Consulta: 22 de marzo de 2021]. Ribeiro, J., Lima, R., Eckhardt, T., & Paiva, S. (2019). Robotic Process Automation and Artificial Intelligence in Industry 4.0 – A Literature review. Procedia Computer Science, 181, 51-58. doi: https://doi.org/10.1016/j.procs.2021.01.104 Rico, H. (2012) Empleo de la regresión logística ordinal para la predicción del rendimiento académico. Heredia Rico Investigación Operacional. Wittenberg.

69


http://www.invoperacional.uh.cu/index.php/InvOp/article/view/415 [Consulta: 29 de abril de 2021]. Sánchez, J. (2021). Implementing the RECONAC Marketing Strategy for the Interaction and Brand Adoption of Peruvian University Students. Applied Biosciences and Bioengineering, 11(5), 2131-2140, doi: https://doi.org/10.3390/app11052131 Saura, J., & Palos, P. (2017); Cerdá Suárez, LM Comprensión del entorno de marketing digital con KPIs y analítica web. Future Internet. Future Internet, 9(4), 76 doi: https://doi.org/10.3390/fi9040076 Simek, D., Sperka R. (2019). How Robot/human Orchestration Can Help in an HR Department: A Case Study from a Pilot Implementation. Organizacija 52(3), 204217. doi: https://doi.org/10.2478/orga-2019-0013 Taulli, T. (2020). The Robotic Process Automation Handbook: A Guide to Implementing RPA Systems. Berkeley: Apress. Tripathi, A. (2018). Learning Robotic Process Automation: Create Software robots and automate business processes with the leading RPA tool - UiPath. Birmingham: Packt Publishing, Limited. Vara, A. (2012). Desde la idea hasta la sustentación: siete pasos para una tesis exitosa. Un método efectivo para las ciencias empresariales. Lima: Universidad San Martín de Porres. doi: https://doi.org/10.13140/RG.2.1.2238.4080 Han, J. (2018, 1 marzo). Developing a Risk Group Predictive Model for Korean Students Falling into Bad Debt. Wiley Online Library. https://doi.org/10.1111/asej.12139 Fagerland, M. W. (2008, 20 septiembre). Multinomial goodnessâofâfit tests for logistic regression models. Wiley Online Library. doi: https://doi.org/10.1002/sim.3202 Kanapickiene, R., & Spicas, R. (2019). Credit risk assessment model for small and microenterprises: The case of Lithuania. Risks, 7(2), 1-23. doi: https://doi.org/10.3390/risks7020067

Yu Y. y Cai Sh. (2007). A new approach to customer targeting under conditions of information shortage. Marketing Intelligence & Planning, 25(4). doi: https://doi.upc.elogim.com/10.1108/02634500710754583

70


6

ANEXOS

Anexo 1. Azure Machine Learning

Anexo 2. Azure Databriks

71


Anexo 3. Azure Functions

Anexo 4. Container Instances

72


Anexo 5. API Management

73


Anexo 6. Azure Analysis Services

Anexo 7. Soporte Azure

Anexo 8. RPA Power Automate

74


75


Turn static files into dynamic content formats.

Create a flipbook
Issuu converts static files into: digital portfolios, online yearbooks, online catalogs, digital photo albums and more. Sign up and create your flipbook.