Herramientas y elementos complementarios

HERRAMIENTAS Y ELEMENTOS COMPLEMENTARIOS

Microsoft Ofﬁce es un conjunto de herramientas con el que hoy en día cualquier usuario que requiera hacer cualquier operativa, en la gran mayoría de las situaciones, necesitará usar una o varias de las aplicaciones que te ofrece el paquete.

Dentro de cómo se pueda involucrar el paquete Ofﬁce en la automatización de procesos, además puede servir de apoyo para diversas partes relevantes de este tipo de proyectos.

Usos comunes del paquete dentro de la automatización de un proyecto:

- Generación de ﬁcheros Word requeridos en el propio proceso

- Generación de ﬁcheros Excel, donde se puedan realizar tablas, modiﬁcar los datos para mantenerlos actualizados o calcular nuevos campos en función de lo que vaya sucediendo en el proceso

- Envío de correos especíﬁcos a terceros, con o sin adjuntos. Esto es plenamente parametrizable de estas herramientas.

- Generación de presentaciones con los datos obtenidos durante el proceso

Adicionalmente a estos, Ofﬁce es una herramienta muy útil para que terceros, o usuarios muy relacionados con el proceso automatizado puedan hacer seguimiento de su ejecución y de los resultados obtenidos cada vez que se ejecuta el robot:

- Se suelen generar ﬁcheros Excel donde se registra qué casos ha procesado el robot, y se aporta la información necesaria para poder evaluar el resultado de la ejecución en ese momento. También es una buena forma de identiﬁcar que casos no se han resuelto satisfactoriamente.

- Se puede parametrizar el envío final por correo a los destinatarios que se necesite para que estos puedan recibir un informe escrito de la ejecución del proceso en el propio cuerpo del correo, parametrizando lo que queramos que aparezca en función del éxito del robot durante la secuencia. También, en este correo podríamos adjuntar el fichero de seguimiento previamente comentado para que los usuarios puedan valorar qué tal ha resultado el trabajo realizado por el robot en esa iteración, además de saber en qué punto esta la ejecución del mismo. Con esto me refiero a que el envío del correo puede estar al final del proceso o en un punto intermedio determinado, lo cual aportaría visibilidad al usuario final sobre el estado de la operativa, sin necesidad de acceder a ninguna aplicación o entorno donde se encuentre el robot.

Optical Character Recognision (OCR)

En este tipo de procesos, muchos de ellos están relacionados con el procesado de documentación. Está claro que podemos automatizar los pasos de recogida de los archivos, la manipulación de los mismos y cómo queremos almacenarlos una vez los hemos procesado. Pero el problema puede venir cuando necesitamos leer estos archivos y extraer información de ellos.

Para ello existen aplicaciones capaces de leer estos documentos, con mayor o menor precisión, y extraer los datos para poder procesarlos. Estas aplicaciones se llaman OCRs (Optical Character Recognision) y se especializan en extraer información de diferentes tipos de documentos, independientemente del formato.

La información que puede extraer este tipo de tecnología no tiene por qué ser en formato o letra digital, sino que también puede interactuar con fotos y con letra escrita a mano. Está claro que lo preferible sería el primer caso, ya que las fotos y la escritura manual afecta directamente a la calidad del resultado dependiendo de la calidad de la fotografía o la claridad de la letra escrita.

Para entender la capacidad y la complejidad que puede suponer utilizar este tipo de aplicaciones, merece la pena hablar de los tipos de documentos que nos podemos encontrar, desde la perspectiva de este ejercicio:

- Documentos en función del texto que contienen

◦ Documentos estructurados: estos documentos son aquellos que siempre mantienen un orden, y los datos que se desean extraer siempre se encuentran en el mismo sitio, o siguiendo las mismas reglas. (poner foto de un documento de identidad y de una factura o multa de tráﬁco)

◦ Documentos desestructurados: son aquellos documentos que contienen texto sin seguir ningún patrón fijo, por lo que es complicado definir cómo se puede realizar la extracción de la información que se necesita. Suelen requerir modelos de inteligencia artificial para extraer lo requerido. (poner ejemplos de documentos jurídicos, sentencias o escrituras de viviendas)

- Documentos en función del formato:

◦ Multicapa: estos documentos pueden ser archivos Word, PDF o similares sobre los que se puede extraer el texto directamente del propio documento. Una vez que se reconozca, el propio documento indica qué es texto de la zona donde se pretende extraer la información, lo cual facilita la obtención de los datos y mejora signiﬁcativamente la calidad de los datos (evitando posibles errores).

◦ Imágenes o similar: cuando tenemos algún PDF o imagen sobre la que no podemos seleccionar el texto, es el tipo de documento al que nos referimos aquí. En estos casos, existe una interpretación por parte de la OCR de la que, para los parámetros dados y deﬁnidos, te devuelve un valor para cada caso solicitado. Para estas situaciones, se da por sentado que la calidad del resultado no será tan buena como para el caso anterior, ya que hay algunos factores que afectan directamente a la calidad del resultado, y están fuera de nuestro alcance (claridad de la letra, visibilidad de la foto, ángulo de la foto…)

Dentro de los tipos de Inteligencias Artiﬁciales que hay hoy en día, para este tipo de procesos suelen destacar, hasta la fecha, los modelos de lenguaje natural, o en inglés Natural Language Processing Models (NLPs).

Se suelen utilizar mucho en el análisis de documentación para aquellos casos en los que no es tan fácil parametrizar de donde se quiere extraer la información, ya sea porque no suele estar en los mismos sitios, o porque tenga dependencias de otros elementos del documento.

Estos basan su valor en ser capaces de poder entender el contexto de la documentación que analizan para poder interpretar, en base a lo que se le solicita que extraiga, qué es lo que más se acerca a lo que se requiere.

Por supuesto que no tienen una precisión del 100%, es más, 80% es un nivel de precisión muy aceptable. El valor es la ganancia en tiempos de procesamiento de documentación, ya que, aunque no automatice al 100% el procesado de ciertos tipos de documentación, puede agilizar la actividad proponiendo al usuario que lo supervise que valores pueden ser los que necesite del documento.

Company Profit

Obviamente, todo esto está en continua evolución, y más hoy en día con la introducción de las nuevas inteligencias artiﬁciales generativas, las cuales ya están comenzando a integrarse con las herramientas de RPA.

Modelo de Lenguaje Natural (MLN)

Turn static files into dynamic content formats.

Create a flipbook