1 minute read

Modelos de atención aplicados a clasificación de textos narrativos

Autores Gustavo Andrés Mendez Hernandez Karol Valentina Yate Vega Kevin Stid Peláez Nimisica Angela Sofia Moreno Rodriguez Director Rafael Andres Gonzalez Rivera

Con este proyecto se busca solucionar problemas de negocio asociados al análisis de textos en el contexto específico de la industria audiovisual. El propósito es desarrollar una herramienta que solucione las necesidades del caso WePlot, una startup en el mercado editorial que dentro de su modelo de negocio requiere automatizar el proceso de clasificación de textos narrativos en idiomas portugués o español.

Para ello se utilizaron técnicas del estado del arte en NLP (Natural Language Processing) como las arquitecturas transformers, con el fin de clasificar textos según sus temas y según sus arcos narrativos Vonnegut. Adicionalmente, se propuso un modelo de lenguaje general basado en una combinación de las técnicas propuestas por la arquitectura ALBERT y las tareas de entrenamiento propuestas por ELECTRA. Los resultados de aplicación de estos modelos demuestran alta precisión en análisis de sentimiento y clasificación por géneros, aunque la cantidad y naturaleza de los datos para entrenamiento no permiten predicciones adecuadas de arcos narrativos.

La existencia de un sistema de Software informático en la startup, añade las consideraciones de un modelo flexible y con la posibilidad de ser consumido desde sistemas externos. Además, a largo plazo se consideran impactos positivos en el ámbito social, económico y ambiental, no sólo para la empresa sino para la industria audiovisual, gracias a que MAACT reduciría costos y aumentaría la efectividad de la clasificación de textos, lo cual generaría más interés por parte de los escritores en mostrar sus obras, y de los productores en darle la oportunidad a nuevos talentos.

This article is from: