Construcción de ontologías [4.1] ¿Cómo estudiar este tema? [4.2] Generación manual de ontologías [4.3] Algunas metodologías
TEMA
[4.4] Methontology
TEMA 4 – Esquema
Uschold y Grüninger On-ToKing y Fox Knowledge
Generación manual
IDEF5
SENSUS
Metodologías
Noy y MacGuinness
Construcción de ontologías
DILIGENT
UPON
Evaluación
Codificación
Formalización
Conce ptualización
Espe cificación
METHONTOLOGY
Web semántica y tecnologías 2.0
Esquema
Web semántica y tecnologías 2.0
Ideas clave 4.1. ¿Cómo estudiar este tema? En el tema anterior se han visto técnicas básicas para la web semántica: lenguajes de representación, consulta, inferencia, etc. La construcción de una aplicación para la Web Semántica, comenzando por la construcción de las ontologías utilizadas, es un proceso altamente complejo. Es por ello por lo que es necesario aplicar metodologías que, de forma guiada, nos permitan aplicar un proceso sistemático y riguroso para la construcción de las ontologías. En primer lugar se presentan aquellas fases que suelen ser incluidas en la construcción de cualquier ontología, con independencia de que se siga una metodología determinada. El proceso de construcción de ontologías “de forma manual” es un arte más que una técnica. Cada ingeniero de conocimiento tiene su propio estilo y los resultados pueden ser diferentes aún cuando el objetivo es el mismo. Sin embargo existe un conjunto de actividades que suelen incluirse, en mayor o menor medida, en el proceso de construcción de una ontología, sea cual sea el estilo para hacerlo. La aplicación reiterada del mismo estilo de construcción de ontologías, y el éxito de estos estilos, provoca que acaben convirtiéndose en metodologías. Existen múltiples metodologías para la construcción de ontologías. De hecho, la Ingeniería de Conocimiento es un ámbito de investigación vivo, en el que todavía existen múltiples cuestiones que deben ser resueltas. En este tema presentamos algunas de las metodologías más empleadas, como Uschold y King, Grüninger y Fox, On-ToKnowledge, IDEF5, SENSU, Noy y McGuinness, DILIGENT o UPON. No se trata de métodos completamente ortogonales, sin solape entre ellos. De hecho, la situación es más bien la contraria. La mayor parte de las metodologías comparten muchas de sus fases y existen actividades que se repiten en unas u otras. No debe sorprendernos este hecho cuando todas comparten el mismo objetivo: construir una ontología que represente de la forma más cercana a la realidad un dominio o ámbito de interés.
TEMA 4 – Ideas clave
Web semántica y tecnologías 2.0
Le dedicamos especial atención a una de estas metodologías: METHONTOLOGY. Se trata de una metodología madura, reconocida internacionalmente e incluso avalada por la FIPA (Foundation for Intelligent Physical Agents), y con múltiples casos de éxito. Además es una metodología que tiene su origen en una universidad española, la facultad de informática de la Universidad Politécnica de Madrid. En esta metodología se identifican una serie de etapas: especificación, codificación, formalización, codificación y evaluación. Asimismo, se define con suficiente claridad cuáles son los objetivos y resultados de cada una de estas fases. En este tema se presentan algunos de los principios fundamentales para la construcción de ontologías. Se identifican múltiples alternativas sin profundizar en demasía en ninguna de ellas. Únicamente se realiza una descripción un poco más detallada de una de las metodologías más utilizadas: METHONTOLOGY. Se recomienda al alumno la lectura del tema y, a continuación, consultar alguna de las referencias, al menos sobre METHONTOLOGY para poder tener una visión complementaria a la aquí presentada sobre los principios de esta metodología. El alumno interesado en profundizar tanto en METHONTOLOGY como en alguna de las otras metodologías identificadas, dispone de las referencias adecuadas en la sección Lo + Recomendado, las cuales puede incluso, complementar con aquellas incluidas en + Información. El material contenido a continuación debe ser suficiente para conseguir el objetivo primario de este tema: que el alumno se familiarice con los conceptos y artefactos básicos del proceso de construcción de ontologías.
4.2. Generación manual de ontologías La generación manual de ontologías es considerada más un arte que una técnica. Cada Ingeniero de Conocimiento tiene su propio estilo y ello se refleja en el resultado final. Existen sin embargo una serie de pasos que podemos considerar como “recomendables” a la hora de crear una ontología.
TEMA 4 – Ideas clave
Web semántica y tecnologías 2.0
Pasos “recomendables” a la hora de crear una ontología: Determinar el ámbito de actuación Reutilización Enumeración de los términos relevantes Definición de una taxonomía Identificar las propiedades de las clases que se identifiquen Definir facetas Definición de instancias Comprobación de anomalías
Determinar el ámbito de actuación. El desarrollo de una ontología no es un objetivo por sí mismo. Es necesario tener muy claro cuál es el objetivo de este desarrollo, qué es lo que queremos modelar y con qué finalidad. Aclarar estas dos cuestiones es fundamental para centrar los esfuerzos del Ingeniero de Conocimiento. Se puede trabajar sobre un mismo dominio y llegar a ontologías completamente diferentes dependiendo del propósito. Reutilización. Es importante realizar un esfuerzo importante para localizar posibles ontologías pre-existentes y que podamos reutilizar, aunque sea parcialmente, para la construcción de nuestra ontología objetivo. Enumeración de los términos relevantes. Un primer paso es identificar una lista de los términos que se utilizan en el dominio de actuación y que, por lo tanto, pueden ser importantes en nuestra ontología. El orden no es relevante en esta lista. Definición de una taxonomía. A partir de la lista anterior, y siempre que sea posible, es conveniente establecer una primera relación entre términos a través de la identificación de una taxonomía en la que se recojan los términos identificados.
TEMA 4 – Ideas clave
Web semántica y tecnologías 2.0
Identificar las propiedades de las clases que se identifiquen. Por ejemplo, una propiedad de los mamíferos es que nacen del vientre de su madre. Es importante tener en cuenta a la hora de definir la taxonomía de clases, que todos los “hijos” de una determinada clase deben heredar todas y cada una de sus propiedades. Eso significa que si decimos que un oso “es un” mamífero, es decir que está por debajo en la taxonomía, entonces estamos diciendo que los osos nacen del vientre de sus madres. Definir facetas. Consiste en redefinir la propiedades anteriores identificando su: o cardinalidad o valores requeridos o características relacionales, como por ejemplo, simetría, transitividad, etc. Para incluir facetas es necesario hacer uso de la potencialidad ofrecida por OWL. Definición de instancias. Las ontologías definen las características de las clases identificadas en un dominio. La definición de una ontología no es un objetivo por sí mismo. Se utilizan para modelar los objetos o artefactos de un dominio siguiendo las directrices que se establecen en la ontología. Este paso consiste en identificar las instancias para la ontología. Podemos por ejemplo, definir una ontología para describir el personal que trabaja y estudia en una universidad. Para ese caso, este paso consistiría en generar una instancia por cada una de las personas concretas que trabajan y estudian en la universidad. Comprobación de anomalías. La ontología impone una serie de restricciones que se pueden comprobar en las instancias que forman parte de la ontología. Podemos, por ejemplo, verificar que un objeto cumple con las condiciones de cardinalidad de la clase a la que pertenece, o las características relacionales, o las restricciones de rango y dominio, etc. Cada una de las metodologías que se presentan en la siguiente sección profundiza más o menos en cada uno de los puntos anteriores, redefiniéndolos o extendiéndolos según el perfil de la metodología. El establecimiento de un conjunto de reglas y guías para la aplicación de los pasos anteriores, u otros similares, es lo que diferencia unas metodologías de otras.
TEMA 4 – Ideas clave
Web semántica y tecnologías 2.0
4.3. Algunas metodologías En la literatura podemos encontrar una cantidad significativa de propuestas metodológicas para el desarrollo de ontologías. Estas propuestas están basadas, en mayor o menor medida, en las técnicas y métodos de desarrollo propios del ámbito de la Ingeniería de Software, tales como el proceso definido en el estándar IEEE 1074, el Proceso Unificado de Desarrollo Software
o incluso en la Programación Extrema
(Extreme Programming). A pesar de la existencia de distintas propuestas metodológicas para la creación y desarrollo de ontologías, el desarrollo de modelos semánticos sigue siendo un arte y no una ciencia. Cada grupo de investigación emplea su propia metodología y no existe un estándar claro a seguir. No obstante, sí existen propuestas más y menos maduras y con un mayor o menor apoyo tras ellas. A continuación se describen algunas de éstas. Uschold y King La propuesta realizada por Uschold y King está basada en la experiencia adquirida tras el desarrollo de la Enterprise Ontology. Constituye una de las primeras propuestas formales acerca de la necesidad de desarrollar una metodología para abordar el desarrollo de un modelo semántico. El método Uschold y King se fundamenta en la definición de un pequeño número de etapas básicas para el proceso, centradas en la localización e identificación temprana de conceptos y relaciones clave del dominio.
Las distintas etapas consideradas son: Identificación del propósito Construcción de la ontología Evaluación Documentación
TEMA 4 – Ideas clave
Web semántica y tecnologías 2.0
Identificación del propósito: debe definirse el uso que se le va a dar, el rango de usuarios potenciales y un conjunto de preguntas de competencia que guíen a los desarrolladores en el proceso de creación de la ontología. Construcción de la ontología: mediante la “Captura” de la ontología, su “Codificación” (representación de la conceptualización en algún lenguaje formal) y su “Integración” con ontologías existentes.
La Captura de la ontología consta de las siguientes actividades: La identificación de conceptos y relaciones clave, para lo cual se recomienda seguir una estrategia de identificación middle-out, es decir, partir de los conceptos más relevantes y definir los restantes a través de procesos de generalización o especialización Definiciones textuales precisas de los conceptos y relaciones Identificación de términos adecuados para definir los conceptos y relaciones Revisión y evaluación de los pasos anteriores
Evaluación: no se detalla esta etapa. Simplemente se referencia a la definición de evaluación como la realización de un juicio técnico de la ontología, su contexto y documentación asociados, con respecto a un marco de referencia (que pueden ser especificaciones de requisitos, preguntas de competencia o bien el mundo real). Documentación: una de las barreras más importantes que imposibilita el uso compartido de bases de conocimiento y ontologías es la documentación deficiente. Por ello, se considera fundamental documentar todos aquellos supuestos relevantes, así como los principales conceptos definidos en la ontología y las primitivas usadas para expresar las definiciones de ésta. Este modelo metodológico no especifica de forma concreta cómo debe llevarse a cabo dicha labor de documentación. Grüninger y Fox Esta metodología nace a raíz de la experiencia alcanzada en el desarrollo del proyecto TOVE (TOronto Virtual Enterprise). Considera que el proceso de creación de ontologías está motivado por los distintos escenarios que surgen a la hora de utilizar las aplicaciones.
TEMA 4 – Ideas clave
Web semántica y tecnologías 2.0
Las distintas etapas contempladas por este método son : Captura de escenarios motivadores que sirvan como muestra de los problemas a resolver Formulación de preguntas de competencia en un lenguaje informal Especificación de la terminología mediante la creación de un glosario de términos de utilidad Definición de axiomas, que han de ser necesarios y suficientes para expresar las preguntas de competencia y caracterizar sus soluciones Definición de teoremas de completitud, que describen las condiciones bajo las cuales las soluciones a las preguntas de competencia son completas.
On-To-Knowledge La definición de la metodología On-To-Knowledge parte de la experiencia de sus desarrolladores en la utilización del proceso metodológico METHONTOLOGY (ver apartado siguiente). Las etapas consideradas en esta metodología son las siguientes: Estudio de viabilidad del proyecto: son muchos los aspectos, no solo técnicos, que condicionan el éxito o fracaso de un sistema. Para analizar estos factores se considera necesario la realización de un estudio de viabilidad. Esta parte de la metodología está basada en el proceso metodológico CommonKADS y comprende las actividades: o Identificación y descripción del problema o Estudio de viabilidad económica y técnica o Estudio del modelo de negocio o Decisión de las medidas organizativas y estudio de integración de la nueva solución Arranque: el estudio de viabilidad determina la decisión sobre si continuar o no un determinado proyecto y sirve como punto de partida para la primera fase de desarrollo de la ontología, el arranque o kickoff. La finalidad del arranque es la creación de un documento que contenga información sobre el objetivo, dominio y ámbito de la ontología, aplicaciones soportadas, fuentes de conocimiento, usuarios potenciales, escenarios de uso y preguntas de competencia.
TEMA 4 – Ideas clave
Web semántica y tecnologías 2.0
Refinamiento: en esta etapa se parte de la definición de una taxonomía base o raíz, que se irá completando hasta obtener una ontología objetivo mediante labores iterativas de conceptualización, formalización y refinamiento. Evaluación: verificación del cumplimiento de los requisitos capturados en el documento de especificación inicial (se comprueba que se satisfacen las preguntas de competencia identificadas) y prueba del modelo definido en el entorno propio de su aplicación. Mantenimiento: se considera de especial importancia la existencia de una herramienta que permita el control de distintas versiones de la ontología y la creación de distintos grupos de desarrollo. IDEF5 La metodología IDEF5 fue definida por Knowledge Based Systems Inc. en 1994. Su principal
objetivo
es
facilitar
el
diseño,
desarrollo,
modificación
y
mantenimiento de ontologías. Es uno de los pocos procesos metodológicos que tiene en cuenta el sistema entero y sus protocolos. Como los análisis ontológicos son por necesidad procesos abiertos a múltiples interpretaciones, se considera que no es prudente adoptar un “recetario” a seguir ciegamente en el desarrollo de ontologías. Por ello la metodología IDEF5 es un procedimiento general que plantea una serie de guías o hitos a conseguir. En IDEF5 se consideran cinco actividades principales: Organización y definición del proyecto, donde se establece el propósito, el contexto, los objetivos, los requisitos y los aspectos de gestión del proyecto de construcción de la ontología Recolección de datos, donde se realiza el análisis del dominio, se consulta con expertos y se identifican fuentes de conocimiento Análisis de datos, donde se define una primera conceptualización informal del dominio Desarrollo de una ontología inicial, donde se identifican protoconceptos Refinamiento y validación de la ontología, donde se refinan, de forma iterativa, los protoconceptos, añadiendo relaciones y axiomas hasta que se alcanzan los objetivos de partida
TEMA 4 – Ideas clave
Web semántica y tecnologías 2.0
SENSUS SENSUS es una ontología definida por el Natural Language Group de la University of Southern California orientada al desarrollo de aplicaciones de traducción de textos. Incluye un conjunto de términos organizados en un árbol jerárquico, de tal forma que cada concepto del árbol corresponde a un sentido determinado de una palabra. A partir de esta ontología ha surgido una metodología de desarrollo que parte de los conceptos abstractos definidos en SENSUS para añadirle un conjunto de términos de nivel más bajo específicos del dominio que se desea modelar. El objetivo es crear sistemas fácilmente integrables con otras ontologías, donde se facilite la actualización y refactorización de éstas. Las distintas etapas consideradas por este método son: Elección de términos raíz , en la que el experto del dominio identifica y selecciona una serie de términos imprescindibles Enlace de términos raíz, donde los términos raíz son insertados bajo la jerarquía definida por SENSUS; Inclusión de conceptos, donde aquellos conceptos que se encuentran en la ruta que va de los nuevos términos añadidos hasta la raíz de SENSUS son añadidos a la ontología; Añadido de conceptos, donde se añaden aquellos conceptos relevantes que aún no hayan sido incluidos; Añadido de sub-estructuras, donde se incorporan, de forma manual, aquellos nodos recorridos por numerosas rutas y su subárbol correspondiente; y Añadido final de conceptos, en la que se incorporan los términos que se consideran relevantes para el dominio y que aún no hayan sido incluidos. Noy y McGuinnes Este método se desarrolló como ejemplo de construcción de ontologías OWL con la herramienta Protégé. Actualmente es muy popular debido a su sencillez y, sobre todo, a la popularidad que ha alcanzado Protégé. Considera una ontología como una descripción explícita y formal de conceptos (clases) en un dominio de discurso. Estas clases tienen una serie de propiedades (slots o roles), que describen las características y atributos del concepto, y restricciones sobre los slots (facetas).
TEMA 4 – Ideas clave
Web semántica y tecnologías 2.0
En este método se proponen las siguientes actividades: Determinación del dominio y alcance de la ontología Consideración de reutilización de otras ontologías o modelos de metadatos existentes Listado de términos fundamentales Definición de clases y jerarquía taxonómica Definición de la propiedades de las clases Definición de restricciones de las propiedades Creación de instancias DILIGENT DILIGENT (Distributed, evolvInG and Loosely-controlled setting) no se centra en el diseño en la fase inicial de la ontología, sino en su evolución. Considera útiles los métodos clásicos como METHONTOLOGY u On-To-Knowledge de cara al diseño inicial y expande estos métodos centrándose fuertemente en la visión de los usuarios y en el uso que éstos hagan de ella, así como de los cambios que precisen realizar. Se acentúa de esta forma el papel de una conceptualización compartida entre una amplia comunidad de usuarios. DILIGENT comprende cinco actividades principales: Construcción. Creación de una versión pequeña, consensuada de la ontología a compartir. No se requiere que esta ontología sea completa. Adaptación local. Los usuarios trabajan con el núcleo de la ontología y lo adaptan a sus necesidades. Análisis. Se analizan las distintas ontologías locales y las peticiones de cambios sugeridas por los usuarios. Un comité central identifica los patrones comunes y selecciona los cambios a ser introducidos en la ontología común compartida. Revisión. El comité de expertos debe revisar la ontología compartida para garantizar que las ontologías locales no diverjan en exceso del núcleo central. Actualización local. Los usuarios actualizan su versión local de la ontología a la nueva versión compartida liberada.
TEMA 4 – Ideas clave
Web semántica y tecnologías 2.0
UPON UPON (Unified Process for ONtology building) es una metodología de construcción de ontologías basado en el bien conocido y ampliamente aceptado Proceso Unificado de Desarrollo Software, que emplea, además, el Lenguaje de Modelado Unificado (UML) a la hora de generar los distintos diagramas necesarios para documentar el proceso de creación de la ontología. El proceso es por naturaleza iterativo, puesto que cada actividad se repite múltiples veces, centrando la atención en aspectos distintos, e incremental, puesto que en cada ciclo la ontología es detallada con mayor precisión y extensión, y está fuertemente orientado al empleo de casos de uso. La naturaleza incremental de UPON requiere en primer lugar de la identificación de los términos relevantes de un dominio, agrupados en un “lexicon”. Este lexicon será progresivamente enriquecido con definiciones para conformar un glosario, al que se le irán añadiendo en las distintas iteraciones las relaciones ontológicas básicas, generándose así un “thesaurus”. Los posteriores añadidos y un proceso de formalización final engendrarán la ontología de referencia buscada. Siguiendo la filosofía del Proceso Unificado, podemos diferenciar ciclos, fases, iteraciones y flujos de trabajo o secuencias (workflow).
Cada fase es a su vez dividida en distintas iteraciones, teniendo lugar dentro de cada una de estas iteraciones, cinco flujos de trabajo distintos: requisitos, análisis, diseño, implementación y evaluación.
TEMA 4 – Ideas clave
Web semántica y tecnologías 2.0
Debe tomarse en consideración el hecho de que los flujos o secuencias de trabajo y las fases son ortogonales en el sentido de que la contribución de cada flujo de trabajo a una iteración de una fase puede ser más o menos significativa. Así, en las primeras iteraciones, se realizan especialmente labores de identificación de requisitos (identificación del dominio, ámbito de la ontología, etc.) mientras que posteriores iteraciones se centrarán en realizar añadidos incrementales a la ontología que darán lugar, eventualmente, a la ontología final.
4.4. Methontology METHONTOLOGY es una metodología desarrollada por el Laboratorio de Inteligencia Artificial de la Universidad Politécnica de Madrid, muy madura, de un alto grado de especificidad en los pasos que plantea y apoyada por la FIPA (Foundation for Intelligent Physical Agents). Las distintas actividades propuestas para la creación de una ontología son divididas en las siguientes categorías: Actividades de gestión: en esta categoría se encuentran las actividades de planificación de las tareas a realizar y recursos necesarios, control de la realización de dichos trabajos y verificación de la calidad del producto final. Actividades técnicas: se orientan al desarrollo de la ontología. En esta categoría se establecen las siguientes fases:
Fases dentro de las actividades técnicas: Especificación Conceptualización Implementación
TEMA 4 – Ideas clave
Web semántica y tecnologías 2.0
o Especificación: origina un documento en el que se explicita el objetivo de la ontología, ámbito y nivel de granularidad. o Conceptualización: se encarga de estructurar y organizar un conjunto de conocimientos anárquicos, empleando para ello un conjunto de representaciones intermedias independientes de los lenguajes y entornos a utilizar en la implementación. METHONTOLOGY presta especial atención a la especificación de las actividades comprendidas dentro de esta categoría, estableciendo el orden de ejecución de ésta, entre las que nos encontramos:
o Implementación: la ontología es formalmente representada mediante un lenguaje de definición de ontologías. Mantenimiento:
en
METHONTOLOGY
se
consideran
las
labores
de
mantenimiento de la ontología desarrollada durante su ciclo de vida, aunque no se establecen guías al respecto.
TEMA 4 – Ideas clave
Web semántica y tecnologías 2.0
Actividades de soporte: estas actividades son efectuadas al mismo tiempo que se desarrolla la ontología. Se engloban dentro de esta categoría procesos tales como: adquisición del conocimiento (entrevistas con expertos, análisis de textos, etc.), labores de integración entre distintas ontologías, gestión de la configuración para facilitar el mantenimiento y el control de los cambios, y la labor de documentación, vital a lo largo de todo el proceso de creación de la ontología. Fase de Especificación Es importante clarificar por qué se construye un modelo semántico y cuáles son sus usos intencionados al principio del proceso de construcción El Modelo de Especificación (es decir, el conjunto de documentos generados en esta etapa) tiene un doble propósito: por un lado, sirve como punto de partida para las tareas iniciales de la fase de Conceptualización y, por otro lado, se utilizará, en la fase de Evaluación, para verificar el modelo construido. En esta fase se utiliza un lenguaje informal, el lenguaje natural, pero debe ser lo más preciso posible. Consta de las siguientes tareas:
Fase de especificación: Concretar el dominio de interés y el ámbito Definir el propósito Identificar preguntas de competencia Identificar fuentes de información externas
Concretar el dominio de interés y el ámbito: es importante clarificar y delimitar, en la medida de lo posible, el dominio de interés y el ámbito del modelo semántico desde el principio del proceso de construcción con el fin de concentrarse, en las fases siguientes, exclusivamente en la parte del mundo (Universo de Discurso) que se desea modelar. Definir el propósito: concretar el uso que se le va a dar al modelo semántico en las etapas iniciales facilita en gran medida el establecimiento de los compromisos ontológicos adecuados a la finalidad prevista.
TEMA 4 – Ideas clave
Web semántica y tecnologías 2.0
Identificar preguntas de competencia: una forma de determinar el alcance del modelo semántico es bosquejar una lista de preguntas que la Base de Conocimiento que utilice el modelo semántico construido deberá ser capaz de responder. Estas son las denominadas preguntas de competencia. Estas preguntas, elaboradas en lenguaje natural en esta fase, permiten en la fase de Evaluación, una vez formalizadas en un lenguaje de consultas apropiado, verificar el modelo semántico construido. Identificar fuentes de información externas: es necesario identificar fuentes de información, modelos de datos, estándares/especificaciones u otras ontologías externas que puedan ser de interés. Fase de Conceptualización El objetivo de esta fase es organizar y estructurar, de forma semi-formal, el conocimiento tácito presente en el dominio de interés. Se utilizan en esta etapa descripciones en lenguaje natural y representaciones gráficas que puedan ser fácilmente interpretadas por expertos en el dominio que no estén familiarizados con la notación propia de los formalismos matemáticos y los lenguajes de Representación del Conocimiento. La construcción de un modelo conceptual consistente y completo es una operación compleja que involucra la realización de varias tareas interdependientes (aquí sólo presentamos las más relevantes):
Tareas dentro de la fase de conceptualización: Construcción de un glosario Identificación de conceptos y jerarquía de conceptos Identificación de relaciones binarias Identificación de reglas lógicas
TEMA 4 – Ideas clave
Web semántica y tecnologías 2.0
Construcción de un glosario: siempre es conveniente disponer de una lista integral de términos pertenecientes al dominio de interés sin preocuparse inicialmente de si estos términos representan conceptos o propiedades de conceptos. La identificación de términos relevantes se realiza fundamentalmente a partir del estudio de las fuentes externas en el dominio. Identificación de conceptos y jerarquía de conceptos: a partir del glosario de términos es necesario extraer un conjunto de conceptos (y, paralelamente, un conjunto de relaciones entre conceptos), organizados jerárquicamente. Para la construcción de esta jerarquía de conceptos se procede de forma gradual y evolutiva, es decir, a partir de unos conceptos base identificados precozmente (extraídos directamente de los términos identificados), éstos serán refinados utilizando una estrategia híbrida que combine la técnica top-down y la técnica bottom-up.
Técnica top-down
Técnica bottom-up
Se identifican nuevos conceptos especializando uno dado
Se identifican nuevos conceptos a partir de la generalización de otros
El resultado de esta tarea es un diccionario de conceptos que incluye su descripción textual, sus atributos o propiedades asociadas y una representación gráfica de las relaciones jerárquicas entre conceptos. Identificación de relaciones binarias: la mera identificación de conceptos aislados (o simplemente relacionados mediante asociaciones jerárquicas) no proporciona el suficiente potencial expresivo para satisfacer las preguntas de competencia. Es necesario identificar las relaciones existentes entre los individuos pertenecientes a diferentes conceptos. Para estas relaciones se debe establecer, además de su descripción textual, su dominio y rango, así como su cardinalidad. Identificación de reglas lógicas: los conceptos y las relaciones binarias entre conceptos no permiten representar parte del conocimiento tácito presente en el dominio de interés (o bien es complicado representarlo utilizando exclusivamente conceptos y relaciones). En muchas ocasiones es más apropiado y sencillo recoger el conocimiento heurístico como reglas lógicas, que serán enunciadas como proposiciones con un antecedente y un consecuente.
TEMA 4 – Ideas clave
Web semántica y tecnologías 2.0
Fase de Formalización Una vez obtenido el modelo conceptual del dominio de manera semi-formal, el siguiente paso es precisarlo utilizando los mecanismos que proporciona la Lógica Formal. En METHONTOLOGY la fase de formalización es opcional. Algunos autores no contemplan la fase de formalización de forma independiente, pero sí utilizan parcialmente los mecanismos de la Lógica Formal en la propia fase de conceptualización, acompañando las descripciones textuales de los conceptos y relaciones con descripciones formales basadas en los mecanismos de la Lógica Descriptiva. Esta fase se descompone en dos tareas: Definición de un modelo ontológico: los conceptos y relaciones binarias identificadas en la fase de conceptualización se utilizarán para desarrollar un modelo ontológico aplicando los formalismos de la Lógica Descriptiva. Asimismo, el modelo incluirá aquellas reglas heurísticas que puedan ser representadas en Lógica Descriptiva. Definición de un modelo heurístico: las reglas lógicas restantes se representarán utilizando cláusulas tipo Horn. Fase de Codificación El modelo formal construido en la fase anterior es necesario codificarlo en alguno de los lenguajes recomendados por el W3C utilizando las herramientas apropiadas. La codificación es necesaria para poder utilizar el Modelo Semántico desarrollado con los motores de inferencia existentes. La herramienta de construcción de ontologías más apropiada para hacer la codificación es Protégé, por su flexibilidad, versatilidad, facilidad de uso y amplia difusión. Esta fase se descompone en dos tareas: Desarrollo de una ontología utilizando OWL. Definición de un conjunto de reglas utilizando SWRL.
TEMA 4 – Ideas clave
Web semántica y tecnologías 2.0
Fase de Evaluación Aunque la auténtica capacidad funcional del modelo semántico desarrollado no se puede juzgar más que tras su empleo en una aplicación determinada, es conveniente evaluarlo antes de su utilización con el fin de determinar prematuramente deficiencias potenciales. Los autores de Methontology proponen tres tipos de evaluación:
Verificación: La verificación de la ontología se refiere a la correcta construcción de la misma, asegurándose de que sus definiciones implementan correctamente los requisitos de la ontología y las preguntas de competencia y funciona correctamente en el “mundo real”.
Validación: La validación de la ontología se refiere a si las definiciones de la ontología realmente modelan el mundo real para el cual ha sido creada. El objetivo es probar que el modelo del mundo (si existe y es conocido) es compatible con el mundo modelado formalmente.
Valoración: La valoración de la ontología se enfoca en el enjuiciamiento del contenido de la ontología desde el punto de vista del usuario. Diferentes tipos de usuarios y aplicaciones requieren diferentes medios de valorar una ontología.
TEMA 4 – Ideas clave
Web semántica y tecnologías 2.0
Lo + recomendado No dejes de leer… A Semantic Web Primer Antoniou, G.; van Harmelen, F. The MIT Press. Cambridge, Massachussetts. London, England. ISBN: 978-0-262-01242-3. Se trata de una referencia muy complete sobre los principales asuntos tratados en este tema. Para el estudio de este tema es especialmente relevante el capítulo 7 sobre Ontology Engineering. El documento está disponible en el aula virtual y en la siguiente dirección web: http://cesimo.ing.ula.ve/~jacinto/recuperacion/sw.pdf
METHONTOLOGY: From ontological art towards ontological Engineering FERNÁNDEZ, M.; GÓMEZ-PÉREZ, A.; JURISTO, N. AAAI Technical Report 1997. En este artículo de los autores de METHONTOLOGY se presentan los principios básicos de esta metodología. El artículo está disponible en el aula virtual y en la siguiente dirección web: http://www.aaai.org/Papers/Symposia/Spring/1997/SS-97-06/SS97-06-005.pdf
TEMA 4 – Lo + recomendado
Web semántica y tecnologías 2.0
Overview and analysis of methodologies for building ontologies FERNÁNDEZ, M., & GÓMEZ, A. The Knowledge Engineering Review, 17 (2), 129-156. En este artículo se realiza una descripción de las principales ontologías para la construcción de ontologías. El artículo está disponible en el aula virtual y en la siguiente dirección web: http://www.civ.utoronto.ca/sect/coneng/i2c/Civ1283/Civ1283-Ref-Final/Civ1283Advanced%20Ref/Ontology/onto%20methods.pdf
Towards a Methodology for Building Ontologies USCHOLD, M., & KING, M.. Workshopon Basic Ontological Issues in Knowledge Sharing 1995. En este artículo se describen los principios básicos de la metodología Uschold & King. El artículo está disponible en el aula virtual y en la siguiente dirección web: http://citeseer.ist.psu.edu/viewdoc/download?doi=10.1.1.55.5357&rep=rep1&type=pdf
Methodology for the Design and Evaluation of Ontologies GRÜNINGER, M., & FOX, M. Workshop on Basic Ontological Issues in Knowledge Sharing, IJCAI-95. Montreal. Aquí se presenta la metodología Grüninger & Fox. El artículo está disponible en el aula virtual y en la siguiente dirección web: http://ibict.phlnet.com.br/anexos/grninger95methodology.pdf
TEMA 4 – Lo + recomendado
Web semántica y tecnologías 2.0
On-To-Knowledge Methodology -Baseline Version SCHNURR, H., SURE, Y., STUDER, R., & AKKERMANS, H. (2000). OnToKnowledgeDeliverable Project D15. Documento en el que se presenta la metodología On-To-Knowledge. El artículo está disponible en el aula virtual y en la siguiente dirección web: http://citeseerx.ist.psu.edu/viewdoc/download?doi=10.1.1.24.3575&rep=rep1&type=p df
IDEF5 Method Report BENJAMIN, P., MENZEL, C., MAYER, R., FILLION, F., FUTRELL, M., DEWITE, P., et al. (1994). Knowledge Based Systems, Inc. Presentación de la metodología IDEF5. El artículo está disponible en el aula virtual y en la siguiente dirección web: http://www.idef.com/pdf/Idef5.pdf
Towards distributed use of largescale ontologies SWARTOUT, B., RAMESH, P., KNIGHT, K., & RUSS, T. (1997). Symposium on Ontological Engineering of AAAI. Artículo en la que se publica la metodología SENSUS. El artículo está disponible en el aula virtual y en la siguiente dirección web: http://www.isi.edu/isd/banff_paper/Banff_final_web/Banff_96_final_2.html
TEMA 4 – Lo + recomendado
Web semántica y tecnologías 2.0
Ontology Development 101: A Guide to Creating Your First Ontology NOY, N., & MCGUINNESS, D. (2001).. Technical Report KSL-01-05, Stanford Knowledge Systems Laboratory. Presentación de la metodología Noy & McGuinness. El artículo está disponible en el aula virtual y en la siguiente dirección web: http://www-ksl.stanford.edu/people/dlm/papers/ontology-tutorial-noymcguinness.pdf
The DILIGENT knowledge processes VRANDECIC, D., PINTO, S., & C. TEMPICH, Y. S. (2005). Journal of Knowledge Management, 9 (5), pp. 85-96. Presentación de la metodología DILIGENT. El artículo está disponible en el aula virtual y en la siguiente dirección web: http://citeseer.ist.psu.edu/viewdoc/download?doi=10.1.1.59.5571&rep=rep1&type=pdf
A proposal for a Unified Process for Ontology building: UPON NICOLA, A. D., MISSIKOFF, M., & NAVIGLI, R. (2005). Lecture Notes on Computer Science, 3588, pp. 655-664. Artículo en el que se presenta la metodología UPON. El artículo está disponible en el aula virtual y en la siguiente dirección web: http://citeseerx.ist.psu.edu/viewdoc/download?doi=10.1.1.154.1324&rep=rep1&type=p df
TEMA 4 – Lo + recomendado
Web semántica y tecnologías 2.0
No dejes de ver… Methontology Presentación en la que se introducen los principios básicos de esta metodología.
La presentación está disponible en el aula virtual y en la siguiente dirección web: http://www.slideshare.net/enanas2382/methontology
TEMA 4 – Lo + recomendado
Web semántica y tecnologías 2.0
+ Información Webgrafía Protege Ontology Editor Página de la herramienta para la generación de ontologías Protégé.
http://protege.stanford.edu/
Bibliografía IEEE. (2006). IEEE Standard for Developing a Software Project Life Cycle Process. IEEE Standard, New York (EE. UU.): Institute of Electrical and Electronics Engineers. Jacobson, I., Booch, G., & Rumbaugh, J. (1999). The Unified Software Development Process. Addison Wesley. Beck, K. (1999). Extreme Programming Explained: Embrace Change. AddisonWesley. Uschold, M., King, M., Moralee, S., & Zorgios, Y. (1998). The Enterprise Ontology. AIAI Report, Artificial Intelligence Applications Institute. Grüninger, M., & Fox, M. (1995b). The logic of enterprise modelling. In J. Brown, & D. O'Sullivan (Eds.), Reengineering the Enterprise (pp. 83-98). Chapman and Hall. Schreiber, G., Akkermans, H., Anjewierden, A., de-Hoog, R., Shadbolt, N., Van-deVelde, W.
et al. (1999). Knowledge Engineering and Management: The
CommonKADS Methodology. The MIT Press.
TEMA 4 – + Información
Web semántica y tecnologías 2.0
Horn, A. (1951). On Sentences Which are True of Direct Unions of Algebras. The Journal of Symbolic Logic, 16 (1), pp. 14-21. Baader, F., Calvanese, D., McGuinness, D.L., Nardi, D., & Patel-Schneider, P.F. (Eds.). (2003). The Description Logic Handbook: Theory, Implementation, Applications. Cambridge (Reino Unido): Cambridge University Press.
TEMA 4 – + Información
Web semántica y tecnologías 2.0
Actividades Práctica: Un primer ejemplo con methontology En esta actividad debes aplicar algunos de los pasos de Methontology. Se trata de realizar las primeras fases de la construcción de una ontología siguiendo esta metodología. En particular se pide que se generen los resultados de las siguientes subetapas: Fase de especificación o Definición de interés y ámbito o Definición del propósito o Identificación de preguntas de competencia Fase de conceptualización o Identificación de un glosario de términos o Identificación de conceptos y jerarquía de términos Debes elegir un dominio que te resulte familiar y que se limite la complejidad de la actividad. Por ello únicamente es necesario que se modelen los conceptos y relaciones más importantes. En caso de ser necesario puede consultarse con el profesor previamente al comienzo de la actividad para delimitar la complejidad de esta tarea.
TEMA 4 – + Actividades
Web semántica y tecnologías 2.0
Test 1. OWL permite la definición de facetas de una propiedad. A. Verdadero. B. Falso. 2. ¿Cuáles de los siguientes pasos suelen formar parte de la creación de una ontología? A. Enumerar términos. B. Definir una taxonomía. C. Definir propiedades. D. Todas las anteriores. 3. UPON es la metodología que está más fuertemente basada en el Proceso Unificado de Desarrollo Sofware. A. Verdadero. B. Falso. 4. ¿A qué dominio está orientada la metodología SENSUS? A. Traducción de textos. B. Medicina. C. Biología. D. Ninguna de las anteriores. 5. ¿Cuáles de las siguientes fases forman parte de la metodología On-To-Knowledge? A. Estudio de viabilidad. B. Arranque. C. Refinamiento. D. Todas las anteriores. 6. ¿Cuáles de las siguientes fases forman parte de la metodología Uschold & King? A. Identificación del propósito. B. Construcción de la ontología. C. Evaluación. D. Todas las anteriores.
TEMA 4 – Test
Web semántica y tecnologías 2.0
7. ¿Qué lenguaje se utiliza para definir una pregunta de competencia? A. Lenguaje Natural. B. RDF. C. OWL. D. Ninguna de las anteriores. 8. Identifique la fase de METHONTOLOGY en la cual se identifican preguntas de competencia: A. Fase de especificación. B. Fase de conceptualización. C. Fase de formalización. D. Fase de codificación. 9. Identifique la fase de METHONTOLOGY en la cual se genera el glosario de términos. A. Fase de especificación. B. Fase de conceptualización. C. Fase de formalización. D. Fase de codificación. 10. Identifique el mecanismo que se utiliza para generar el modelo heurístico de METHONTOLOGY A. Lógica descriptiva. B. Cláusulas tipo Horn. C. SWRL. D. OWL.
TEMA 4 – Test