Study on ietm domain knowledge representation and reasoning based on semantic web

Page 1

Scientific Journal of Information Engineering June 2013, Volume 3, Issue 3, PP.56-62

Study on IETM Domain Knowledge Representation and Reasoning Based on Semantic Web Weiwei Jiang Beijing Aeronautical Technology Research Center, Beijing China, 100076 Email: jiangww0701@163.com

Abstract To make IETM (interactive electronic technical manual) contents understandable to machine and suitable for inference, ontology needs to be established, and the IETM contents should be annotated with metadata which are defined as terms in ontology. The relation between domain knowledge and IETM domain knowledge is explained; the overview of ontology languages for the semantic Web is introduced; based on trade-off between expressivity of knowledge and complexity of reasoning problems, OWL Lite is selected as ontology language; then IETM ontology representation and reasoning for the semantic Web are proposed. From these discussions, the basic situations of domain ontology representation, reasoning and integration for the semantic Web are clarified, so the basic knowledge of developing IETM ontology for the semantic Web is provided. Keywords: Interactive Electronic Technical Manuals; Semantic Web; Domain Knowledge; Representation; Reasoning

基于语义 Web 的 IETM 领域知识表示与推理 姜巍巍 北京航空技术研究中心,北京 100076 要:为了使 IETM(交互式电子技术手册)内容便于机器理解与推理,需要建立本体,同时 IETM 内容应以本体所定

义的元数据进行标注。本文定义了领域知识与 IETM 领域知识之间的关系,概述了语义 Web 的本体语言,权衡了其在知 识表示与推理两方面的利弊,选择 OWL Lite 作为 IETM 本体描述语言,然后完成了 IETM 领域知识的表示与推理。本文 研究成果将 IETM 本体开发归纳为知识表示、推理及集成,使得 IETM 本体开发过程更清晰,更具有操作性。 关键词:交互式电子技术手册;语义 Web;领域知识;表示;推理

引言 现有的IETM是由大量HTML页面组成,其内容对于人而言是可理解的,但对于机器而言是不可理解的, 这使得IETM内容难以由机器做有意义的处理。随着产品复杂程度的增加,IETM内容数量极其庞大且不断在 增长,这又迫切要求IETM内容是机器可理解的,可以由机器做出有意义的自动处理。针对上述问题,借鉴 Tim Berners-Lee提出的语义Web概念,为了让机器能够理解IETM内容并做推理,需要建立IETM知识本体, 根据表达能力和推理效率的综合权衡选择OWL Lite作为本文中使用的本体语言,提出一种基于语义的IETM 领域本体表示、推理方法,利用本体中定义的术语作为元数据来标记IETM的内容。

1 IETM 概述 技术手册(Technical Manual,TM)是关于产品安装、使用、维修和系统培训的出版物,主要目的是对产品 维修人员提供必要的信息。当人员在使用和维修产品时,技术手册是重要的参考与指导。技术手册分为三种 基本类型,分别是操作手册,维修手册和零部件手册。交互式电子技术手册(interactive electronic technical manual,IETM)产生于 20 世纪 90 年代,已成为美国和其他发达国家持续采办与寿命周期保障(Continuous - 56 http://www.sjie.org/


Acquisition and Life-cycle Support, CALS)的重要组成部分。IETM 作为技术手册,其首要任务是支持复杂技术 系统的诊断、维护与维修。IETM 是交互的,可以根据当前条件与用户请求动态地向用户呈现所需信息。IETM 信息源限定了将要显示的特定数据的条件。 IETM 已被证明既可以降低维修费用又可以提高故障维修精度。IETM 的优势使得维修技术人员能够迅速 找到适用的技术信息,并能够很容易地交叉引用相关信息。利用具有先进搜索功能的 IETM,维修人员利用 关键字和零件编码能迅速定位及搜索出相关信息。另外,利用内置的超文本链接,维修人员能够快速访问交 叉引用相关的手册部分,然后迅速返回到原来的位置。图 1 显示了 F-16 飞机的研究结果。IETM 产品故障诊 断所需时间比应用纸质技术手册时间减少了 38%。同时, IETM 使得故障诊断成功率提高了 98%。这些在维 护效率方面的增加直接转化为更低的维护成本和更高的系统可用性。 120 纸质手册 100

IETM

80 IETM

60

纸质手册

40 20 0

故障诊断时间(min)

图1

故障诊断成功率(%)

F-16 IETM 分析

2 IETM 领域知识 “领域知识”(Domain Knowledge),亦称背景知识(Background Knowledge),该词来源于人工智能领域, 主要应用于一些自然语言理解系统和基于知识的专家系统。1999 年 Maja D'Hondt 等人最早在研究报告中给出 了领域知识的明确定义,即“Domain knowledge indicates the collection of concepts existing in a domain, relations between these concepts and constraints on these concepts.”也就是说,领域知识是指在某一领域内的概念、概念 之间的相互关系以及有关概念的约束集合。 随着知识工程的兴起,研究者又从知识工程的角度,给“领域知识”赋予了如下涵义:领域知识是一个 概念化模型,这个概念化模型包含概念和概念之间的关系;领域知识是概念和概念之间的约束;领域知识是 描述如何推导或计算出新概念和新概念之间关系的规则。 在知识发现系统中,把加入的那些有关指导和限制搜索感兴趣知识的知识称为背景知识或领域知识,其 中,并不把领域知识和背景知识进行区分。 由于领域的多样性以及领域知识用来解决问题的方法的差异性,不同学者对领域知识的理解是不一样 的,因此不可能给出一种普遍认可的领域知识定义。例如,在软件工程领域, “领域知识”的定义是:“Knowledge about the environment in which the target system operates”,即“与系统运行环境相关的知识”。 根据 IETM 的实际情况,本文给出“IETM 领域知识”定义:表示产品 IETM 这一特定领域范围内的特 定知识,是在产品论证、研制、生产、使用、保障、退役等寿命周期过程中所产生的描述客观事实的主要概 念及概念之间的相互关系,决策者个人的认识、经验和规律的产品显性知识与产品 IETM 使用过程中隐性知 识的集合。 产品 IETM 领域知识是在实践中所获得的描述客观事实的主要概念,决策者个人的认识、经验和规律的 综合,是产品指挥与决策人员在复杂不确定的环境中为实现目标而采取的有效行动的能力,是进行科学有效 决策的基础。从计算机科学的观点来看,产品 IETM 领域知识是各种与产品保障、人员训练等相关的信息综 合处理的结果,在综合过程中,信息通过相互比较,结合成有意义的链接。 - 57 http://www.sjie.org/


产品 IETM 领域知识的表示模式为: K=F+C+R 其中:——K 表示产品 IETM 领域知识项(Domain Knowledge items); ——F 表示事实(Facts):指对客观世界和世界的状态、属性和特征的描述,以及对事物之间关系的描述。 在产品 IETM 这一特定领域中是指对产品事件本身的发生、发展和结束的演化机理与产品保障资源的时间、 空间、数量和状态等实体及其关系的客观描述; ——C 表示概念(Concepts):指事实(术语)的含义、关系约束的语义说明等; ——R 表示规则(Rules):指能表示在前提与结论之间因果关系的一种形式。 从上述产品 IETM 领域知识的表示模式可以看出,产品 IETM 领域知识是有层次的,即:事实——概念 ——规则——启发式产品 IETM 领域知识四个层次。

3 语义 Web 与本体语言 3.1 语义 Web 互联网的创始人 TimBerners-Lee 提出了语义 Web 的体系结构(如图 1 所示)。XML、RDF 以及本体三

Tr ust

RR ulules es

Pr oof DD atataa Sel Self-fDD esc. esc. Doc. Doc.

DD atataa

Logi c Ont ol ogy vocabul ar y

Di gi t al Si gnat ur e

层主要用于表示语义信息,是语义 Web 系统的核心和关键技术。

RDF+RDFschema XML+NS+XMLschema Uni code

URI

图 2 语义 web 结构

第一层是统一字符编码(Unicode)和统一资源标识符(URI),Unicode 用于对 Web 资源进行编码;URI 提供 Web 资源及资源间关系的唯一标识,作为 Web 的基础。 第二层是 XML 及命名空间(Namespace), 为 Web 提供语法互操作性。 XML 为语义 Web 的建立提供语法基础。 第三层是 RDF+RDF Schema,是一种用于对 Web 资源信息进行描述的语言,被视为数据层。RDF(S)提 供轻量的(lightweight)本体系统以支持 Web 上知识的交换,并为语义 Web 提供了语义互操作性(semantic interoperability)的可扩充基础。 第四层是本体(Ontology),将在更为表示性的知识形式化描述层上提供语义互操作性,其被视为语义层。 本体非常适合于描述 IETM 上各种不同的、分散的、半结构化的信息资源。通过定义共享的、通用的领域知 识,本体帮助人和机器明确地交流,支持语义级的交换,而不仅仅是语法级的。 第五层是规则(Rule)和逻辑框架(Logic Framework)层,通过更强的逻辑规则如一阶谓词逻辑(first order predicate logic),提供更强的知识表示和推理能力。 第六层是验证(Proof),为逻辑推理的依据提供校验或确认,信任(trust)确保证据的完整性。 第七层是签名(Signature)和加密(Encryption),为了保证信息交换的安全问题而设计的,涉及这两层高度 依赖于准确、可信任的语义元数据。

3.2 本体语言 目前常见的本体语言有 XOL、SHOE、OML、RDF(S)、OIL、DAML+ OIL 和 OWL。其中,XOL 和 SHOE - 58 http://www.sjie.org/


的形式化基础是框架,OML 的形式化基础是概念图,但框架和概念图都缺乏精确的语义。而 RDF(S)的表达 能力非常有限,只能算做“原始”的本体语言。为了获得表达能力更强大、能够更精确刻画语义的本体语言, 在继承 RDF(S)的语法和表达能力的基础上,OIL、DAML+OIL 和 OWL DL 都对 RDF(S)进行了扩展。OIL 是 欧洲的研究者们开发的一种本体语言;DAML+OIL 是由美国和欧盟特别主体标记语言委员会开发的,它是 DAML-ONT 与 OIL 相结合的产物;OWL 是 W3C 制定的面向语义 Web 的本体语言,它采用 DAML+OIL 作 为起点,是语义 Web 领域对适合语义 Web 应用的本体语言进行研究的最新成果。 OWL 有 3 个子集:OWL Lite、OWL DL、OWL Full。OWL Lite 的表达能力最有限,推理效率高;OWL DL 在保证推理的完备性和可判定性的前提下,有尽可能强的表达能力;OWL Full 有最强的表达能力,但不 对推理做任何保证。其中 OWL Lite 的形式化基础是 SHIF(D),OWL Lite 的蕴含是 EXPTIME 问题,有实用 的推理算法,比如 FaCT 系统和 RACER 系统就都为 OWL Lite 提供了实用的优化的推理算法;OWL DL 的形 式化基础是 SHOIN(D),OWL DL 的蕴含是 NEXPTIME 问题,尚未找到实用的推理算法。在创建 IETM 领域 领域本体时,需要综合考虑知识表达能力和推理效率,所以本文选择具有实用推理算法的 OWL Lite 作为本 体描述语言。

4 关于 OWL Lite 的预备知识 OWL Lite 是面向语义 Web 的本体语言,下列特点使之适合语义 Web 的要求:OWL Lite 使用 URI 命名 机制;OWL Lite 使用 RDF 数据类型和 XML Schema 数据类型作为数据类型;OWL Lite 以 RDF/XML 作为语 法;OWL Lite 可以使用注释,虽然注释不表示知识,但可以方便阅读;OWL Lite 可以使用本体属性来说明 本体的版本,并导入已经构造好的本体,这样可以利用过去的工作成果,并在新建的本体中说明新建本体中 的术语和导入本体中的术语间的关系。 OWL Lite 所考虑的类、数据类型、对象属性、数据类型属性、个体、数据值、本体属性和注释属性是相 互严格区分的。可给出定义如下:在 OWL Lite 中,设集合 E={所有类的集合,所有数据类型的集合,所有 对象属性的集合,所有数据类型属性的集合,所有个体的集合,所有数据值的集合,所有本体属性的集合, 所有注释属性的集合},则 A, B  E 且 A  B ,有 A  B   。OWL Lite 所考虑的类、数据类型、对象属 性、数据类型属性、个体和数据值可以分别对应描述逻辑所考虑的概念、具体数据类型、抽象角色、具体角 色、个体和值,描述逻辑中所考虑的这 6 种基本元素也是严格相互区分的。 表1

OWL Lite 的描述与所对应的描述逻辑形式表

OWL Lite Syntax

A  I

 

owl:Thing owl:Nothing , Cn

Restriction( R someValuesFrom( C ) ) Restriction( R allValuesFrom( C ))

C1

C2

RC

Restriction( R cardinality( n )) restriction: n is 0 or 1 Restriction( T someValuesFrom( D ) )

T D

Restriction( R minCardinality( n )) Restriction( R maxCardinality( n ))

Restriction( T

allValuesFrom( D ))

Restriction( T

minCardinality( n ))

Restriction( T

maxCardinality( n ))

Restriction( T cardinality( n )) restriction: n is 0 or 1

I

I   I

RC  nR  nR  nR  nR

D (URI reference)

Semantics

A

A (URI reference)

intersectionOf( C1 , C2 ,

DL Syntax

I  

Cn

(C1

Cn)  C1 I

C2

I

I

I

C2

Cn a

  (R C)  a b, (a, b)  R  b  C  (  nR)  a #({b ( | a, b) R })  n (  nR)  a #({b ( | a, b) R })  n

T D  nT  nT  nT  nT D - 59 http://www.sjie.org/

I (RC)  a b, (a, b)  R I  b  C I I

I

I

I

I

I

I

I I I (  nR  nR) (  nR) (  nR)

“ # ”is cardinality of set

(T D)  a b, (a, b)  T I  b  D I I

(T D)  a b, (a, b)  T  b  D I

I

I


OWL Lite Syntax

DL Syntax

R (URI reference) T (URI reference)

R R T

o (URI reference) v (URI reference)

Semantics

(  nT)  a #({b ( | a, b) T I })  n I

(  nT)  a #({b ( | a, b) T })  n I

o v

(  nT

I

 nT) (  nT) (  nT) I

I

I

“ # ” is cardinality of set

D I   DI

RI  I  I I  (R )=( R I) T I   I   ID

oI  I v I   ID 表2

OWL Lite 的公理和事实与所对应的描述逻辑形式

OWL Lite Syntax

语义

DL

A  C1

C

A  C1

C

I

Class( A partial C1

A  C1

Cn )

Class( A complete C1

A  C1

Cn )

C1 

Cn )

DatatypeProperty( T super( T1 ) domain( C1 )

super( Tn )

domain( Cm )

range( D1 )

range( Dl )

[Functional]) SubPropertyOf( T1T2 ) EquivalentProperties( T1

range( C1 )

super( Rn )

domain( Cm ) range( Cl )

Cn

 1T  Ci  T Di  1T T1  T2  Tn

C1I 

T I  CiI   I D

T I   I  DiI

TI

[Functional]

T1I 

[Transitive])

R1 R2 )

EquivalentProperties( R1

Rn )

Individual( o type( C1 )

type( Cm ))

Ci

R I  CiI   I

 RCi

R I   I  CiI

R1 

 Rn

C(o) i

Value( R1o1 )

( Rn on )

R(o,o) i i

Value( T1v1 )

( Tl vl )

T(o,v ) i i

SameIndividuals( o1 DifferentIndividuals( o1

on ) on )

 TnI

R I  RiI

 1R  Tr ( R ) R1  R2

[InverseFunctional]

is Functional

T1I  T2I

R I (R0I)

R  R  1R

[Symmetric]

CnI

T I  T Ii

R  Ri

 1R

I n

C1I  C2I

 Cn

Ti

I n

I

R (R0)

[InverOf( R0 )]

SubPropertyOf(

T

T1 

Tn )

ObjectProperty( R super R1 ) (domain( C1 )

I

C1  C2

SubClassOf( C1C2 ) EquivalentClasses( C1

Cn

I

o1 

 on

oi  o j , i  j

- 60 http://www.sjie.org/

R I (R I) R I is Functional I

-

(R )

is Functional

+ R (R I) R1I  R2I I

R1I 

 RnI

o I  CiI  o I , oiI  RiI  o I , viI  Ti I

oiI  o Ij oiI  o Ij , i  j


在 OWL Lite 中,本体属性描述本体的版本、兼容性等,注释属性可以提供一些注释信息,但两者都不 会对领域本体进行描述,所以本文不把这两个特殊的属性对应到描述逻辑中去。 设 A 表示一个原子概念,C 表示一个概念描述,原子概念和概念描述都是概念; D 表示一个具体数据类 型; R 表示一个原子抽象角色; T 表示一个原子具体角色; o 表示一个个体; v 表示一个值。给出描述逻辑 中解释的定义如下:

在描述逻辑中,解释 I   I ,  ID , I , I 是一个非空集合,且  I   ID   ;  I 是一个解释函数,它将 每个原子概念 A 解释成一个集合 AI ( AI   I ) ,每个具体数据类型 D 解释成一个集合 D I ( D I   DI ) 。每个原 子 具 体 角 色 R 解 释 成 一 个 二 元 关 系 RI (RI  I  I ) , 每 个 原 子 具 体 角 色 T 解 释 成 一 个 二 元 关 系

T I ( I   ID ) ,每个个体 o 解释成一个元素 o I (o I   I ) ,每个值 v 解释成一个元素 v I (v I   DI ) 。 给出 OWL Lite 的一种抽象语法和描述逻辑间的对应关系,如表 1 和表 2 所示为了书写简洁,在本文后 面的例子中采用 OWL Lite 的这种抽象语法来编码。

5 IETM 领域知识表示与推理 基于语义 Web 的 IETM 领域知识表示与推理方法具体过程是: (1) 创建领域术语集——依据所需要解决的任务和所使用本体语言 OWL Lite 的本体承诺,创建 IETM 领 域术语集,此阶段的工作主要是由 IETM 本体工程师来完成的; (2) 创建领域本体——依据 OWL Lite 的语法规则,使用 IETM 领域术语集中的术语,创建 IETM 领域知 识集,IETM 领域本体={IETM 领域术语集,IETM 领域知识集},所以我们在这里就得到了 IETM 领域本体, 此阶段的工作主要是由本体工程师来完成的; (3) 调用合适的推理系统进行推理——调用可以完成 OWL Lite 所书写 IETM 领域本体之推理问题的推理 系统进行推理,此阶段的工作是由机器自动完成的。 下面分别对这 3 个具体过程做详细的论述。

5.1 创建 IETM 领域术语集 OWL Lite 本体承诺于类、数据类型、对象属性、数据类型属性、个体和数据值,即世界由类、数据类型、 对象属性、数据类型属性、个体和数据值构成。 本体工程师按照以下 2 个原则创建 IETM 领域术语集:(1) 不是领域中所有的术语都需要表达出来,只 需要表达与所需解决任务相关的术语;(2) 按照 OWL Lite 的本体承诺,领域术语集中的所有术语可划分为 6 种,分别是类、数据类型、对象属性、数据类型属性、个体和数据值。

5.2 创建 IETM 领域本体 得到 IETM 领域术语集之后,使用这些术语,本体工程师以 OWL Lite 写出 IETM 领域知识集,从而得 到 IETM 领域本体。OWL Lite 的语法规则见表 1 和表 2,按照这些规则,可以定义类描述、数据类型、对象 属性、数据类型属性、个体、数据值以及公理和事实。OWL Lite 书写的公理和事实可对应到 SHIF(D)规定的 Tbox、Abox 和 role hierarchy。

5.3 调用合适的推理系统进行推理 OWL Lite 所书写 IETM 领域本体之推理问题可以转化成 SHIF (D)所书写之知识库的推理问题。 SHIF (D)所书写之知识库的所有推理问题最后均可归结为根据 role hierarchy 关于 Abox 的一致性检查。 FaCT 系统和 RACER 系统都为解决该问题(根据 role hierarchy 关于 Abox 的一致性检查)提供了优化的 推理算法,所以可以凭借 FaCT 系统或者 RACER 系统来实现对 OWL Lite 所书写领域本体的推理。

6 结论 本文对 IETM 领域知识表示与推理进行了初步研究,为 IETM 领域本体的创建打下坚实理论基础。本体 - 61 http://www.sjie.org/


描述语言在 IETM 领域知识表示与推理中居于核心地位,从发展趋势看,本体语言需要逻辑基础,一般而言, 这个逻辑基础是描述逻辑。所以需要对描述逻辑和描述逻辑的 Tableau 推理算法进行更加深入的研究。

REFERENCES [1] 朱俊武, 陈通凡, 解洪成, 等. 基于本体库的第五级 IETM 研究[J]. 华东船舶工业学院学报, 2004, 12: 90-96 [2] 王斌. 面向武器装备综合诊断的 IETM 结构技术研究 [D]. 海军工程大学硕士论文, 2006, 03: 8-16 [3] 刘琳娜. 基于本体的武器装备 IETMI.研究[D]. 西北工业大学硕士学位论文, 2007, 03: 51-59 [4] 朱俊武. 基于本体的智能 IETM 研究[D]. 江苏科技大学硕士论文, 2005: 37-42 [5] 李华. 基于本体的应急领域知识表示与复用研究[D]. 天津大学博士学位论文, 2008, 05: 51-53 [6] 李永超. 语义 Web 中的本体推理研究[J]. 计算机技术与发展, 2007, 01: 101-107 [7] http://ontoweb.ontoware.org/ [8] http:/www.w3c.org/

【作者简介】 姜巍巍(1968-) ,女,汉族,博士学位,高级实验师。研究方向:保障性工程、CALS 及交互式电子技术 手册。Email: jiangww0701@163.com

- 62 http://www.sjie.org/


Turn static files into dynamic content formats.

Create a flipbook
Issuu converts static files into: digital portfolios, online yearbooks, online catalogs, digital photo albums and more. Sign up and create your flipbook.