An xml z39 50 based approach for geospatial metadata organization

Page 1

Scientific Journal of Earth Science March 2014, Volume 4, Issue 1, PP.1-10

An XML/Z39.50 Based Approach for Geospatial Metadata Organization Zhou Huang1, Xia Peng2#, Xuetong Xie3, Yong Zhao4, Yiran Chen1 1. Institute of remote sensing and GIS, Peking University, Beijing 100871, China 2. Institute of Tourism, Beijing Union University, Beijing 100101, China 3. School of Geographical Sciences, Guangzhou University, Guangzhou 510006, China 4. Sinopec Research Institute of Petroleum Engineering, Beijing 100101, China #

Email: ivy_px@163.com

Abstract With the rapid development of Internet and spatial information technologies, the sharing issue for distributed and multi-scale geospatial data has become one of research hotspot topics in the field of both geoscience and information. Geospatial metadata refers to descriptive information about geospatial data, and can be deemed as the equivalent of geospatial data "directory" information. Thus effective metadata organization approach is the realization base of geospatial data sharing and remote geoscience knowledge discovery under the Internet environment. This paper provides an overview of general methods on geospatial metadata organization, and then proposes a new XML/Z39.50 based approach for geospatial metadata organization. The method uses XML technologies for data storage and expression, and adopts Z39.50 middleware technologies to eliminate systematic differences between heterogeneous metadata nodes. Both theoretical analysis and empirical study show that our method can solve the integration problem of heterogeneous geospatial metadata and ensure data security. Furthermore, the approach is proved to be efficient and scalable as well. Keywords: Geospatial Metadata Sharing; XML; Z39.50 Protocol

一种基于 XML/Z39.50 的地球空间元数据组织 方法* 黄舟 1,彭霞 2,解学通 3,赵勇 4,陈逸然 1 1. 北京大学遥感与地理信息系统研究所,北京 100871 2. 北京联合大学旅游学院,北京 100101 3. 广州大学地理科学学院,广州 510006 4.中国石化石油工程技术研究院,北京 100101 摘 要:随着互联网及空间信息获取技术的发展,分布、多尺度数字化地球空间数据的共享问题,已经成为地学和信息领 域的研究热点之一。地球空间元数据是关于地球空间数据的说明数据,相当于地球空间数据的“目录”信息,它的有效组 织,是实现地球空间数据网络共享和远程地学知识发现的基础。本文概括了网络环境下地球空间元数据组织的一般框 架,提出了基于 XML/Z39.50 的地球空间元数据组织方法。该方法使用 XML 技术进行元数据的存储与表达,利用 Z39.50 中间件技术消除异构元数据节点之间的系统差异。理论分析及实证研究表明,该方法能够很好地解决网络异构环 境下地球空间元数据语义不一致的问题,保障了数据安全性并具有检索效率高、系统可扩展性好等优点。 关键词:地球空间元数据;共享;XML;Z39.50 协议 *

基金资助:受国家自然科学基金支持资助(41001218,41006112) 。 -1http://www.j-es.org


引言 伴随着信息技术的广泛应用,地球空间信息的使用也开始受到越来越多的关注[1]。其中,如何在纷繁复 杂、多尺度、海量且分布的地球空间数据中进行知识发现与数据挖掘,是目前地学和信息领域的研究热点。 地球空间元数据(Geospatial Metadata),正是伴随着这种需求而被提出的。它是关于地球空间数据的数据, 是关于地球空间数据和信息资源的描述性信息,比如,遥感卫星影像的使用说明书、土地利用分类数据的生 产者信息、气象数据的时间范围描述等。地球空间元数据的使用,有助于人们有效地定位、评价、比较、获 取和使用地学相关数据[2]。 已有许多学者对地球空间元数据作了相关研究。研究内容主要集中在以下四个方面:⑴地球空间元数据 的概念及其作用。周成虎等[2,3]对地球空间元数据的内涵及作用作了分析,总结出了可分为基本集、概要集和 详细集三层结构的地学元数据体系。⑵地球空间元数据标准的制定。许多国家、行业、国际组织都建立了自 己的元数据标准,李军等[4]在介绍常见元数据标准的基础上,系统地研究了基于应用集成的地球空间数据集 元数据内容。⑶地球空间元数据的表达与存储。Lake 等[5-8]研究了基于 XML(Extensible Markup Language, 可扩展标记语言)的地理信息元数据的存储策略,分析了无结构、基于线性域段和基于结构的三种存储方式 的解决方案。⑷地球空间元数据技术系统的建设。FGDC(Federal Geographic Data Committee,美国联邦地理 数据委员会)发展了一套元数据共享工具 ISITE[9];Peng、Lim 等[10-11]定义了基于 XML 的元数据系统结构, 并分析了如何将 XML 查询语言 XQuery 应用于地球空间元数据的查询。 现有研究较少地考虑了网络环境给地球空间元数据带来的语义不一致影响[12]。国际互联网的使用,使得 过去单一数据中心的概念不复存在。地球空间元数据可能分布在网络的任意节点,而且不同的地球空间元数 据系统采用的元数据标准及数据格式也是互不相同。因此,如何实现网络异构环境下地球空间元数据的有效 管理,对元数据语义进行统一,并为地球空间数据的共享提供支持,是一个非常有意义的研究议题 [13] 。 Bermudez 等[13-14]提出利用 RDF(Resource Description Framework,XML 的一种应用元语言)技术来解决语义 不一致问题,并通过 Web 的搜索引擎来实现元数据的共享,是一个较好的实现思路,它在数据表达的层次上 能够统一元数据语义;然而该种办法仅适于对元数据进行文本匹配查询,难以支持复杂查询如时间或空间查 询,且借助于搜索引擎的方式使得地球空间数据的安全性无法得到有效保障。本文提出了基于 XML/Z39.50 的地球空间元数据组织方法,并给出了完整的实现技术框架,正是以解决上述问题为目标的。

1

地球空间元数据及其标准 地球空间元数据,又称关于地球空间数据的数据,它说明地球空间数据的数据内容、质量、状况和其他

有关特征的背景信息。简而言之,地球空间元数据就是有关地球空间信息的“目录”信息。它于知识发现中 具有如下作用[15]: ⑴信息搜索功能。元数据能够提供充分的信息,以帮助用户发现感兴趣的数据是否存在于数据集中;⑵ 数据检索功能。元数据能够帮助用户获取所需的数据;⑶转换功能。元数据包括了有关数据格式、内容、管 理形式等信息;⑷评价功能。元数据能够帮助用户确定所查找的数据是否适合于一定的应用。 空间信息的存在形式是丰富多样的,因而对其的描述也是各不相同的。为规范元数据的描述形式及内 容,不同的组织提出了不同的元数据标准,这在客观上造成了跨区域、跨行业间的地球空间元数据格式不一 致,相互之间“理解”困难。目前应用较广泛的几种元数据标准有:FGDC/CSDGM[16] 、ISO/TC211[17] 、 Dublin[18]、中国地球空间元数据标准(草案)[1]等。 FGDC/CSDGM 由美国联邦地理数据委员会提出,在其最新的用户手册[16]里定义了十类子集:标识信息 (Identification)、数据质量信息(Data Quality)、空间数据表示信息(Spatial Data Organization)、空间参 照系信息(Spatial Reference)、实体和属性信息(Entity and Attribute)、发行信息(Distribution)、元数据 参 考 信 息 ( Metadata Reference ) 、 引 用 信 息 ( Citation ) 、 时 间 范 围 信 息 ( Time Period ) 、 联 系 信 息 -2http://www.j-es.org


(Contact)。其示意图可如图 1,其中前七类是主要子集,后三者属于次要子集,它们不能单独存在,只能 在主要子集中被引用。 中国空间信息元数据标准(草案)主要描述中国空间信息(核心)元数据的特征。为建立关系和组织信 息,将元数据分为若干子集: 元数据实体集、标识、数据质量、参照系、内容、分发、范围、引用、负责单 位等。元数据中的实体和元素用行号、名称、定义、约束、最大出现次数、数据类型、域这七个属性定义。 其一级子集的定义为: 表 1 中国地球空间元数据标准中的子集

2

子集名称

内容

元数据实体集信息

语言、字符集、联系单位、创建日期等

标识信息

摘要、目的、状况、安全限制、使用限制等

数据质量信息

数据质量报告、数据志说明等

参照系信息

参照系、投影、椭球体等

内容信息

要素类型、数据层说明、属性说明等

覆盖范围信息

覆盖范围描述、地理范围、时间范围等

分发信息

分发者信息、负责单位信息、联系信息等

元数据组织的框架 网络环境下地球空间元数据的组织和管理,一方面需要有合理的数据存储及表达策略,另外一方面需要

设计实现元数据的检索服务,并对地球空间数据的共享起到支持性作用[19]。地球空间元数据组织的框架内容 可如图 1 所示:

图 1: 地球空间元数据组织框架

完整的地球空间元数据组织框架包括四个层次:数据存储与表达层、元数据服务层、元数据检索层以及 元数据应用层。其中,数据存储与表达层负责地球空间元数据的存储管理及表达;元数据服务层主要用以构 建元数据的检索服务;元数据检索层由一系列客户端组成,能够对远程的元数据服务器进行检索;元数据应 用层位于框架的最顶端,它解决的是如何应用元数据进行地球空间数据的发现。 ⑴ 数据存储与表达层。地球空间元数据存储与表达策略是构建元数据服务的基础,其设计策略应考虑以 下两个因素:数据管理的便捷与交换的方便性。一方面能够易于管理,另外一方面是利于不同元数据平台间 进行数据交换。 ⑵ 元数据服务层。服务层需要构建元数据的检索服务,它负责与检索客户端建立连接;处理数据检索请 求;与后台数据库相连接,获取相应的检索结果并返回给检索客户端。 -3http://www.j-es.org


⑶ 元数据检索层。对于元数据检索工具而言,需要一个友好的查询界面,提供给普通用户使用。此外, 检索工具还需要具有远程访问能力,与元数据服务器建立连接并进行数据检索。 ⑷ 元数据应用层。用户对元数据检索结果的进一步应用,包括简单应用与复杂应用两种类型。简单应用 仅指空间数据的发现,复杂应用则是利用元数据进行更进一步的地球空间数据“挖掘”,如集成、互操作、 聚类等。 服务层与检索层之间要解决的一个重要问题是,如何消除网络异构环境下元数据节点之间的语义不一致 性。比如对于“生产者”这一元数据元素的表达,在一些元数据标准里被规范为“生产单位”,在另外一些 元数据标准则可能被定义为“生产集体”或“producer”等名称。语义的不一致性给用户的远程查询和数据 发现带来了不便,用户针对不同的元数据服务器需要提交不一致的查询语句。为实现网络环境下数据的一致 检索,目前信息领域主要存在以下两种解决策略[19]。一种是 Web 方案,它通过建立一个可用来提交查询的中 转网关(Gateway),由它负责屏蔽节点差异的任务,并与不同的元数据节点进行交互;另外一种是中间件 (Middle Ware)方案,它在服务层与检索层之间通过一组公共的、稳定的接口,标准化异构节点之间的输入 输出,以保证检索层对服务层的一致访问。Web 方案无需开发专门的客户端(检索层使用 Web 浏览器),易 于实施,但系统的扩展性较差,服务器端的改动需通知中转网关且支持的查询字段有限,这也是目前地球空 间元数据检索所采用的主要方式;中间件方案则是完全的分布处理结构,系统扩展性好,服务器端改动对客 户端透明,并且支持丰富的查询字段,缺点是实施更为复杂,需要开发专门的检索客户端。

3

基于 XML/Z39.50 的元数据组织方法

3.1 XML 技术 XML 的全称为“可扩展标记语言”(Extensible Markup Language)。它是国际组织 W3C(World Wide Web Consortium)为适应于 WWW 应用,对 SGML(Standard Generalized Markup Language)进行简化而形成的标 记语言[20]。XML 继承了 SGML 具有的可扩展性、结构性及可校验性等特点,此外它具备平台无关性、内容 与表达分开、信息领域的广泛支持等优势[21-22]。有鉴于此,XML 被广泛应用于 Internet、出版业、电子商务 等热门领域,各行业的组织均可利用 XML 创建他们自己的它们自己的标识语言,用于在各自的领域实现信 息的交互[23]。目前在地球空间元数据领域,采用 XML 对元数据进行存储与表达,也逐渐成为一种共识[24], 例如 FGDC 就规定了 XML 作为元数据存储与表达的数据格式。以下为采用 XML 表达中国空间信息元数据 标准(草案)下的元数据实例: <?xml version="1.0" encoding="UTF-8"?> <MD_中国空间信息元数据> <语言>中文</语言> <联系单位> <负责单位名称>中国科学院中国遥感卫星地面站</负责单位名称> ………… </联系单位> <数据集标识信息> <名称>SDI01-RSGS-BJ-SP5-HRG1A-20021023-031227-031227</名称> <摘要>遥感数据</摘要> ………… </数据集标识信息> ………… </MD_中国空间信息元数据>

3.2 Z39.50 协议 Z39.50 协议的全称为:American National Standard Information Retrieval Application Service Definition and Protocol Specification for Open System Interconnection[25]。是关于信息检索的 ANSI/NISO 标准,是基于 ISO 的 OSI 参考模型的应用层协议。它一方面定义了数据检索应提供的服务内容,另一方面定义了检索客户端与服 务器端间的交互细节:包括查询语句的语法、消息的组织及编码等。 -4http://www.j-es.org


Z39.50 协议定义了 11 类信息检索服务功能,包括:初始化连接、搜索、提取、删除、访问控制、资源 控制、排序、浏览、解释、扩展服务等功能[25]。对于地球空间元数据的共享而言,Z39.50 协议主要用于对外 提供一致的数据查询服务,元数据服务器需提供 Init(连接)、Search(搜索)及 Present(提取)三种基本 服务。地球空间元数据检索的 Z39.50 服务模型可如图 2 示。

图 2 Z39.50 服务模型

此外,Z39.50 协议规定了一组适用于数据检索的查询语法,用以查询语句的组织,其中最常用的是后置 语法 RPN(Reverse Polish Notation)。而客户端与服务器的通信则是通过消息传递完成的。在 Z39.50 协议 中,消息又被定义为应用协议数据单元(Application Protocol Data Unit,简称 APDU)。APDU 中的内容包括 各种服务的参数、查询语句、结果数目、记录内容等。所有这些内容按照抽象语法 ASN.1(Abstract Syntax Notation)组织起来,经 ASN.1 格式组织后的消息在发送前需要按照基本编码规则 BER(Basic Encoding Rule)编码成适合于传输的二进制比特流,对应的客户端或服务器收到消息后需要进行解码。 Z39.50 协议作为信息查询与提取的标准,自提出至今已有十五年的历史,它被广泛地选用作为信息检索 系统实现网络异构平台交互的中间件协议。其强大之处在于将信息查询与提取的过程标准化,并为此定义了 十分完善的语法规范。目前 Z39.50 协议应用最广泛的领域是数字图书馆的建设,其在书目检索中的应用技术 已非常完善[25]。

3.3 系统设计

图 3 基于 XML/Z39.50 的地球空间元数据组织结构 -5http://www.j-es.org


鉴于 XML 技术在元数据表达上的优势,以及 Z39.50 中间件技术的成熟,本文采用以上两者对地球空间 元数据的组织方法进行了设计。基于 XML/Z39.50 的地球空间元数据组织的系统结构可如图 3 所示。 ⑴元数据应用平台。由应用层的客户端组成,其功能主要定义为地球空间数据的获取。应用客户端首先 发起元数据获取请求,经元数据检索工具与后端的元数据服务器连接后返回元数据结果;用户浏览元数据信 息,确定感兴趣的地球空间数据内容,根据元数据内的位置标识信息对地球空间数据进行访问。其中位置标 识可分为简单标识与复杂标识,简单标识仅仅定义了地球空间数据的所有者及联系方式,而复杂标识则含有 地球空间数据存放的 IP 地址、数据库的访问权限等说明信息,也即带复杂标识的地球空间数据为可直接访问 资源,而简单标识则为不可直接访问。 ⑵元数据检索工具。元数据客户端要求支持 Z39.50 协议,能够对连接、查询和提取的请求/响应 APDU 进行编码和解码。同时,由于 Z39.50 格式的查询语句过于复杂,一般用户并不熟悉,所以元数据检索工具需 要提供图形化的窗口组件让用户以点选和框选的方式输入查询条件,使查询接口简单易用,由检索工具来完 成 Z39.50 格式查询语句的构造,并支持常见的时间与空间查询操作。 ⑶元数据服务器。支持 Z39.50 协议,提供连接、查询与提取三种基本的检索服务,其中连接服务用于客 户端的身份认证及建立客户端与服务器端的会话(Session);查询服务用于处理用户的查询请求,返回简略 的元数据结果集;提取服务则用于返回详细的结果集。 ⑷元数据库平台。采用 XML 文件的方式存储地球空间元数据,由于 XML 处理查询的效率较低,本文 对其存储方式做了优化,对一些常用于查询的元数据元素(摘要、标题、时间、空间范围等)进行抽取, 组成新的索引关系表,索引表的 ID 字段对应相应的 XML 文件名。因此服务器处理查询请求可以对索引表 进行操作并返回简略结果集,而处理提取请求时服务器将根据查询结果中的 ID 信息从 XML 数据库内提取 详细结果集。 ⑸地球空间数据库平台。元数据应用层的服务器端,它与元数据库的分布不要求一致,地球空间数据以 文件、对象关系数据库等方式进行管理和发布。

4

系统实现 根据基于 XML/Z39.50 的地球空间元数据组织方法的体系结构,我们对其技术框架进行了应用,实现了

基于 XML/Z39.50 的元数据系统原型 ZSpatialMetaService。该系统主要采用 FGDC/CSDGM、Dublin 与中国空 间信息元数据标准(草案)三种元数据标准,并均以 XML 文件/索引关系表相结合的方式存储地球空间元数 据。元数据库的描述对象为约二十万幅 1997-2004 年中国范围内的卫星遥感影像数据,采用不同数据标准的 元数据分布在十个通过广域网相连的数据服务器上。 ZSpatialMetaService 为各个元数据服务器构建了基于 Z39.50 协议的检索服务,支持连接、查询及提取服 务,同时它的元数据检索工具能够很好地支持文本、时间与空间查询,以及以上查询的组合形式。其界面如 图 4 所示,通过利用左侧部的电子地图窗口,用户能够方便地构造空间查询操作。由于检索工具和服务器端 均支持 Z39.50 协议,检索工具能够对网络上采用不同元数据标准的地球空间元数据服务器进行一致的查询和 访问,用户在提交检索请求以后可以获得元数据的简要结果及详细结果集。图 5 左部所示的是用户查找在地 理范围上包含上海市周边区域“[北纬 31.2 度,北纬 31.0 度,东经 121.4 度,东经 121.7 度]”的遥感影像数 据,右部则是返回元数据结果的详细信息,该影像的元数据采用了中国空间信息元数据标准;图 6 示意的是 用户查询 2003 年 1 月份渤海区域“[北纬 39.0 度,北纬 38.3 度,东经 117.8 度,东经 118.6 度]”内的所有影 像数据资料,返回元数据的详细结果表明其采用的是 FGDC/CSGDM 标准。正是 Z39.50 技术的应用,让系统 成功地跨越了语义“障碍”,实现了对不同标准元数据的一致检索。 此外,原型系统对元数据应用层也进行了初步的实现,系统提供元数据检索结果对应的遥感影像快视图 像,同时元数据的位置标识信息为简单标识,即包括数据的所有单位及联系信息。实际的遥感影像数据为不 -6http://www.j-es.org


可直接访问资源,用户需通过与数据所有者(如“中国科学院中国遥感地面卫星站”)进行联系获得。未来 需要根据复杂应用,设计空间数据为可直接访问资源,以及开发专业的元数据应用客户端。

图 4 元数据检索工具界面示意图

图 5 用户查询示意图(一)

5

图 6 用户查询示意图(二)

结果讨论 结合前述的理论探讨和系统原型验证,采用基于 XML/Z39.50 的元数据组织方法进行元数据及其应用系

统的建设,其优点可以总结为以下几个方面: ⑴ XML 的数据存储与表达有助于地球空间元数据的共享及多样化表达。 XML 的平台无关性、文本化表示有利于不同机器间的元数据“理解”,同时它的 scheme 机制保证元数 据的表达与存储分开,多样化的元数据显示可以满足不同用户的需要[26](如权限不同的用户检索出的数据结 果应是不一致的)。 ⑵ Z39.50 中间件技术的引入能够消除不同元数据标准间的语义不一致性。 Z39.50 协议对请求消息中的查询语句进行了具体的规定,包括它的语法及表达形式。其中一个核心的概 念为属性集(Attribute Set), 属性集相当于一个“词汇表”,它由许多属性元素组成,其中每个元素包含一 对属性类型和相应的属性值。Z39.50 格式的查询语句即是由查询关键字、属性元素集合并辅之以相应的语法 而构成的。Z39.50 协议规定的基本属性集为 bib-1,最常见的查询语法为 RPN(Reverse Polish Notation:逆波 兰标记法)。例如以下查询语句(采用属性集 bib-1,查询语法 RPN): “遥感影像[1,62,2,3,3,3]”,该查询语句中‘遥感影像’为关键字,后面的中括号内为属性元素集合。集 合中的自然数按自左至右的顺序两两构成一个属性元素,其中前者是属性类型,后者代表具体的属性值。在 -7http://www.j-es.org


本例中,查询语句表示要查询的字段为摘要(第一个 1 代表 use 属性,其值 62 在 Bib-1 中代表摘要),而查 询时要以字符串相等的方式作比对(2 代表 relation 属性,其值 3 代表相等),并查询该字段中任意位置 (3 代 表 position,其值 3 代表任意位置)。因此,该语句用自然语言表述即为“查询摘要为‘遥感影像’的所有元 数据记录”。 由于属性集的机制采用“自然数对”来表达查询语义,有效地屏蔽了不同元数据标准下各数据元素之间 的语义差异。比如要在采用不同元数据标准的服务器上执行示例查询语句,在 FGDC/CSDGM 中对数据摘要 的元素定义为“abstract”,而中国空间信息元数据标准内的元素定义则是“摘要”,属性元素(1,62)的引 入统一了两者的语义,不同的服务器只需在后端根据属性集这一“词汇表”将其分别翻译成“abstract”和 “摘要”,并执行相应查询即可。这也是 Z39.50 技术能够屏蔽元数据语义不一致性的根本原因所在。 ⑶基于该组织方法的元数据系统具有较高的元数据检索效率。 该方法充分考虑了元数据检索性能的因素。检索工具与服务器之间的 Z39.50 会话直接建立于 TCP/IP 连 接之上,以及服务器端的索引表机制,均有效地保障了执行元数据查询的效率。目前常见的地球空间元数据 系统都是通过 Web 的形式提供元数据检索的功能,服务器端采用 Web Server 处理查询请求,客户端与服务 器通过 HTTP 协议进行交互,笔者基于同样的数据及存储策略,利用 ASP/IIS 应用了一套基于 Web 的元数据 系统 WebMetaService,其功能与 ZSpatialMetaService 一致。对两者的性能进行了测试,WebMetaService 的数 据 查 询 平 均 响 应 时 间 为 21s , 而 ZSpatialMetaService 的 平 均 响 应 时 间 则 为 3.1s , 实 验 结 果 表 明 基 于 XML/Z39.50 组织方法的元数据系统具有较高的数据检索效率。

图 7 WebMetaService 元数据检索页面

图 8 WebMetaService 元数据查询结果

⑷该方法的结构设计保障了良好的地球空间数据安全性。 地球空间数据相较于一般数据具有其特殊性,其中重要的一点就是对于安全性的要求。鉴于安全性的考 虑,地球空间元数据中一般具有说明资源访问限制的元素(如中国空间信息元数据标准内‘标识信息’子集 下的‘数据资源限制’)。该方法的设计考虑到了这一点,根据元数据中的资源访问控制信息对数据的远程 访问权限进行分级,特定的元数据系统可以将用户系统分为若干个用户组,对应有不同的元数据访问权限。 同时,每一个用户组所访问的索引关系表是不同的,索引表的详尽程度与用户权限相关,一些安全级别要求 较高的元数据记录或者数据项将不能为匿名用户或普通用户所访问。用户分组及索引表分级的机制,保障了 地球空间数据的安全性。 ⑸良好的系统扩展性。 该方法采用 Z39.50 中间件技术来消除异构系统之间的差异性,由于元数据服务器与检索工具之间采用的 是一组公共的、与具体平台无关的接口进行通信和交互,因此无论服务器还是检索工具后台的改动不会对系 统的正常运转造成影响。这也使得系统具备良好的可扩展性,任何参考该模型实现的服务器或是检索工具, 都能够在不对系统其他部分作额外改动的情况下加入元数据系统,进而促进元数据乃至地球空间数据共享的 实现。 -8http://www.j-es.org


6

结论 本文讨论了分布环境下地球空间元数据的管理框架,针对网络环境下地球空间元数据标准和语义不一致

的问题,提出了基于 XML/Z39.50 的地球空间元数据组织方法,并给出了实现的技术框架。经理论分析和实 际开发的原型系统验证,该方法能够有效解决地球空间元数据的语义不一致问题,保障了数据的安全性;相 较于传统的基于 Web 的管理和组织方式,基于该方法的元数据系统具备更高的数据检索效率和良好的可扩展 性。此外,本文仅讨论了地球空间元数据应用的简单情形,即如何应用元数据进行地球空间数据的查找和获 取,未来需要进一步研究复杂应用与地球空间元数据的作用机制,使该方法适用于地球空间数据深层次的 “挖掘”和互操作。

REFERENCES [1]

刘若梅,蒋景瞳,贾云鹏.中国可持续发展信息共享元数据标准实施. 见: 中国 21 世纪议程管理中心编. 中国地理信息元数据 标准研究.北京: 科学出版社,1999.36-46 [Liu Ruomei, Jiang Jingtong, Jia Yunpeng. China sustainable development information sharing data standards implementation. See: China's 21st century agenda management center edition. Research of China's geographic information metadata standard. Beijing: Science Press, 1999.36-46]

[2]

周成虎,李军.地球空间元数据研究. 地球科学:中国地质大学学报,2000,25(6):579-585 [Zhou Chenghu, Li Jun. Geospatial metadata research. Earth Science-Journal of China University of Geosciences, 2000,25 (6): 579-585]

[3]

李军,陈崇成.地球科学数据的元数据研究.地理研究,1997,16(1):31-38 [Li Jun, Chen Chongcheng. Study on metadata for geoscience data. Geographical Research, 1997,16 (1): 31-38]

[4]

李军,周成虎.地球空间数据元数据标准初探.地理科学进展,1998,17(4):55-63 [Li Jun, Zhou Chenghu. Geospatial data metadata standards. Progress in Geography, 1998,17 (4): 55-63]

[5]

Lake R.The application of geography markup language (GML) to the geological sciences. Computers & Geoscience, 2005, 31(9): 1081-1094

[6]

罗 英 伟 , 邢 彭 龄 . 基 于 XML 的 地 理 信 息 元 数 据 存 储 策 略 . 计 算 机 工 程 ,2004,30(9):9-11 [Luo Yingwei, Xing Pengling. Geographic information metadata based on XML storage strategies. Computer Engineering, 2004,30 (9): 9-11]

[7]

罗英伟,邢彭龄.地理信息元数据及系统.计算机工程,2004,30(6):1-3 [Luo Yingwei, Xing Pengling. Metadata and geographic information systems. Computer Engineering, 2004,30 (6): 1-3]

[8]

罗英伟,邢彭龄.基于 XML 的地理信息元数据系统的查询策略.计算机工程,2004,30(22):8-10 [Luo Yingwei, Xing Pengling. Geo-metadata query system based on XML policy. Computer Engineering, 2004,30 (22): 8-10]

[9]

张颖.基于 XML 的地理信息元数据系统.北京:北京大学,2001 [Zhang Ying. Geographic information metadata system based on XML, Beijing: Peking University, 2001]

[10] Peng Z R.A proposed framework for feature-level geospatial data sharing: a case study for transportation network data.2005,19(4):459-481 [11] Lim E P,Liu Z H,Yin M,etc.On organizing and accessing geospatial and georeferenced Web resources using the G-Portal system.Information Processing & Management,2005,41(5):1277-1297 [12] Meeks W L,Dasgupta S.Geospatial information utility: an estimation of the relevance of geospatial information to users.Decision Support Systems,2004,38(1):47-63 [13] Bermudez L,Piasecki M. Metadata community profiles for the Semantic Web. Geoinformatica,2006,10(2):159 -176 [14] 张书亮, 龚敏霞, 闾国年. 基于 XML 的地理地球空间元数据表达研究, 遥感学报, 2003, 7(1): 66-72 [Zhang Shuliang, Gong Minxia, Lv Guonian. Study on expression of geospatial metadata based on XML. Remote Sensing, 2003,7 (1): 66-72] [15] 李军. 地球空间元数据的使用研究.地球信息科学, 2000, 9(3): 8-13 [Li Jun. Study on the use of geospatial metadata. Geoinformation Science, 2000, 9 (3): 8-13] [16] Federal Geographic Data Committee(FGDC). Content standards for digital geogeospatial metadata,1997 [17] ISO/TC211. Geographic information metadata, ISO standard 15046-15 metadata,1997 -9http://www.j-es.org


[18] Dublin Core Metadata Initiative. Dublin Core Metadata Element Set, Version 1.1: Reference Description, http://dublincore.org/ documents/1999/07/02/dces/ [19] Yu S, Qiang H Z, Jing S W. A framework of XML-based geospatial metadata system. Lecture Notes in Computer Science, 2006, 3842: 775-778 [20] Larsgaard M L. Metaloging of digital geospatial data.Cartographic Journal, 2005, 42(5): 231-237 [21] Marx M, Rijke M.Semantic characterizations of navigational XPath. SIGMOD Record, 2005, 34(2): 41-46 [22] Sauvagnat K, Boughanem M, Chrisment C. Answering content and structure-based queries on XML documents using relevance propagation. Information Systems,2006,31(7):621-635 [23] Govert N, Fuhr N, Lalmas M, etc. Evaluating the effectiveness of content-oriented XML retrieval methods. Information Retrieval, 2006, 9(6): 699-722 [24] Aggarwal N, Dai Q Z, Walden E A. Do markets prefer open or proprietary standards for XML standardization? An event study. International Journal of Electronic Commerce, 2006, 11(1): 117-136 [25] ANSI/NISO. Standard Information Retrieval: Application Service Definition & Protocol Specification, 2003 [26] Nishimura S, Nakano K. XML stream transformer generation through program composition and dependency analysis. Science of Computer Programming, 2005, 54(2): 257-290

【作者简介】 1

黄舟(1983-),男,汉族,博士,讲师,主要研究方向为

4 赵勇(1985-),男,汉族,博士,工程师,主要研究方向

分布式地理信息系统。

为分布式地理信息系统。

2

5 陈逸然(1994-),男,汉族,本科生,主要研究方向为分

彭霞(1983-),女,汉族,博士,讲师,主要研究方向为

规划 GIS 与旅游 GIS。 3

布式地理信息系统。

解学通(1975-),男,汉族,博士,副研究员,主要研究

方向为海洋遥感与 GIS 应用。

- 10 http://www.j-es.org


Turn static files into dynamic content formats.

Create a flipbook
Issuu converts static files into: digital portfolios, online yearbooks, online catalogs, digital photo albums and more. Sign up and create your flipbook.