XML Query Technology with Positional Predicates over Streams

Page 1

Transactions on Computer Science and Technology March 2015, Volume 4, Issue 1, PP.1-11

XML Query Technology with Positional Predicates over Streams Chenyang Wang 1, Husheng Liao 2, Hang Su 1 1. College of Computer Sciences, Beijing University of Technology, Beijing 100124, China 2. College of Software Engineering, Beijing University of Technology, Beijing 100124, China #Email:

eagle_james@163.com; liaohs@bjut.edu.cn; suhang@bjut.edu.cn

Abstract Twig pattern matching is a core operation in XPath query processing. In the field of XML streaming data processing, holistic twig pattern matching algorithms have been studied widely nowadays. However, little attention is paid on positional predicates defined on navigation axis in XPath expressions. Due to the lack of context information, these algorithms cannot filter out the final solutions satisfying the positional predicates from the results of tree pattern querying. To fill this technology vacancy, in this paper, we propose a new holistic twig pattern matching algorithm PosLQ for XML stream data to implement the XPath queries with the positional predicates. Experimental results show that our algorithm can efficiently tackle these types of XPath queries, which is practical in the field of XML data stream. Keywords: XML; XPath; Stream; Tree Pattern Query; Positional Predicate

支持位置谓词的 XML 流数据查询技术* 王晨阳 1,廖湖声 2,苏航 1 1. 北京工业大学,计算机学院,北京 100124 2. 北京工业大学,软件学院,北京 100124 摘 要:树模式查询是 XPath 查询语言的核心操作,特别是采用整体匹配策略的树模式查询算法也已得到了广泛的研究。 但是在 XML 流式数据处理领域中,对于含有位置谓词的 XPath 查询计划的处理,现有的整体匹配算法均未予以考虑。 由于必要上下文信息的缺失,现有算法无法从树模式查询的返回解中过筛选出满足位置谓词约束的最终解。为了能够使 树模式查询算法支持位置谓词的处理,本文提出了一种新的针对 XML 流数据的整体匹配算法 PosLQ。实验结果表明, 该算法可高效地处理上述类型的 XPath 查询请求,增强了树模式查询技术在 XML 流数据领域的实用性。 关键词:XML;XPath;流数据;树模式查询;位置谓词

引言 XML 作为一种半结构化的数据描述语言,已成为互联网上广泛应用的数据表示方式和传输格式的工业 界标准。如何对 XML 数据进行高效地查询也已成为数据库领域的研究热点。随着 XML 被应用于 Web 数据 交换等各个领域,“XML 流式数据[1]”受到了研究者们的普遍关注,给 XML 查询处理提出了新的需求和挑战。 流式数据通常具有如下四个基本特点[2]:数据在线到达,处理端对数据到达的顺序无法控制,数据量的大小 可能没有边界,处理完某个数据元素便将它转发或丢弃。基于上述特点可知,现有的大部分面向传统 XML 数据库的查询机制将不再适用于流式 XML 数据。因此,研究专门针对 XML 流数据的查询机制也就变得尤 为重要。 *

基金资助:受北京市自然科学基金项目 (NO.4122011)、国家自然科学基金青年基金项目 (NO.61202074) 支持资助。 -1http://www.ivypub.org/cst


Turn static files into dynamic content formats.

Create a flipbook
Issuu converts static files into: digital portfolios, online yearbooks, online catalogs, digital photo albums and more. Sign up and create your flipbook.