纯XML数据库的索引技术研究

来源 :南京邮电大学 | 被引量 : 0次 | 上传用户:daijiangduck
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着Internet的迅猛发展,XML已成为数据表达和数据交换的主要标准。XML数据库因此成为研究的热点。XML数据查询是XML数据库的基本功能之一,而对XML文档建立索引是提高查询效率的一个重要手段。为此,本文对纯XML数据库的索引技术进行了研究。   本文首先介绍了XML查询技术,并将索引技术的研究定位在基于路径的(即XPath表达式)查询研究上。接着,较为全面地讨论了目前主流的XML索引技术,并介绍了其原理,分析了其优劣。   前缀编码(Dewey编码)具有字典有序性,其编码算法也比较简单,不但可以很好地保存双亲-子女(P-C)和祖先-后裔(A-D)结点之间的包含关系,而且可以保存XML文档中结点之间位置关系的信息,是判断计算XML文档中任意两结点关系的有力的工具。   本文利用前缀编码这些良好的特性,以基于路径的XML索引原理为基础,以降低复杂度和提高查询效率为目标,设计了一种新型的基于Dewey编码的索引——A-DeweyIndex索引结构,同时设计并实现了基于此索引结构的查询算法。A-Dewey Index索引结构通过对文档结点编码来记录文档的结构信息,利用前缀路径(PrefixXpath)和Dewey编码信息进行匹配操作完成结构连接查询。A-Dewey Index索引结构支持含通配符“*”和后代轴“∥”的查询。   本文还基于XPath表达式查询中的小枝连接策略的思想,设计了一种新型的整体小枝模式查询策略,整体小枝模式查询可以大幅度减少普通连接算法中不必要的扫描和搜索,极大地提高XML数据查询的效率。   最后,为了验证了A-Dewey Index索引结构的有效性和性能,本文做了仿真实验。实验结果表明:基于A-Dewey Index索引结构的查询算法具有较低的时间复杂度,解决了XML文档整体小枝路径查找问题,是一种较为有效的XML索引结构。   此外,由于所有的XML文档处理都从解析开始,即需要把代表XML文档的一个无结构的字符序列转换为满足XML语法的结构化组件。因此,本文对在仿真实验过程中运用的解析技术也进行了分析。   论文在XML数据库索引技术方面做了有益的研究工作。
其他文献
为了能够在全国各级考试管理部门和考点之间实现由不同监控设备构成的视频巡查系统之间的联网,统一考场巡察系统的技术规范,达到各地区考场监控系统相互间的互通互联,逐步实现全
进入21世纪,互联网作为信息交流最重要的方式,已经彻底改观了人们的日常生活,网络技术的迅猛发展和互联网的普及使各种各样的网络应用极大丰富了人们获取信息的方式和彼此交流的
设备监测软件是企业自动化系统的重要组成部分,集数据采集、通信、显示、控制等功能于一体,对了解和掌握设备在运行中的状态,评价、预测设备的可靠性,早期发现故障有着重要的
入侵检测技术是继数据加密、VPN、防火墙等传统网络安全保护手段之后的新一代安全保障技术。目前,尽管入侵检测技术发展速度很快,但是随着大量高速网络技术的出现,入侵检测系
涡轮冷却叶片设计是未来发动机设计的重要环节,涉及大量复杂的数据模型。由于缺乏有效的管理与运用手段,依赖传统的设计建模方法,数据可重用性和一致性差,系统建模效率低且严
随着互联网的飞速发展,网络测量的重要性日益突出。网络测量可以精确地捕捉互联网行为的测量数据,包括延迟、丢包率、带宽、吞吐量、瓶颈、服务器和网络设备的响应时间等。网络
学位
基于人工免疫的入侵检测系统中,不管是基于什么免疫原理的入侵检测系统,检测器都是其核心部件,检测器的生成速度和在非我空间的分布状况直接影响着系统的性能。目前基于人工免疫
无线Mesh网络(WMN)是一种新型的宽带无线网络系统,也是一种大容量、高速率的分布式网络。与传统网络不同的是,WMN具有可靠性、自组织性和自愈性等特点。这种无线网状网不仅可以
Internet技术和Web服务的迅猛发展,导致网络拥塞和服务器负载过大成为用户面临的两大问题。在网络中设置缓存,以空间换取时间己成为降低用户感知延时的主流方法之一。En-route
随着信息处理、计算机、机器人等技术的发展,出现了一大批复杂的人造动态系统,这类系统不同于连续变量系统,它自身带有异步与并发特性,称之为离散事件动态系统。这类系统的特