XML查询自动生成与微观评测关键技术研究

来源 :南开大学 | 被引量 : 0次 | 上传用户:xixixi
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着信息时代的到来,社会对数据处理的需求越来越复杂,越来越多样化。传统的关系型数据及关系型数据库已经渐渐不能够满足现代数据,尤其是结构化半结构化数据的数据描述需求与数据管理需求。XML数据作为一种半结构化数据,以其灵活的结构特征,直观的表现形式,以及丰富的数据描述能力逐渐成为各个领域广泛采用的数据格式。而XML数据管理技术经过近十年的发展,已经在语言描述,查询处理,存储方法,事务管理等方面取得了长足的进步。   数据库评测作为数据库研究的重要组成部分,在传统数据库的发展中起到了举足轻重的作用,XML数据库评测也伴随着XML数据库发展的历程逐渐发展。相对于传统数据评测来说,XML数据库评测在扩展性,易用性等方面都还有很大发展空间,现有的XML数据库评测方法并不能完全满足系统设计与研究人员对数据库系统微观评测的要求。本文正是对XML数据库评测的相关关键技术进行研究,从对传统数据库评测方法的研究出发,探寻了查询和数据之间的深层联系,研究XML查询集特征,创造性的将XML代数相关分析应用到查询生成中,并进一步的提出了一种查询集的自动生成方法,使生成的查询集具有良好的代数性质并体现XML查询的各类重要特征。最后,本文以自动生成的查询集为核心提出了一种新的XML评测方法。该方法支持用户自定义数据集与查询集,从而克服了现有评测灵活性,易用性,扩展性差的缺点。为XML评测方法的研究开辟了新的道路。   在分析了近几年国内外相关成果的基础上,本文对XML查询特征,XML查询与数据的关系,XML查询自动生成,XML微观评测等问题进行了深入细致的研究,主要贡献与创新点如下:   ●分析了针对文档数据的XPath查询语义与结构特征。本文从数据的角度出发研究了查询与数据的相互关系,分析了在XML数据结构上的查询集的代数特征,并给出了完备查询集生成算法。具体本文建立了查询语义结构特征与文档结构特征的相互关系,并对查询集在对应文档中的完备性进行分析,建立了完备查询集的概念。这些研究能够用于指导索引理论和查询规约方法的研究,同时作为查询生成的理论基础。   ●提出了一种基于代数的XPath查询自动生成方法。该方法利用代数分析手段,对XPath查询进行特征抽象,利用XPath代数子集、等价类等概念对查询特征进行描述,并给出了相关生成算法。实验结果证明,该方法所提取的查询特征能够很好的描述查询差异,在灵活性,可扩展性方面强于现有手工标注的查询集选择方法。同时在特征描述,查询完备性上优于现有查询自动生成方法。   ●设计了一种基于需求的XML微观评测方法。该方法以查询集自动生成方法为核心,建立了用户能够自由选择数据集,并根据需求配置查询集的评测方式。它改变了以往评测方法采用固定的,预定义的查询集和在有限范围内配置数据集的模式,通过构造测试用例分析证明,该方法能够有效地对各查询引擎进行性能区分,并对其各模块属性进行系统分析。
其他文献
P2P(Peer-to-Peer,对等端到对等端)作为一种与客户机/服务器对立的网络架构,是近年来兴起的一种重要的网络应用模式。它在文件交换、对等计算、协同工作、搜索服务等方面都有着
随着计算机系统和互联网技术的发展,现在各企业对数据的依赖性逐渐增强,对数据完整性和安全性的要求也越来越高,各种数据容灾技术在这种需求背景下得到了迅速发展。连续数据保护
20世纪以来,随着计算机技术、通信技术、互联网技术的突飞猛进和电子商务、网上银行等的兴起,信息安全受到越来越广泛的关注,同时随着物联网、无线传感器、RFID标签的出现,分
作为模型的降维表示,中轴在模型检索、路径规划、模型表示、三维打印、有限元分析等方面获得了广泛的应用。然而,目前的三维模型中轴生成方法如瘦化法、Vonoroi图法、跟踪法等
随着新一代互联网规模地迅速增长,网络技术的不断完善与成熟,特别是交互式网络多媒体服务越来越广泛的应用,如何提供高水准的服务质量(Quality of Service,QoS)成为计算机网络领
鉴于关键词查询在IR和Web中检索文档的理论和技术方法,在关系数据库中支持自由态的关键词查询成为一个活跃的研究课题。关键词查询能够更好地适应Web数据库,不需要用户知道数
数字水印以数字作品内容保护为主要宗旨,已经被广泛的研究。近年来,学者也提出许多不同的算法。鲁棒水印嵌入容量虽然较低,但却能抵抗各种非恶意的篡改。在一些应用场合中,出于对
近年来,随着移动定位和无线网络技术的发展,人们可以更加方便地测定自己的地理位置,一种新的应用服务--基于位置的服务应运而生。人们为了获得基于位置的服务需要将自己的精确位
近年来,随着各大高校每年招生数量的逐渐增多,高校宿舍管理工作人员的工作量越来越大,效率却越来越低,如何充分利用Internet和计算机技术为高校的宿舍管理工作以及学生的日常生活
标签推荐是一个新的研究方向,其旨在为目标资源自动添加标签作为描述信息,来缓解标签空间噪声数据增多、标签指代内容模糊等现象。目前,标签推荐方法主要有基于内容的方法、基于