【摘 要】
:
互联网中包含着大量的半结构化的XML数据,正是因为这种半结构化特性,使得用传统的数据库查询优化技术来检索数据十分困难。如果通过代数系统对XML查询表达式进行转化,然后应
论文部分内容阅读
互联网中包含着大量的半结构化的XML数据,正是因为这种半结构化特性,使得用传统的数据库查询优化技术来检索数据十分困难。如果通过代数系统对XML查询表达式进行转化,然后应用代数转化规则对表达式进行优化处理,则能够较为有效的提高XML数据的查询效率,该研究方法已成为当今XML数据查询优化领域的一个研究热点。目前XML代数的研究重点在于规范XML查询语义,并未考虑查询优化因素,而且这些代数具有明显的程序化思想,很难进一步优化,只能利用遍历方法求解查询,造成查询效率的低下,不适用于大规模XML数据的查询需求。论文通过对当前XML数据查询优化技术进行总结与分析,借鉴已有XML查询优化技术,采用面向集合的PAT代数系统,提出了一种基于PAT代数的查询优化方法。论文首先通过对现有XML查询优化技术和XML数据的查询优化体系进行研究与分析,提出了一种基于结构索引的查询优化方法。该方法能够缩短查询路径,从而提高查询效率;然后,通过对PAT代数系统的查询等价式进行分析,并根据这些等价式转化方法对PAT代数进行扩展,结合启发式的思想提出了基于PAT代数的确定性转化规则体系以及基于结构索引的规则转化方法。最后,论文通过使用扩展后的PAT代数表达式转化规则对XML查询表达式进行代数转化,并结合文中提出的语义优化策略,能够较为合理地清除冗余操作,化简查询表达式,从而减少了代数操作次数;运用文中提出的索引引入策略,把结构索引引入到查询表达式代数转化过程中,有效缩短了查询路径。经实例验证与性能分析,论文提出的查询优化方法能够较为有效地提高了XML数据查询的查询效率。
其他文献
社会关系广泛存在于现实生活中,它们可以抽象成各式各样的社会网络。近些年来,研究者们发现社会网络中存在的社团结构是大规模网络分析和挖掘的基础,对于分析社会系统的组织
目前,基于内容的垃圾邮件过滤方法主要采用统计分析法,此类方法对垃圾邮件内容所表达的思想缺乏精准的定量描述,研究垃圾邮件内容所表达思想的描述形式对垃圾邮件的准确识别
自上世纪八十年代以来,织物变形的模拟仿真一直是计算机图形学领域内的一个研究热点。弹簧-质子模型因其原理简单,易于实现,在织物仿真中得到了比较广泛的应用,但是这种模型
现今互联网信息技术迅猛发展,似乎在一夜之间,大数据(Big Data)变成一个最流行的词汇。用户在利用搜索引擎便捷获取各类信息的同时,也面临着如何从海量数据中剔除那些影响信
互联网应用的蓬勃发展伴随了网络入侵的迅速增长。攻击的目标也逐渐由系统用户对象转入操作系统内核;这种攻击更难于发现和处理,给操作系统带来了巨大的破坏性。以内核rootkit
数据传输是各种类型的无线网络都必须关注的基本功能。在本论文中,我们重点关注两种类型的无线网络—无线传感器网络和无线双向中继网络—中的基于编码的无线数据传输。无线
传统的无线自组织网络通信中,组成无线自组织网络的中间节点主要负责接收相邻节点发送的数据信息,然后将接收的数据信息进行存储与转发。由于无线自组织网络通信具有不稳定性
服务业作为从事社会化、专业化服务生产的产业,在社会经济中扮演着越来越重要的角色,世界经济已经进入服务经济时代。将整个服务提供过程整合起来实施服务供应链管理,有助于准确
数据挖掘技术是近年来数据库和人工智能等领域研究的热点课题,关联规则挖掘是数据挖掘的一个主要研究内容,研究高效的关联规则挖掘算法具有重要的现实意义。发现频繁项集是关联
随着线性控制理论和网络通信相关技术的发展,网络化控制系统受到越来越多的关注。相对于传统的点对点直接连接的控制系统而言,网络化控制系统有许多优点。例如,系统的安装费