XML查询改写技术研究

来源 :中国人民大学 | 被引量 : 0次 | 上传用户:wangqin613117
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着XML的广泛应用,XML数据呈现爆炸性增长,如何有效的管理XML数据成为一个挑战性问题。查询处理和查询改写技术是数据管理研究中的一个核心问题,通过一些方法将已初始的查询改写为一个效率和资源利用率更优的查询。XML查询改写与传统改写问题不太一样,它提出了新的研究问题和挑战。  现有的XML查询处理技术代表了两个领域的研究,数据库领域和信息检索领域。数据库领域注重开发一些结构化查询的语言和提高结构化查询的效率等。信息检索领域关注对非结构化数据的检索,主要集中对关键词检索的研究,提出了许多技术来改进搜索结果的质量,如查询改写和结果排序等。目前两者有融合的趋势,它们相互借鉴已有的研究成果来改进XML查询的质量。本文的围绕XML数据的查询处理问题展开,分别对结构化查询改写和关键字查询改写进行了深入研究。  “Transform”查询为XQuery/Update中的一种特殊查询,在XML安全视图和访问控制等方面有着重要的应用。“Transform”查询需要先拷贝XML结点,并对拷贝的结点执行更新操作,通常会拷贝和更新大量与查询结果无关的结点。因此如何减少这些无用的拷贝与更新操作是“Transform”查询优化的关键。针对上述分析,本文基于XML代数提出了三种方法对查询进行优化,它们分别是:等价转换,“Lazy”处理策略,以及“Hybrid”策略。  XML关键字查询为用户提供了灵活、友好的查询方式,但是查询结果比较差。本文对已有的XML查询改写进行了分类和分析,提出了一种全新的方法自动地将关键词改写为结构化查询。基本方法是将查询关键词拆分为指向结构的词和指向内容的词,从数据中抽取出指向结构的词的关系图,并将查询改写问题转化为关系图的生成根树为问题。研究了有向图存在生成根树的必要条件、生成根树计数、有向图的改造、带权有向图的最优生成根树和前k个权值最大的生成根树的求解等问题。
其他文献
随着互联网产业的迅猛发展,数据呈爆炸性增长趋势,海量数据的处理对计算能力的要求远远超出自身 IT架构的计算能力,云计算的概念应运而生。作为云计算的关键技术,云数据管理为业
随着主存访问速度与处理器运算速度差距的日益增大,主存已经成为计算机系统主要的性能瓶颈。同时,主存容量和工作频率的持续提升,使主存能耗在系统总能耗中占据了更大的比重。因
本体作为语义web的核心技术,具有较强地语义解释能力。研究针对专业领域的本体构建即领域本体的构建,将对专业领域的发展起到推动作用,能够进一步拓宽本体的应用范围。本文将领
工作流技术起源于企业办公自动化领域,是实现企业业务流程建模、业务流程仿真分析、业务流程优化、业务流程管理与集成,从而最终实现业务流程自动化的核心技术。工作流引擎作为
随着社会和经济的发展,家庭是民生要素的综合载体,是经济、政治、社会、文化的全息缩影,在社会的信息化发展方面显得越来越重要。家庭信息化的目的是通过家庭的数字化和网络
P2P流媒体技术的引入,使视频点播系统快速成为互联网中最受关注的应用之一。随着流媒体视频点播在校园网中的日趋流行,校园网络带宽被P2P应用逐步吞噬,已经开始影响到正常的
随着计算机技术的广泛应用,软件系统的规模和复杂性不断攀升,由于软件错误直接造成系统失效的比率持续递增。软件的故障定位可以提高测试阶段的效率,也是开发可靠性软件的重
信息系统中对象的属性取值往往不是单一的数值,可能是取值范围,我们称属性值为区间值的信息系统为区间值信息系统。区间值信息系统是一种重要的数据描述模型,它在工程建设、
在互联网技术迅速发展的今天,Web系统的应用已经渗透到各个行业,随着用户数量的增多,企业对Web系统的需求越来越复杂,使Web网站的性能优化的问题显得更加重要。  在目前互联网
随着RDF越来越被广泛利用于知识管理领域,一个有着较大规模的RDF知识库就显得越来越重要。目前,大多数RDF知识库都是通过抽取和挖掘Web上的数据来创建以及扩大的。它们的数据源