【摘 要】
:
随着XML的广泛应用,XML数据量呈指数级增长,如何高效地管理这些数据成为当前急需解决的问题。目前已有一些方法,如利用文件系统或传统的关系数据库系统来存储和管理这些数据
论文部分内容阅读
随着XML的广泛应用,XML数据量呈指数级增长,如何高效地管理这些数据成为当前急需解决的问题。目前已有一些方法,如利用文件系统或传统的关系数据库系统来存储和管理这些数据。但是这些方法并非针对XML所设计,在管理XML数据时有其局限性。因此需要针对XML数据的特征,研究适应其需要的原生XML数据管理技术。本文研究原生XML数据管理中的核心技术,并以此为基础实现了原生的XML数据引擎系统,主要做了以下工作:1.分析了常见的XML数据编码方案的优缺点,提出改进的DLN编码方案。此方案利用位模式来直接确定编码的长度,而不是DLN采用的递归插入次值的方式,从而缩短了编码长度。2.根据XML的特点,对Xindice系统的压缩存储方法进行改进,设计并实现了基于字节流的压缩存储。这种原生的XML存储方法在实现XML数据高效压缩的同时还保持了数据之间关系。3.以基于字节流的压缩存储为基础,结合改进的DLN编码,提出既能支持结构查询和又能支持值查询的复合索引结构,并给出该索引的构造算法。4.设计了XQuery查询语言核心表达式(PATH和FLWOR表达式)的文法,使用JavaCCT工具根据此文法生成词法语法分析器,进而利用该分析器由XQuery语句生成相应的语法树。5.以生成的语法树为基础实现查询表达式的处理。对于PATH表达式,除了实现通常的导航式处理之外,还根据本文采用的复合索引实现了集合式处理。对于FLWOR表达式,采用基于子句的查询处理方法,由语法树分解出表达式的各子句,然后进行相应的处理,最后得到XML文档的查询结果。
其他文献
随着Internet技术的迅速发展,网络入侵问题也越发严重,入侵检测己成为网络防护安全体系中的重要组成部分。入侵检测系统通过从计算机网络或计算机系统中的若干关键点收集信息
目前,由于我国支票使用总量的年年增加,给银行业务带来很大的工作量和压力。影像化支票自动识别作为解决此问题的一种计算机应用技术,已经越来越多的受到人们的重视和研究。而在
随着互联网的发展,网上信息迅速增加,搜索引擎作为帮助人们从网络中快速获取信息的工具,使用日益广泛。但由于存在许多网页转载的情况,搜索引擎的返回结果中存在重复信息,既
我国证券市场已走过了十几年的历程,虽然起步较晚,但在证券信息计算机处理方面起点很高、发展迅猛。随着近年来网络技术的飞速发展和用户操作水平的提高,证券公司证券交易、网络
随着计算机、通讯技术的不断发展,人们越来越迫切希望可以在任何时候、任何地点、与任何机器都可以自然交流,而语音通信则是一种最理想的人机通信方式,语音识别技术由此诞生
音字转换技术是建立在语言学、计算机科学、数学、信息论、人工智能等多个学科基础之上的一项综合研究,一直以来就是中文信息处理的研究热点,其最重要的应用之一就是中文拼音
随着互联网技术的飞速发展,网络为我们提供了多元化的海量信息,越来越多的人开始使用搜索引擎来获取所需要的信息。然而,虽然搜索引擎发展迅速,但其效果远未达到令人满意的程
对患者进行治疗是一个比较模糊的过程,它通常无法用一些准确的词语或数字来描述,这也是人们在看病时倾向于找有经验的医生的原因。然而由于治疗过程中病人的各项体征异常程度是
作业车间调度问题是制造系统设计中的一个重要问题。作业车间调度系统中,包括一个n个作业的工件集合和一个m台机器的设备集,其中每个工件包含一系列的操作,同时每个机器某一
船体下料是船体设计制造过程的最初环节,直接影响船体制造的钢材利用率,关系着造船企业的经济效益。本文以某船厂的船体型材零件自动设计为实际应用背景,通过型材下料图形系