基于关系数据库的XML数据存储方法的研究与实现

来源 :哈尔滨工程大学 | 被引量 : 0次 | 上传用户:hnkfxwj
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
XML数据的可扩展性和自我描述性使得它成为当前网络上数据传输的主要形式,但是它对数据的处理能力却相当的有限,实现XML存储为关系数据库以后,就可以利用关系数据库所带有的存储管理等技术来处理XML数据,所以把XML转换为关系数据库存储方式是很有研究价值的。本文从XML和关系数据库等基础知识入手,深入研究了XML数据在关系数据库中的存储方法,但发现其中存在的问题:基于DTD的存储方法不能够适应XML文档以XML Schema为标准的趋势,伯哈农存储方法的搜索算法不够高效同时转换规则存在一些漏洞等。本文针对XML文档的DTD资源的承前性和Schema资源的继后性提出了全面的存储方法,此种存储方法也是基于查询代价的,首先在求得初始模式之前增加了深度处理操作,然后通过DOM树解析工具得到初始模式,接着在获取模式空间的时候考虑了复杂节点和简单节点的区别并分别做出不同的处理,之后引入了以哈希连接算法为基础的代价模型,通过改进的爬山算法从模式空间中找出一个最优的模式,提高了存储方法的性能。最后,通过实验对改进的映射方法进行了验证,实验结果表明,改进后的映射方法和经典的伯哈农存储方法相比较具有更好的性能。
其他文献
近几年来对P2P 的研究迅速升温,各方面的应用层出不穷。特别是它提供无穷的存储空间以及不受限制的传输容量,这是传统中央服务器所无可企及的。P2P 网络中的节点既是服务使用
近十年来,传统的数据库系统即联机事务处理系统(OLTP)作为数据管理手段,主要用于事务处理,但OLTP已不能满足终端用户对数据库查询分析的要求,SQL对大型数据库的简单查询也不
随着信息技术的深入发展,许多金融企业都在自己的业务服务领域和日常工作中引入了信息技术以提高生产力,增强竞争力。报表是金融行业中用于数据统计和风险分析的重要工具,它
随着计算机技术的发展,互联网不断普及并已成为日常生活中获取知识和资源的重要途径,越来越多的人通过搜索引擎在互联网中寻找信息,但是由于传统的搜索引擎对信息资源缺少统
大数据时代的到来,使得数据量、数据复杂度和数据的处理方式发生很大变化,云计算被看作是继PC、Internet之后的第三次信息化革命,反应出“网络即是计算机”的思想,它把海量软
VHDL是描述数字系统的硬件描述语言,C是编写顺序语句程序的高级编程语言。由于C语言结构清晰,可扩充性强,因此将C语言描述的源代码编译为VHDL描述的代码,用具有顺序特征的C语
大多数企业的信息系统经过多年建设后,已经形成若干相对独立,功能各不相同的应用系统。构件是企业分布式应用的基本构成单元,在企业生产和遗留系统中存在着大量功能构件,如何
工作流技术已经在各个行业中得到了广泛的应用。随着企业业务的不断扩大,工作流平台必须能够准确、高效的响应应用系统的调用请求,要具有支持大量用户并发访问的能力。因此,
水流模拟一直是计算机图形学中最具挑战性的研究方向之一。目前,水流模拟方面研究大多在如何简化Navier-Stokes方程方面着手,由于这些方法需要计算水流每个质点在各个时刻的状
矿用隔爆馈电开关是煤矿井下配电系统的关键设备,作为配电开关,用于含有瓦斯或煤尘等爆炸危险环境的矿井中,控制和保护低压供电网络。其性能好坏直接影响着煤矿井下的生产安全和生产效率,而目前国内馈电开关普遍存在集成度低、可靠性差、智能监控水平低等缺点。本课题将嵌入式网络控制系统应用到馈电开关中,通过对矿山供电系统工作原理、真空馈电开关工作原理以及基于EasyARM2200(Philips LPC2210为