基于模式的XML文档在关系数据库中存储的设计与实现

来源 :北京航空航天大学 | 被引量 : 0次 | 上传用户:haibolovemj
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近年来,XML逐渐成为因特网上数据表示和数据交换的新标准.它迅速地被应用于科学数据语言和电子商务等领域.随着XML成为电子商务的数据标准,基于XML的数据交换数量呈现出指数增长的趋势.这样就出现了持久的XML存储的需求.经过数十年的发展,关系数据库系统越来越成成熟,并且具有很强的可扩展性,能够处理大规模的数据.一方面这样的系统提供了许多有益的特性;另一方面,企业中大量的数据是存放在关系数据库中的.把XML数据存储于关系数据库中,就可以实现基于关系的结构化数据和XML数据共存,从而应用程序可以方便使用这两种类型的数据.为了解决XML数据的存储问题,该文对XML及其相关技术进行了详细分析,并研究了XML文档在数据库中的各种存储技术,然后在此基础上提出并实现了基于模式对XML文档进行关系建模的原型系统.该文解决的主要技术难点有:1.提出了XSchema文法,用来形式化描述XML模式,并在此基础上建立了中间数据模型XSModel,用来抽离XML模式中的主要结构与语义特征;2.选取并改进了Hybrid Inlining算法,将算法的应用从XML DTD扩展到XML Schema,根据改进后的算法从XML模式生成适当的关系模式;3.根据XML模式映射生成的关系模式,采用XSLT技术设计并实现了对应的XML文档处理器,从需要保存的XML文档中抽取相关数据,以方便数据到关系模式的存储.该文在最后对完成的工作进行了总结,并对有待改进之处进行了展望.
其他文献
质量管理是软件开发过程中最关键的活动之一,它提供了一系列的活动并以此为依据保证软件过程和产品的质量.目前,软件质量管理大多依赖于质量管理者的经验;质量计划的制订与跟
操作系统是整个计算机系统的基础,它的可靠性、安全性影响到整个系统的可靠性、安全性。操作系统中最重要的部分是系统内核,因此必须要确保内核的可靠性。在可靠的内核下,同
本文主要讨论作者在博士阶段研究工作所涉及的量子信息处理中三个重要而基本的课题:量子信息的无错分辨、量子信息的克隆与删除、量子纠缠转化。在对量子力学和量子信息论做了
互联网络具有两个重要特征:一个是数据量非常大,另一个是数据更新速度极快。网络用户对及时的、个性化的网络信息服务越来越感兴趣。网络信息跟踪被用来跟踪动态网络,即时地获取
随着网络视频会议技术的发展,越来越多类似远程教学、招聘面试、员工培训这样的多媒体交互活动可以通过因特联网络跨地域的进行,在高速高效完成任务的同时大大节省了系统使用
网络处理器(network processor,NP)与通用CPU相结合的异构处理器系统正成为新一代网络计算平台的重要发展方向.在这种架构中,NP与通用CPU之间底层通讯效率的高低,直接影响到
近年来,以MPEG压缩编码为主流的图像视频技术的日渐成熟和IP网络技术的进步,为多媒体通信的发展奠定了良好基础,基于IP网络的视频传输和视频应用业务成为研究的热点。 本文论
随着医疗信息系统(HIS)的迅速发展,医院积累了越来越多的数据,如何充分利用这些数据,从中获取有价值的信息为医院管理提供准确的决策支持作用,这对医院信息化发展来说是至关
学位
在最近几十年里,三维模型已被广泛应用于工业制造、数字娱乐、城市规划、医疗健康、文物保护等领域。围绕三维模型的相关研究一直是计算机图形学研究的热点问题。这其中主要包