论文部分内容阅读
企业信息系统数据库中积累了大量的历史数据,这些数据不仅占用大量的存储空间,同时使得系统运行不稳定性和不安全性因素增加。但是,这些过期数据不能被轻易地删除,因为这些数据并不是毫无价值的。它们是数据挖掘和联机分析处理重要的数据来源和操作对象,是企业进行分析决策时重要的数据基础,因此,如何科学有效的管理和存储这些过期数据,成为企业管理人员面临的巨大挑战。可扩展标记语言XML(Extensible Markup Language)是本文研究工作的重要基础。本文将XML技术应用于数据归档,改变关系数据库存储归档历史数据的方式,同时保证数据的可访问性、可利用性和有效性,避免了因系统和平台的差异所造成的数据无效问题。本课题为了解决由于数据库中存在大量过期数据,造成的系统运行速度减慢,系统不稳定性增加,数据检索效率降低等问题,设计研发历史数据归档系统。根据实际应用的需求,本文提出了一种基于XML技术,以JAVA+TOMCAT+STRUTS2为体系架构的数据归档系统的总体设计方案;分析确定了归档,检索和重构三大功能模块,设计实现了历史数据的归档系统。本文深入探讨了数据归档系统开发过程中所涉及的关键技术,主要包括关系模式和XML模式之间的转换映射方法,代码回替方法,重构前后数据的代码一致性问题和解决方法,XML文件索引检索算法等,并在此基础上对该系统的总体架构进行了分析,细致地研究了各功能模块的基本原理与应用。本文在深入分析原有的归档策略的基础上,提出了归档数据分级存储管理的思想,将分级管理思想应用到系统设计当中,提高了归档数据的存储空间和检索数据的效率。本文实现XML文件检索功能过程中,对采用的多分支索引路径算法进行了改进。当系统获得单分支路径查询结果,不是将单路径查询结果通过连接操作获得多路径结果,而是充分利用索引,通过索引表判断结点的关系,从而进一步判断标签的关系。与原有算法相比,在查询语句较长,查询项较多的情况下,改进后的多分支路径算法具有更高的检索效率。系统目前正处于试运行阶段,运行结果表明,系统运行情况稳定,安全实用,操作简单,大大改善了管理信息系统的运行状况,提高了系统的运行效率,增强了系统的安全性和可靠性,同时降低了企业为维护数据信息所投入的人力物力,具有良好的开发和应用前景。