论文部分内容阅读
计算机技术的飞速发展和信息系统在各个领域中的广泛应用,导致数据爆炸式地增长,基于传统数据库技术建立的信息系统中普遍存在着"数据丰富但知识贫乏"的现象.与此同时,随着市场竞争的加剧,新产品开发周期的缩短,决策者越发意识到将系统中蕴藏的丰富数据变成有用的信息是多么重要.在当今信息社会中,能否及时得到准确的信息已经成为企业能否成功的关键.于是数据仓库应运而生.在基于数据仓库的应用中,数据仓库处于中间位置,一边是为其提供数据的操作数据库,另一边是访问这些数据的用户.要想使数据能够发挥其最佳效用,更好地为用户服务,数据必须经过严格的准备、组织,呈现给用户.为此,本文构建更利于数据管理的数据库-操作数据存储-数据仓库(Data Base-Operational Data Store-Data Warehouse,DB-ODS-DW)三层体系结构;说明数据仓库的设计原则,数据模型的选择依据;设计与实现数据的清理、转换与加载模块.随着时间的推移,数据仓库中的数据量将不断增加,对查询的响应时间也会越来越长,为了提高查询效率,需将一些查询处理的中间结果存储在DW中,称为实体化视图.当数据源发生变化时,实体化视图应及时地反映源的变化,即实体化视图的维护.本文在三层体系结构下,对DB/ODS接口和ODS/DW接口的实体化视图的维护方法分别进行了讨论.其中由于DB/ODS接口要进行数据转换处理,使得该接口的维护更加复杂,因此对其讨论了强一致性补偿算法和多源视图的维护算法,并以简单的数据库添加操作的例子的结果比较两个方法.由于多源视图维护算法具有查询一致的优点,基于该算法提出了面向ODS的改进算法.作为案例,本文以房地产估价决策支持系统的设计课题作为研究背景,运用前面介绍和提出的分析方法对基于数据仓库的系统进行设计分析.同时通过示例证明了本文所提出的实体化视图维护算法的一致性.