论文部分内容阅读
随着计算机与信息技术的飞速发展,使人们能以更快、更廉价的方式获取信息,这就使得信息的数量以指数速度增长,人们称之为信息爆炸。在这些大量数据的背后隐藏着很多具有决策意义的有价值的信息,同时,如此规模庞大、纷繁复杂的数据体系也让使用者漫无头绪,无从下手。那么,如何发现这些有用的知识,使之为管理决策和经营战略发展服务呢?基于数据仓库的分析技术便是解决上述问题的重要途径之一。
本文是在论述了数据仓库的概念、体系结构、重要技术、开发策略及相关联机分析处理(OLAP)技术的前提下,基于数据仓库和OLAP理论,针对快餐销售业务领域,给出了数据仓库的总体设计模型和整个系统的逻辑框架雏形及软件架构,实现了对于快餐销售业务海量数据的多维分析功能,通过在快餐销售行业领域的模拟实验应用,为企业的科学决策提供了一定的依据,取得了较好的效果。
本文的主要工作是根据快餐销售行业的业务需求,设计企业数据仓库的概念模型、逻辑模型和物理模型,并基于上述模型给出了扩展标记语言(XML)元数据描述,并本着理论与实践相结合的态度,采用手工ETL处理的方式,在已有的数据仓库模型的基础上,通过深入剖析J2EE开源框架—JPivot的处理机制,对其进行了二次开发,以满足更加形象化和直观化显示多维分析操作结果的要求。
此外,本文还对于在数据仓库、联机分析系统应用中遇到的ETL问题给出了手工处理的转换规则示例;对于数据仓库的建模问题,根据实际需求选择了星型数据模式;对于元数据的描述问题,给出了使用扩展标记语言(XML)的形式化描述方案;对于多维分析的查询问题,采用了多维表达式(MDX)的处理机制;对于数据仓库数据存储的问题,采用了分区、索引等优化策略;对于多维分析的形象化和直观化的显示问题,采用通过XSLT来渲染XML来生成最终的HTML结果页面的方法。在数据仓库的设计、数据存储、多维分析的响应能力和结果的显示方式等方面均取得了较好的效果。