论文部分内容阅读
数据仓库和在线分析处理(OLAP)已成为决策支持系统的两大基本要素。数据仓库技术在过去的十年中得到了长足的发展,许多软件厂商也已实现了数据仓库和OLAP并在全世界的各行各业已有了非常成功的应用。随着各企事业单位的快速发展和高速信息化,各级部门或分公司都已经具有了自身的一套信息管理系统,以及相应的软硬件体系。如何在这种参差不齐,地域分散,而且各式各样的信息系统基础之上建立一套数据仓库系统,而尽量保留各部门原有的投资和运行模式已经成了目前市场上的新的需求。本文首先概述了数据仓库和OLAP联机分析处理的基本概念,并根据作者所从事的项目经历,介绍基于P2P架构的数据仓库系统。详细描述了该系统的体系结构及其各模块功能。该系统借助Infotree信息交换系统的P2P架构,在一定的程度上,将数据抽取和清洗的工作负载在网络域中的各个结点中进行了分担,这对于该系统的性能提高具有非常重要的意义。同时,在OLAP方面研究了目前常用的几种索引策略,并着重介绍了目前最为流行的多维索引——位图索引,在此基础上提出了基于S-Tree架构的层次化位图索引,并在时空复杂性方面与广泛研究和应用的编码位图索引进行了比较。