论文部分内容阅读
在信息技术高度发展的知识经济时代,一方面,各种实际应用领域的数据量都在急剧膨胀;另一方面,立于知识经济时代的企业,激烈的竞争致使他们对决策支持系统分析角度的要求不仅在广度上力求信息全面,而且在深度上要求数据信息具有粒度层次性。由于数据仓库是面向联机分析处理(on-line analysis processing,简称OLAP )而设计的,用来存储供查询和决策分析用的、历史的和集成的数据。以联机数据分析处理为主的决策分析系统对数据仓库模型有效管理海量数据的能力提出挑战。鉴于此,构建能有效管理海量数据并支持复杂维层次结构的多维数据模型成为数据库技术研究的新热点。本文探索在商空间理论的指导下,以海量数据的有效层次化管理为目标,提出基于商空间理论的多维数据仓库模型。模型通过商空间理论中的等价关系与模型中维层次属性建立一一映射,以等价关系的粗细为游标调控维层次属性的粗细粒度转化实现聚集等数据仓库核心操作,并采用多维数组结合树索引的方式实现多维数据模型的实化立方体集有效存储,这样不仅保持了模型中原数据语义间关系原貌,而且增加了按商空间保假原理进行OLAP索引查询的途径。整个模型的选择一直以提高OLAP查询的速度、优化OLAP查询的操作为目标,最后结合教学质量审查系统数据仓库(TQSDW)的数据与性能表现对模型的选择进行分析测试。主要研究成果如下:1.新构建一个描述复杂维层次结构的多维数据模型。依据商空间粒度理论中粗细粒度层次灵活转换技术,该模型不仅支持数据集合的基本代数操作,而且其在维层次间粗细粒度灵活转换的聚集操作(如层次聚集,维聚集等)中具有优势,而聚集操作是OLAP操作中(如上卷,下钻等)核心操作的基本步骤,在OLAP基本操作和OLAP查询中具有比较重要的地位。2.探索该多维层次化数据模型的聚集立方体存储实现方式。依据多维数据模型其维层次具有分层递阶逻辑结构的特征,考虑对实化立方体采用构建维层次树的方式来实现存储。并提出相应实现存储功能的HDEKC算法。3.研究采用商空间理论索引方法实现对多维数据模型进行幂聚集操作及其OLAP查询功能。提出基于商空间理论的Data Cube幂聚集操作AQCA算法。