论文部分内容阅读
数据仓库系统是基于分析型数据环境的高级辅助决策工具.聚集体现了数据仓库集成性的重要特征,提供了一种便于使用、快速而且响应时间一致的多维数据集合,为OLAP以及其它应用提供了基础.所以如何通过聚集元数据构造合理高效的聚集策略是构建数据仓库系统非常重要的一个环节.该文给出了深化到维层次一级的聚集方案的定义,为维层次级的聚集策略提供了依据.在数据仓库和联机分析工具的研究和开发的实践中,提出了一种基于元组表示的聚集管理和优化策略.该文讨论了聚集方案之间的生成关系,给出了用于求解聚集方案之间最优生成路径问题的方法;基于对数据仓库质量、数据仓库的维护与优化的研究,在分析和处理联机访问日志的基础上提出了基于数据仓库质量的用户适用策略和聚集策略优化方法.该文根据数据仓库反生命周期的特点,在分析和处理联机访问日志的基础上,基于对聚集策略的研究,试图利用Agent的自主性、反应性、社会性等特性对数据仓库的聚集元数据主动、动态地进行更新优化,使得系统管理员可以从盲目性与繁琐的工作中得到解脱.作者在数据仓库技术与OLAP技术的基础上,在遵循CORBA规范的Visibroker软件平台上,构造了一个主动式的聚集元数据优化模型.从而动态地调整与优化聚集策略,以提高数据仓库系统中OLAP的效率和性能,增强系统的主动适应能力.该文的研究内容基于作者参与开发的科研项目.SEI Dw Studio1.0是我们研究室为中国人民银行大连清分清算中心基于MIDAS软件体系结构及中间件技术开发的关系型数据仓库系统:SEI Dw Studio2.0是我们研究室为大连国际合作集团公司开发的基于开放元数据的数据仓库系统.文中给出了两个系统的构建及部分实现方案.