数据仓库查询优化研究

来源 :中南大学 | 被引量 : 0次 | 上传用户:youling0186
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
数据仓库存储大量历史数据,OLAP应用涉及到对大面积历史数据的复杂查询,查询优化是提高OLAP响应速度的关键。目前最有效的方法是增加综合数据的存储,但存储空间的有限限制了综合数据的存储量。本文从数据仓库的概念模型和逻辑实现两个层面对这个问题进行了深入的研究。 在数据仓库的概念层上,本文首先对多维数据模型的结构进行了研究,从理论上证明了当所有维的结构满足有界格时,多维数据模型的结构也是有界格。这为基于搜索格的优化策略奠定了理论基础。 本文提出了一种分介质、变粒度存储策略。将大量直接访问率低的详细数据存储在大容量低速介质(如磁带)上,并将这些存储在低速介质上的数据聚集成粒度相对较粗的综合数据存储在数据仓库中供OLAP分析处理;本文根据数据的访问频率动态调整需要存储到低速介质上的详细数据及其在数据仓库中需要聚集成的粗粒度数据,并提出了相应的动态调整算法。试验结果显示该策略能有效提高OLAP响应速度,减小数据仓库中的数据存储量。 在存储空间一定的情况下,压缩数据仓库的体积同样能增加综合数据的存储量。本文从数据仓库的逻辑实现角度上分析了数据仓库中大量存在的基本单一元组问题,结合XML技术提出了一种基于XML格式的OLAP实现方式——X-OLAP,用XML本身的层次结构来表示不同粒度之间的聚集关系,证明了所有OLAP操作都可以在X-OLAP上实现,其代数操作的完整性和封闭性成立。该实现方式能有效地压缩数据仓库的体积。 论文最后对全文进行了总结,并对OLAP的发展方向进行了展望。
其他文献
近年来,随着我们产生和搜集数据的能力不断增强,在许多商业和政府事务中计算机的日益普及、以及在数据收集工具方面的不断进步,我们面临着大量的数据。成百万的数据库已经被用于
大气和海洋中的流场是典型的时变向量场,属于非线性动力系统.这类流场中发生的现象在多数情况下难以用解析形式描述和分析.因此,探索用科学计算可视化的手段,观察和研究这类
高炉煤气流分布状态是高炉上部布料操作的主要依据,它对于高炉生产的稳定运行,提高产量,降低焦比是非常重要的.虽然目前高炉十字测温的径向分布一般都能够保证是W型,但是寻求
现在电信网正向数字化、智能化、综合化和个人化的方向发展,传统的电话业务已经渐渐不能满足人们的需要.智能网技术以其快速的业务开发模式、简洁的业务控制和管理等优点,在
随着人类社会和计算机技术的飞速发展,电子数据的积累出现了爆炸式的增长.这些海量的电子数据里面无疑隐藏着丰富的对人类深具价值的知识,而传统的在线处理系统(OLTP)只能利
计算机网络和通讯网络的综合发展,促成了智能网系统在通信领域的飞速发展。通讯网络在这几年的发展方向已经开始从扩展网络容量向增加和丰富业务内容的方向转变。智能网系统以
粒子系统是Reeves于1983年提出,是一种构造模糊形状物体的计算模型方法。其基本思路是采用大量具有一定特殊属性的微小粒子图元作为基本元素,以成千上万个不规则且随机分布的运
利用信息手段对不断产生的高通量生物数据进行分析处理是当前生物数据处理的趋势。人类基因组计划成功完成,使得生物信息学的研究进入了后基因组时代,蛋白质组学研究受到深入关
计算机系统的应用领域和复杂程度正在日益发展.其中的一个分支嵌入式系统更是抓住了当前数字电视等信息家电市场急速膨胀的机遇,得到了空前的发展.嵌入式系统的繁荣又带动了
随着Internet的发展,网格计算技术己成为当前网络并行计算的一个新的研究热点.网格系统由大量的异构资源组成,它具有复杂、动态、高性价比和局部自治等特点.由于网格系统中各