面向海量数据的高性能多维OLAP技术的研究

来源 :电子科技大学 | 被引量 : 5次 | 上传用户:bocha007
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着企业信息系统的完善和积累的数据量的增长,数据分析在现代企业中扮演着越来越重要的角色,OLAP(联机分析处理),主要指的是对数据进行实时的多维查询和分析从而满足决策分析需求,是目前数据分析领域最常用也是最有效的技术。OLAP经过多年的发展,业界已经有许多成熟的系统,无数的企业从OLAP技术获益。但随着我们进入大数据时代,所需要处理分析的数据呈爆炸式增长,传统的OLAP技术在应对海量数据的时候遇到了极大的瓶颈,出现了响应速度过慢或者根本无法处理等严重问题。因此研究新型OLAP技术并设计实现面向海量数据的OLAP系统以满足海量数据上的OLAP需求是业界迫切需要解决的问题。而当前日益成熟的分布式计算框架和分布式存储系统给解决这一问题提供了有效的途径。本论文主要结合当前的理论技术基础对面向海量数据的OLAP技术进行了研究,并且根据研究成果设计实现了一套基于预计算思想的面向海量数据的MOLAP(多维OLAP)原型框架,MOLAP的理念是通过将可能的查询事先预计算出结果生成Cube(数据立方体)以加速查询。针对海量数据的特点,本论文重点研究了以下MOLAP相关内容:1)妥善应对海量数据下预计算的维度灾难问题;2)设计海量数据适用的分布式Cube预计算算法;3)高效地处理预计算面临的数据增长问题;4)合理地应对分析业务需求改变带来的多维模型变化。基于研究成果设计并实现的MOLAP原型框架以Spark为计算框架,以HBase为主要存储组件,以Calcite为基础设计实现了SQL查询引擎,并提供了基于Web的可视化查询分析组件。该框架由于利用了强大的分布式架构,并且实现了高效的Cube预计算算法和Cube优化策略,可以对海量数据进行预计算生成Cube以提供低延迟的SQL查询,提供高效的OLAP分析服务。论文的最后使用业界最常用的SSB测试标准对本原型框架进行了测试,重点测试了Cube的预计算速度和存储空间占用以及对外提供查询服务的响应速度,并且和业界其他的大数据OLAP系统进行了对比测试分析。实验表明,在绝大部分应用场景里,本原型框架相比较于业界基于实时计算的OLAP系统有着较大的查询性能优势,并且预计算所占用的时间和空间也是可以接受的。
其他文献
作为一种文化现象,民族图腾已经成为当前文化研究和民族音乐研究的主要内容。居住在湘鄂渝黔边邻地带的土家族自古就相信万物有灵,他们认为大自然是有生命、有意识的活物,至
介绍微细粒级锡石应用浮选技术回收的试验,得到了较好试验指标。解决了长期困绕微细粒级锡石难回收的难题。
扇形中深孔爆破的落矿方式在大红山铜矿中的应用占总采矿量的61%以上,但大块产出率较高严重制约着矿山供矿强度,平均大块率高达22.7%。为了降低大块率,实现矿山生产的高效发展,提
江心洲在我国江河中分布广泛,伴随社会经济的发展,城市土地等资源日益稀缺,江心洲作为潜在的资源逐渐受到广泛的关注。随着旅游业和旅游市场的不断发展,很多城市计划对人类已
<正>当我们将要延续头脑中对于雕塑与设计概念的惯性认知来对此进行探讨时,便会发觉处于混淆概念的比对,所作出的结果将是无效的。因为在触及到这一对概念时,应该清楚地将其
随着国际间竞争日益激烈,产品需求多样化,产品生产周期逐渐缩短,以及产品技术层次不断提升,物流工作已被企业视为挖掘潜在利润的"第三大利润源泉",而做为供应链三大核心内容
英国高等教育以卓越的教育质量著称,多元化与标准化结合的内部治理促进了大学的高水平发展,保证了大学内部各项工作高效有序地开展。从横向看,英国大学内部治理主要包含了牛
大家都知道,美国苹果电脑公司的商标,是一只被咬了一口的苹果。第一次看到这个标志的时候,我就很惊奇。漂亮完整的苹果有的是,为什么要用被咬了一口的苹果作商标?有人说是为了纪念
期刊
在痕量、超痕量的测试当中,原子荧光光谱法是一种十分有效的方法。在实际应用中,该方法具有分析速度快、线性范围宽、重现性好、灵敏度高等优势,在各类样品中微量元素的痕量、超
生态文明制度与文化因其相互影响、相生相长而存在哲学上的通约关系:文化是生态文明制度的内在支撑,影响生态文明制度的起源、演变及实效的发挥;生态文明制度是文化的外在表