OLAP技术在数据分析中的应用

来源 :计算机光盘软件与应用 | 被引量 : 0次 | 上传用户:gl_521
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
  摘要:首先介绍了OLAP的概念、功能特征,然后通过实例对多维数据库的概念、层次关系和多维数据分析的主要操作进行了详细描述。最后,以ORACLE公司的Hyperion产品作为多维数据库分析的平台,通过对一大型能源集团公司的财务预算系统中的预算数据进行分析,介绍了OLAP技术方法的实际应用,总结了OLAP技术在数据分析工作中的优势。
  关键词:联机分析处理;多维数据库;数据分析;甲骨文产品;财务预算系统
  中图分类号:TP392 文献标识码:A 文章编号:1007-9599 (2013) 02-0000-03
  OLAP(On-Line Analytical Processing,即联机分析处理)是一种多维数据库技术。这种技术的设计目的是针对特定问题的实时数据访问和分析,并且提供直观易懂的查询结果。还有一种处理技术OLTP(on-Line transaction processing,即联机事务处理),与OLAP不同,OLTP是传统的关系型数据库的主要应用,主要是基本的、日常的事务处理。
  1 OLAP技术介绍
  1.1 OLAP技术的发展背景
  60年代,关系数据库之父E.F.Codd提出了关系模型,促进了联机事务处理(OLTP)的发展(数据以表格的形式而非文件方式存储)。1993年,E.F.Codd提出了OLAP概念,认为OLTP已不能满足终端用户对数据库查询分析的需要,SQL对大型数据库进行的简单查询也不能满足终端用户分析的要求。用户的决策分析需要对关系数据库进行大量计算才能得到结果,而查询的结果并不能满足决策者提出的需求。因此,E.F.Codd提出了多维数据库和多维分析的概念,即OLAP。OLAP技术正是为了满足决策管理的需求而产生的。
  1.2 OLAP特征
  OLAP的技术核心是"维"(Dimension)这个概念。“维”是指一种视角,是一个判断、说明、评价和确定一个事物的多方位、多角度、多层次的条件和概念。通过把一个实体的多项重要的属性定义为多个维,使用户能对不同维上的数据进行动态的多维快速访问和分析。包括:在维之间、成员之间交叉组合分析;对连续时间段进行趋势分析;将数据切片从不同切面比较数据;向下钻取到组合数据的更深层观察细节数据;向上上卷到细节数据的更高层观察汇总数据.因此OLAP也可以说是多维数据分析工具的集合。由此可以得出OLAP的四个特征:多维性、快速性、可分析性和信息性。
  1.3 多维数据的概念及层次关系
  关系数据库是围绕一条一条“记录”而形成的。多维数据库的技术核心是“维”,类似于数组。下面举例说明:NBA(National Basketball Association)联盟有三种收入来源(转播、门票和广告),下表是其中两支NBA球队(LAKERS,KINGS)的销售收入,其中表1是关系表,表2是根据每支球队的销售来源转化成的多维表。
  通过上图可以看出,表2中表达的数据关系更直观。在多维数据库中,通常将“球队”定义成“组织”(Entity)维,将“收入来源”定义为“业务方向”(Business)维,销售额定义为“科目”(Account)维。表2从组织维和业务方向维展示了销售收入状况。其中,“Entity”为维度,球队名称:LAKERS,KINGS为维度成员,即维值。“维”具有层级关系,如父子关系,兄弟关系等。如本例中,Entity和LAKERS的关系就是父子关系,LAKERS和KINGS的关系为兄弟关系。若在Entity和LAKERS之间定义了其他维值,如NBA、WEST(西部)和Pacific Division(太平洋赛区),即:Entity-NBA-WEST-Pacific Division-LAKERS,那“Entity”与“LAKERS”的层级关系就变成了祖辈与后代的关系。
  1.4 多维数据分析的操作
  OLAP的基本多维分析操作有钻取(roll up和drill down)、切片(slice)和切块(dice)、以及旋转(pivot)、drill across、drill through等,对数据进行剖析,使用户能从多个角度、多侧面地观察数据库中的数据,从而深入分析包含在数据中的信息。
  钻取是改变维的层次,变换分析的粒度。它包括向上钻取(roll up)和向下钻取(drill down)。roll up是在某一维上将低层次的细节数据概括到高层次的汇总数据,或者减少维数;而drill down则相反,它从汇总数据深入到细节数据进行观察或增加新维。切片和切块是在一部分维上选定值后,关心度量数据在剩余维上的分布。如果剩余的维只有两个,则是切片;如果有三个,则是切块。旋转是变换维的方向,即在表格中重新安排维的放置(即行列互换)。
  根据综合性数据的组织方式的不同,目前常见的OLAP主要有基于多维数据库的MOLAP及基于关系数据库的ROLAP两种。MOLAP是以多维的方式组织和存储数据,ROLAP则利用现有的关系数据库技术来模拟多维数据。在数据仓库应用中,OLAP应用一般是数据仓库应用的前端工具,同时OLAP工具还可以同数据挖掘工具、统计分析工具配合使用,增强决策分析功能。
  2 OLAP技术在企业财务预算数据分析中的具体
  下面以ORACLE公司的产品Hyperion系统为例,介绍OLAP技术在企业财务预算数据分析中的应用。Hyperion系统是一种基于Web的OLAP解决方案,该产品分为三层架构,客户端、应用服务器和Essbase数据库。用户可以通过浏览器访问应用服务器,进行检索和分析数据;也可以通过Essbase Spreadsheet Add-in插件直接对数据库进行操作,进行数据访问和分析。Essbase Spreadsheet Add-in是一款软件,可以与Microsoft Excel实现无缝连接。安装该插件程序后,Excel应用程序中将增加一个菜单项——Essbase。该菜单提供了可以对数据库操作的命令,例如“连接”、“旋转”、“放大”(向下钻取)、“缩小”(向上钻取)、“发送”等功能按鈕。用户仅通过单击鼠标然后进行拖放就可以展开立体式、快速灵活的数据访问和分析。   下面应用前面总结的多维数据库技术方法对一大型能源集团公司的预算数据进行数据分析,数据分析的前提是在执行了业务规则(可以认为是计算财务数据的勾稽关系的公式)。连接数据库和应用“Budget”后,搭建一张利润表。如图1:
  下面从多角度组合分析该大型能源集团公司的利润情况。比如我们想了解集团公司下属各单位2012年的盈利状况,只需要选中“集团公司”,然后双击,即可进行向下钻取,获取各单位的数据,如图2:
  以上是从组织维的角度对数据进行了查询,现在换一个角度,我们从年份和场景进行对比各下属单位的盈利情况,通过对“2012年”和“预算”维值的拖拽,选择“2012年”的兄弟级成员“2010年”和“2011年”,选择“预算”的兄弟级成员“实际”,从而形成图3:
  对比2010年、2011年的预算数、实际数和2012年的预算数据,经分析发现,从集团公司层面,集团公司2010年的实际利润1480超过了预计利润1450;2010年、2011年实际利润和2012年预算数据对比,每年利润成上升趋势,说明公司经营状况良好。但是再仔细分析发现,2010年实际利润虽然达到了预期目标,但是有一家分公司的利润为-10,这就会让分析人员去进一步研究是什么原因造成了这种状况,对“上海分公司”执行“仅保留”操作,“2010年”、“预算”和“2011年”、“实际”执行相同的操作,然后将“净利润”展开,将“上海分公司”进行“旋转”操作,得到下图4:
  通过对图4分析得出,上海分公司净利润的减少是由于营业总成本的增加和投资收益的减少造成的,经过进一步分析,其中营业总成本的增加体现在人员管理费的增加和研究开发费的增加,因为今年上海分公司引进了一批技术人才进行新技术的开发研究,预计技术成熟后,即可投入到开发生产中,为公司盈利。投资收益亏损是由于当时对投资的一个项目没有进行很好的预估,造成了公司的亏损。通过一系列的分析,得出了结论,这能够指导公司在将来制定更加合理的战略决策。
  3 总结
  按照企业的业务目标,对大量的企业数据进行分析和探索、揭示隐藏其中的规律性,指导管理者决策,OLAP技术的灵活、高效的特点被体现的淋漓尽致,对于从大型多维数据库在获取数据也显得轻而易举,另外它还具有启发性,引领分析者进行进一步的思考,做进一步的分析,直至得到明确的结果和结论。能够更好的指导企业进行经营决策管理,提高企业经济效益,提升企业的市场竞争力。
  参考文献:
  [1]ERIK THOMSEN.OLAP解决方案:创建多维信息系统(第二版)[M].朱建秋.北京:电子工业出版社,2004.
  [2]施伯乐,朱扬勇.数据库与智能数据分析:技术、实践与应用[M].上海:复旦大学出版社,2003.
  [3]姚家奕.多维数据分析原理与应用实验教程[M].北京:电子工业出版社,2007.
  [4]姚家奕.多维数据分析原理与应用[M].北京:清華大学出版社,2004.
  [5]刘汝焯.审计数据的多维分析技术[M].北京:清华大学出版社,2006.
  [6]陈安,陈宁,周龙骧.数据挖掘技术及应用[M].北京:科学出版社,2006.
  [7]ALEX BERSON,STEPHEN J.SMITH.Data Warehousing.Data Mining and OLAP[M].USA:Computing Mcgraw-Hill,1999.
  [8]林杰斌,刘明德,陈湘.数据挖掘与OLAP理论与实务[M].北京:清华大学出版社,2003.
  [作者简介]曹洪(1982-),男,江苏沛县人,中级职称,南开大学学士学位,主要研究领域为数据库与信息系统。
其他文献
一直以来,业界呼吁监管高层制定专门的国家宽带战略,以加速推动中国宽带网络基础设施建设的步伐。宽带中国战略纠结多时,而今曙光初现,2013年初工信部再次将宽带发展作为了今
一、追溯GIANNI VERSACE(詹尼·范思哲)&GIORGIO ARMANI(乔治·阿玛妮)的生活背景GIANNI VERSACE以富于魅力的大胆暴露设计打破了传统模式,虽然总引起争议,却得到全
在"2013中国互联网应用创新年会"上,中国移动互联网基地总经理杭国强发表了主题演讲。杭国强提出,中国移动互联网基地将以构建开放平台为基础,对外共享线上、线下渠道,开放计费
二滩水电站表孔经过十多年的运行后,各孔导墙及溢流面上开始出现裂缝,所有裂缝均有不同程度的析出物沉积,影响拱坝的安全稳定运行.表孔闸门液压杆支承点等应力复杂、钢筋布置
摘 要:本文简要地介绍了基于IGRS标准的智慧社区云服务平台开发,阐述了其平台开发的系统整体架构设计及其实现的系统功能,以期和智慧社区云服务平台的开发学习者共享。  关键词:IGRS标准;智慧社区;云服务;平台  中图分类号:TP393  2008年11月IBM提出智慧地球概念后,我国已有多个城市如北京、上海、广州、南京、武汉等纷纷加入到智慧城市建设当中,而智慧社区就是智慧城市组成的基本单元。智慧
<正>一、什么是竞争政策成熟市场经济国家的经济政策,主要包括财政政策、货币政策、贸易政策和竞争政策。不同的经济政策从不同层面对国家宏观经济进行调控。竞争政策的基本
现代人越来越希望摆脱束缚,脱掉西装,甩掉领带,但是不可能不穿鞋就出门,想要享受,GEOX给你。
伦敦的各行政区委员会计划为市民提供免费的Wi-Fi,以将伦敦打造成欧洲网络最畅通的城市,具体的方案预计将在未来几周内确定下来。大伦敦的33个行政区中有16个区正在进行该计划
在当前电子商务飞速发展的大背景下,实现了数据库技术与Web技术的融合进步,企业或者客户可以在任何时间、任何地点获取网络信息,由此产生一定的经济效益。但是由于Web数据库
"西洋的时装摄影发展之早,早于我们将近一个世纪之久",记得这是两年前第一次向读者推荐西洋时装摄影的开篇语.由于学设计出身,所以最早喜欢时装摄影时只单纯因为那是对设计解