电信行业中数据仓库建模方法的研究与应用

来源 :北京邮电大学 | 被引量 : 11次 | 上传用户:july1126
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
数据仓库技术是一个面向主题的、集成的、非易失的、随着时间变化的用来支持管理人员决策的数据集合。经营分析对国内各大运营商来说也越来越重要,其中所使用的技术正是数据仓库技术。在数据仓库的实施过程中,ETL的工作量最大,它的工作效率往往也与数据仓库的模型是否合理有着直接的关系。 本文重点讨论了传统数据仓库结构下ETL实施过程中存在的问题,在此基础上对传统数据仓库的模型做了一些改进,并总结一种数据仓库模型分层设计方法,以此来提高ETL的工作效率。然后论述了在分层之后怎样实施数据质量稽核。把数据仓库分成中央数据仓库和集市数据仓库,实则分为两级主题域的设计,中央仓库主题域和集市主题域设计。中央仓库完全是按照企业模型建立的,基本遵守第三范式的原则,没有汇总,没有合并表。而集市数据仓库根据需求来做,结合第三范式和行星模型来设计集市仓库模型,分为基础表和事实表的设计。基础表是为事实表服务的,是对中央数据仓库的汇总、合并。事实表在基础表之上再做简单汇总即可得到。这样,ETL的工作也分为了两部分,即前ETL和后ETL,前ETL的主要工作是源系统到中央数据仓库的映射,这需要熟悉源系统;后ETL的主要工作是中央数据仓库到数据集市的映射,这只需熟悉中央数据仓库和集市模型即可。ETL工作有了明确分工后,ETL工程师可以专注于自己熟悉的工作。同时也给数据质量稽核带来了便利,数据质量稽核可以分层来做,也就比较容易地确定错误发生的位置。 最后,以作者参与的某省电信数据仓库系统的建设为背景,结合数据仓库系统的实施过程,阐述了数据仓库分层模型设计的具体应用,将中央仓库划分为七大主题域,集市数据仓库根据需求划分若干主题域。结合自己的主要工作重点,介绍了集市仓库具体建模过程和具体的数据质量稽核过程。
其他文献
唐山拥有丰富的铁矿、煤炭资源,毗邻京津,东临渤海,具有优越的地理区位优势。钢铁行业是唐山的传统产业,具有一定的行业发展基础。根据产业结构演变规律,我国自2001年起逐步进入了
晚明时期的文学,在我国文学史上具有重要的地位,而且较之传统的文学也呈现出新的色彩。作为这个时代的文学家,冯梦龙的思想体现出鲜明的晚明特色。尤其是独特的小说观念使得
目的 :研究如意定喘丸对支气管哮喘模型大鼠慢性气道炎症的干预作用,为其临床运用提供依据。方法:60只Wistar雄性大鼠随机分为正常组、模型组、如意定喘丸高、中、低剂量组(8
<正> 患者李某,男,32岁,住院号125040,因颜面及下肢水肿、少尿2月余于1986年7月11日入院。既往身体健康。体查:体温36.7℃,脉搏70次/分,呼吸19次/分,血压164/110mmHg,面色晦
为了查明龙门泉群间歇性断流的原因,为龙门泉群复涌综合治理工作提供科学依据,从水均衡角度出发,分析泉域矿坑排水(突水)、工农业开采、大气降水等水资源开发利用情况。结果
<正>如果说一名员工是企业里的一个自然细胞,那么一个班组就是一个最基本的细胞合成组织。这个组织的健康与活力如何,直接关系到企业中基层单位(队站、车间)的整体水平。这样
期刊
当前,日趋严重的客户流失已经成为制约电信业务发展和效益进一步提高的重要因素之一。目前的竞争形势和市场发展阶段已表明,不重视客户维系和挽留,单纯依靠发展客户,已经无法满足
在竞争中求得生存和发展是企业拓展的关键。但这里有一个前提条件,那就是企业必须知道自己的竞争优势。通过价值链的运用,将企业看作各种相互分离但彼此相关的生产职能的集合,形
近年来,随着科学技术的迅猛发展和全球化的加速,知识化经济和信息化经济逐步处于主导地位。在全新的经济形势下,企业所面临的商业环境是客户需求瞬息万变、技术创新不断加速、产