基于Oracle的线损数据仓库平台研究

被引量 : 0次 | 上传用户:huanan_0909
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着电力行业线损管理系统的持续运行,电力企业积累了大量的线损历史数据,传统的信息管理方式已不能科学、有效的处理和利用这些信息,更未能从中发现潜在的具有经济价值的信息。将数据仓库理论应用于电力系统线损分析,可对各种业务数据库进行关联分析,优化现有资源、集成现有系统信息、发挥整体优势,为各层次的管理人员提供有效的决策支持。本文从实际应用的角度出发,采用数据仓库理论对线损数据仓库平台的设计、实现和数据仓库中重复记录的清理策略这三部分进行了重点研究。首先,针对目前线损计算、分析系统的结构和特点,采用DB-ODS-DW (Database-Operational Data Store-Data Warehouse)三层结构设计了线损数据仓库平台的体系结构;采用星型模型给出了线损数据仓库平台详细的建模过程。传统的DB-DW(Database-Data Warehouse)两层体系结构,很难实现实时分析和挖掘应用,在体系结构中引入ODS(Operational Data Store)很好的解决了两层结构存在的效率低、实时支持能力差、数据集成困难等问题。其次,采用Oracle数据库和OWB(Oracle Warehouse Builder)工具建立了以线损分析为目的的数据仓库平台,完成电力行业的业务信息整合,实现业务数据的多维分析,为管理人员提供有效的决策支持。最后,针对重复记录清理策略中的“排序、识别、合并”算法存在的问题进行了改进。改进后的重复记录清理算法在保证记录匹配率的情况下,有效地提高了记录排序的效率;在识别重复记录时,考虑了匹配字段的文字数量、出现的频率、记录中各字段的重要性(权重)、中文字段的语义及语义重点偏后等因素,有效地提高了重复记录识别算法的准确性和健壮性;在合并重复记录时,采用了聚类和实用算法并用的策略,大大提高了重复记录的清理速度,在很大程度上减少了用户的工作量。
其他文献
随着我国施工企业从传统经验管理模式向现代科学管理模式的不断进步,企业对管理创新的要求也不断增强,目标管理这种科学、系统的管理方法逐渐被大多数企业所采用。企业要想通
随着国内生活水平的不断提高,2型糖尿病的发病率迅速上升,日益得到重视。对国内糖尿病的发展现状、发病原因以及面临的工作进行了归纳整理,希望对国内糖尿病的早期干预治疗提
煤、电、油、气、运协调运行是国民经济保持平稳发展的重要一环。加强和完善其协调机制,包括完善部门综合协调决策机制,着力打造和夯实其协调实务常态工作机制,加快建设完善
介绍建水县林地资源特点,分析林地保护利用潜力及存在的问题。基于林地保护等级划分、占用征用林地规模控制和林地使用方向控制对建水县林地保护进行规划;基于林地功能分区、
日前,汉语语法学界对“吃食堂”这类动宾结构的生成和理解,主要有三种角度句法分析、认知分析、语用分析。事实上,这类结构的产生受到多种因素的制约,语用的、句法的、认知的
钢铁产业是国民经济发展的基础产业,钢铁产业安全态势直接关系到国家经济安全状况。本文分析了我国钢铁产业安全态势现状及存在的主要问题,探讨了"十二五"时期我国钢铁产业安
随着社会的不断发展,人们对建筑结构使用空间的要求也在逐渐的提高。而在高层民用建筑施工的过程中,采用型钢混凝土施工技术,不仅有效的缩小了钢结构构件的截面尺寸,扩大了建
装配式建筑结构是实现建筑产业现代化的重要途径。只有不断提升产业化建筑的科技含量与技术创新,攻关建筑设计、施工、管理中的关键技术难题,才能逐步改善建筑产业链的服务水
在我国现阶段,自闭症儿童的随班就读要想取得良好的效果,家庭与学校、教师合作,形成良好的伙伴关系是必不可少的。本文阐述自闭症儿童随班就读中家校合作的必要性,试图找出有
目的探讨信息化教学应用于儿科护理教学后的实效。方法选取2012届中职护理专业两个班级,其中一个班级按照常规教学模式进行教学,作为对照组,另一班级在常规教学基础上,加用信