基于工作流的分布式数据仓库模型的研究

来源 :山西师范大学 | 被引量 : 0次 | 上传用户:WieldWolf
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
计算机技术的飞速发展给信息产业带来了前所未有的繁荣但随着计算机技术的不断推广和使用的深入,人们对它的要求也越来越高。特别是在信息高度发展的今天,面对着在时间、空间和结构上存在着巨大差异的相关数据,人们希望计算机能够提供快速、准确、具有预见性的信息。企业通过快速响应用户的需求来提高自身的竞争力,相继实施或自主开发了适合于自身业务的信息系统。通过使用这些系统,企业或组织内逐渐积累起大量的数据。由此,出现了一个新的需求,即对大量已有的数据进行分析挖掘以支持业务和高层决策的应用。随即,一系列用来实现数据的分析与挖掘的理论和技术相继产生,包括数据挖掘技术、数据仓库以及分布式数据仓库等。这些理论和技术都可以被归结为数据仓库。近年来引起了众多学者的兴趣与参与,已成为学术界跨学科的热门研究领域之一。数据仓库不仅包括对数据管理的数据库技术,而且还包括对数据进行分析挖掘的各种组件,是一个综合的概念。而分布式数据库DDB( Distributed Data Base)是一组数据集,逻辑上它们属于同一系统,而物理上分散在用计算机网络连接的多个场地上,并统一由一个分布式数据库管理系统管理。分布式数据库系统可以看成是数据库技术和计算机网络结合的产物。本论文通过对数据仓库和分布式数据仓库体系构架的分析,得出当前存在的缺点:不能进行灵活的定制、易用性差、分布式数据仓库为了保持全局数据仓库和局部数据仓库的数据一致性需要购买大量且昂贵的存储设备来保存两份相同的数据。针对这些缺点,本文所做的主要工作如下:1)改进了一种基于工作流的分布式数据仓库模型,模型的整体结构基于SOA(Service-Oriented Architecture)面向服务的体系结构、分布式。2)引入了工作流技术来实现灵活定制数据提取需求、分析挖掘需求及结果可视化的需求,并将这些功能封装成整体模型中的业务流程服务。在业务流程服务模型部分引入了数据仓库业务流程执行语言、业务流程的可达性验证算法和优化算法。3)分布式数据仓库模型中包括虚拟全局数据仓库服务和虚拟全局多维数据仓库服务,以此避免在全局和局部数据仓库中存储相同的两份数据,从而减少了在昂贵的存储设备上的开销。另外,在虚拟全局数据仓库服务部分给出了两个虚拟全局服务的模型,并且集成了全局数据仓库(全局多维)的元数据结构、全局(全局多维)查询算法以及优化策略。4)最后,将基于工作流的分布式数据仓库模型应用到了教育考试资源库项目中。
其他文献
在传统的信号与信息处理中,雷达的检测和跟踪是两个分开处理的过程。检测器在门限检测的基础上获得目标的点迹信息,然后将其送至数据处理器。数据处理器利用关联算法和跟踪算法
2008年3月第三代移动通信合作计划3GPP为了应对国际电信联盟无线电部(ITU-R)对第四代移动通信技术的要求,正式启动了LTE后续演进项目LTE-Advanced,作为向ITU-R提交的IMT-Advanc
图像处理是光学、电子学、数学和计算机技术的交叉学科,在众多科学与工程领域有着重要应用。不适定性问题是图像处理与视觉计算中存在的共性的问题,需要从退化的图像中恢复或重