基于MDA的多维数据抽取过程的研究与实现

来源 :山东大学 | 被引量 : 0次 | 上传用户:zzptt
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着计算机技术的高速发展,管理信息系统(MIS)逐渐普及,各行各业都开始采用管理信息系统实现日常办公、人员信息管理等。传统的业务系统不具备数据分析的能力。它们常年运行产生的海量数据大多被转移到历史数据库中、或被直接废弃,导致隐藏在数据背后的规律无法得知。因此近年来,针对海量数据进行分析处理的需求不断增多,在这种形势下,多维数据抽取技术应运而生。目前对多维数据抽取过程的研究有很多,但是研究的目标主要集中在商业领域、金融领域等,对教育行业的研究较少。教育行业与商业领域之间存在很大的行业差异,教育行业是一个非盈利性行业,面临经费不足、技术人员匮乏等困难。因此成本较高,使用难度较大的传统多维数据抽取技术与工具不能完全适用于该行业,传统的多维数据抽取技术面临新的问题和挑战,需要挖掘新的方法。针对教育行业的特有需求,本文进行了探索性研究,提出了一种基于MDA的多维数据抽取过程。首先建立多维数据模型,并详细介绍模型的描述方法与模型约束。其次,建立过程模型,将多维数据抽取过程的抽取、转换、装载阶段的业务操作抽象为平台无关模型,并采用基于过滤器-管道模式的体系结构组织模型。模型的具体内容和细节采用XML描述,克服了硬编码的局限性。使用模型驱动架构(MDA),提高了系统的重用性,同时降低了使用的难度。本文还探讨了基于MDA的多维数据抽取过程的实现,首先给出了系统的整体架构设计,接下来分别描述了数据转换机制,任务调度问题,过滤器机制,管道解析机制以及异常监控等问题。最后介绍了原型系统的设计与实现,并列举实例进行分析。本文的课题研究既有探索性的理论研究价值,也具有较大的应用价值和现实意义。希望能为教育行业的多维数据抽取提供一种有效、通用的解决方案。
其他文献
随着以微电子、嵌入式以及无线通信技术为基础的无线传感器网络快速发展,体现出微型化,节点部署灵活,成本低等优点,为大坝安全监测提供了全新的解决方案,有着巨大的应用前景。由于
路由协议是无线传感器网络的核心技术之一,它设计的是否合理直接关系到无线传感器网络的性能,因此根据无线传感器网络的特点和应用环境,设计专用的路由协议已经成为了当前无
虚拟实验是虚拟现实技术在教育领域的重要应用。虚拟实验是指通过计算机、网络设备等模拟教学中的各种实验。虚拟实验可以弥补教学设备的不足,是辅助教学的重要手段。虚拟实
学位
全球化的时代背景下,企业的产品设计和制造模式渐渐从独立开发转向企业间协同工作,传统的产品数据交换和共享方式已不能满足发展需求,支持产品模型定义交换的STEP AP242协议已经
随着三维扫描获取技术的发展,数字几何媒体已经在工业制造、生物医药、数字娱乐、数字文化遗产保护等方面取得了广泛的应用,数字几何处理技术,特别是基于网格(Mesh)模型的数
人体内分泌系统是一个复杂的分布式自适应系统,该系统具有在高层对神经系统的调控作用、功能情感反应、自组织、分布式处理等一系列独特的功能。内分泌系统的上述功能,能够使
网格计算是伴随着互联网技术的迅速发展而产生的一种新型分布式计算模式,以实现大规模分布式资源共享及协同问题求解为目标。任务调度是网格计算的一项核心技术,高效的任务调
单芯片多处理器的发展和应用不断增加的性能和精度要求,需要计算机的主存系统增加容量以保存更大的工作集。DRAM是过去的几十年里计算机主存系统采用的主流技术。但DRAM的工
人工免疫系统是模拟生物免疫系统的高性能、自组织、强鲁棒性的人工智能系统。本文主要在深入探索和研究了生物免疫系统中蕴含的智能学习机制。提出了一种高效的免疫优势克隆