【摘 要】
:
随着信息技术的不断发展,海量数据的不断涌现,企业迫切需要高效、精确、科学的分析数据。由于传统数据仓库的数据更新一般是每天,每周或是每个月更新一次,这就意味着它的数据
论文部分内容阅读
随着信息技术的不断发展,海量数据的不断涌现,企业迫切需要高效、精确、科学的分析数据。由于传统数据仓库的数据更新一般是每天,每周或是每个月更新一次,这就意味着它的数据不是最新的,然而,对于电子商业,股票经济,在线通讯以及决策系统等信息,需要及时的将数据发送到决策者手中,他们依据最新的这些数据信息去占领市场,由此出现了实时数据仓库的概念。目前,在实时数据仓库体系的构建过程中,面临的最大挑战就是实时数据抽取、转换、清洗和加载到数据仓库的工作,即实时ETL的过程。因此本文提出了一种实时数据仓库的装载方法,该方法将采取复制表结构、设置查询限制等条件实现在数据仓库中数据持续高效的装载,并且阐述了如何使用实时数据仓库架构以及客户终端OLTP查询来实现实时数据的整合。针对实时数据仓库技术的实现,本文做了以下相关工作:首先,对实时数据仓库的研究现状、应用情况进行分析,得出了实时数据仓库技术研究的必要性。其次,对传统数据仓库的体系架构不能满足实时性的需求,提出了实时数据仓库的体系架构,包括事实监控模块、数据转换模块、数据存储模块和实时分析模块。再次,对实时数据仓库的过程中,数据的抽取、转换和装载过程比较困难的情况下,采用立即型数据捕获方法进行数据抽取;使用专业工具和内部开发程序组合,来实施数据转换功能;把装载过程分为了初始转载、周期性的增量装载和实时的完全更新。最后,把实时数据仓库技术应用在Golf综合查询和决策支持系统中,对实时数据仓库架构、OLAP查询进行了调整,采用了复制表结构、设置查询限制等技术实现在数据仓库中数据持续高效的装载;以及对实时数据仓库包装和再优化。
其他文献
我国少数民族人口大多集中在西部农村地区,西部少数民族农村地区的发展对我国构建和谐社会有着至关重要的作用。但是由于地理环境、交通运输等方面的原因,西部少数民族农村地
和谐劳动关系现已成为民营企业正确处理新时期矛盾的一项重要内容。本文在指出了和谐劳动关系在促进民营企业发展过程中的作用基础上,分析了当前民营企业劳动关系出现的新特
模式识别,也被称为分类或者是统计分类,模式识别学科的研究目的就是为了构建能够自动判别输入数据类别信息的分类系统。聚类分析是一种无监督的模式识别方法,是模式识别研究
研究背景白术为菊科植物白术Atractylodes macrocephala Koidz.的干燥根茎。气清香,味苦、甘,性温,具健脾益气、燥湿利水、止汗、安胎之功效。主要用于脾虚食少、腹胀泄泻、
背景支气管哮喘(简称哮喘)是一种常见的慢性气道炎症性疾病。哮喘疾病的严重性不仅表现为发病率高、受累人群广、而且反复发作,不能根治。美国国立卫生研究院心肺血液研究所
目的探讨导致结直肠癌术后复发和转移的临床病理因素。方法通过单因素分析和多因素的Logistic回归分析方法,将结直肠癌根治术后复发或转移的104例患者(研究组)与未复发和转移
以巯基乙酸修饰的CdTe量子点为荧光探针,考察了不同条件下槲皮素对CdTe量子点的猝灭作用。发现在磷酸缓冲溶液中,其猝灭作用最强。在此基础上建立了基于荧光猝灭法检测槲皮素
目的通过对血清谷氨酸脱羧酶抗体(GADA)、胰岛细胞抗体(ICA)和胰岛素自身抗体(IAA)3种胰岛自身抗体联合检测,探讨2型糖尿病(T2DM)患者中筛查成人隐匿性自身免疫糖尿病(LADA)
本文对体育运动处方进行分类,最终构建运动处方干预模块,分析体育运动处方干预策略,旨在探寻简单易行、科学有效且针对性强的体育教学方法、内容,来彻底改善"边缘化"大学生的
针对产品设计阶段有效管理质量数据的迫切需求,提出了基于质量特性的产品设计质量数据管理模型。依据产品设计过程确立了产品设计质量特性与数据的定义,在分析产品设计质量保