数据仓库的存储研究

来源 :东华大学 | 被引量 : 2次 | 上传用户：rui6372472

【摘要】

：

随着市场竞争的加剧,社会对信息的需求量日渐上升,从大量数据中提取所需要的信息进行决策显得更加重要,传统的数据库系统已经无法满足要求。随着数据库技术的发展,一种支持决

【作者】

：

李晔锋

【机构】

：

东华大学

【出处】

：

东华大学

【发表日期】

：

2009年01期

【关键词】

：

数据仓库数据存储底层实现磁盘索引

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

随着市场竞争的加剧,社会对信息的需求量日渐上升,从大量数据中提取所需要的信息进行决策显得更加重要,传统的数据库系统已经无法满足要求。随着数据库技术的发展,一种支持决策的、特殊的数据存储技术应运而生,它就是数据仓库。获取信息的能力是判断一个数据仓库系统是否先进、完善的标准之一,在一个数据仓库中存放的信息大多数是数据。为了构造一个完善的数据仓库系统,首要任务就是设计一个高效、严谨、符合数据仓库特点的数据存储结构。数据仓库是在数据库的基础上发展而来,它的存储结构与绝大多数关系数据库有类似之处,因此完全可以针对已有的数据库产品,改造其数据存储结构,使它能够满足数据仓库的特点。本文在绪论部分首先简单介绍了数据仓库的定义、作用和特点;然后分析了当前开源两大开源数据库产品——PostgreSQL和MySQL的数据存储特性;接着根据数据库和数据仓库的特点,从数据和系统设计两方面对它们分别进行比较;最后分析了数据仓库中数据存储方面的研究现状,指出当前数据仓库的研究领域偏向数据仓库的应用,而关于数据仓库底层实现方面的研究却极其罕见。本文的第二章主要从数据仓库的物理存储角度讨论存储大量数据的技术。随着计算机技术的发展,计算机系统不断对存储器系统提出高速和大容量要求。为了能够在合理价格下满足既要高速,又要大容量的要求,采用存储器层次结构技术能够使存储器的性价比达到优化,从而满足越来越高的要求。存储器的层次结构由高速缓冲存储器、主存储器、第二级存储器和第三级存储器组成,其中数据仓库的数据大部分存储在以磁盘为代表的第二级存储器中。为了对磁盘上的数据进行高速有效地读写,本文对磁盘的结构和特性进行了分析,并提出了四种改善磁盘访问性能的方法。本文的第三至五章属于核心部分,以具体的设计和实现为主,以理论研究为辅。本文的第三章根据商业数据库的现有模型,针对数据仓库的特点,提出了一种基于数据仓库的数据存储层次结构模型,并对该模型中各个层次的逻辑结构进行设计与实现,包括数据块和记录存储结构的设计、数据块内记录操作的实现、簇和段结构的设计等。本文的第四章以索引为主题,简要介绍了一般的顺序索引的概念,并对一种特殊的顺序索引——B+树索引进行了重点的、深入的分析、设计和研究,包括B+树索引的存储结构设计、B+树索引的创建、B+树索引操作的实现等。本文的第五章由缓冲区和文件两部分组成。在缓冲区管理中,本文介绍了缓冲区管理的工作原理和两种常见的缓冲区管理策略并对缓冲区管理器的结构进行了设计,实现了缓冲区中块的查找方法,并提出了一种新的块的替换策略。文件部分主要设计了文件和文件组的存储结构,并简单介绍了文件组的概念。最后,总结了本文的研究成果,指出了数据仓库底层实现的研究和发展的方向。

其他文献

基于语义的web数据挖掘在在线阅读网站应用的研究

信息量的巨大增长对中文在线阅读网站提出了优化要求。一方面要求能根据网页重要性调整网站链接结构,另一方面要求能针对网站内容进行优化,能够对用户查询进行语义级别的理解

学位

本体web数据挖掘链接分析文本分类优化

基于深度学习的理解式中文短文本摘要生成方法研究

学位

专利信息检索系统中本体半自动构建的研究与应用

本体具有良好的概念层次结构、支持逻辑推理,因而在信息检索领域得到了越来越广泛的应用,大大提高了信息检索的查全率和查准率。在此研究背景下,本文针对本体的半自动构建进

学位

本体半自动构建概念发现关系发现语义相似度专利本体语义检索

基于Petri网的Web服务动态组合方法研究与实现

随着计算机和网络技术的不断发展,Web服务的不断普及,单个Web服务的调用已经不能满足服务请求者的需求,服务组合已成为了一种必然趋势。利用Internet上分布的现有的Web服务,

学位

服务组合着色Petri网WSC-CPNQoS

基于纠删码容错的并行文件系统优化技术研究和实现

随着高性能计算机计算性能的提高,其存储系统的规模也在不断扩展,单纯依靠传统的硬件平台容错方法已经逐渐无法满足系统对数据可靠性的要求,高性能计算机使用软件方法来保证

学位

纠删码并行文件系统容错可靠性

基于深度上下文模型学习的快速视觉跟踪算法研究

视觉跟踪,就是在视频图像序列中对运动目标进行检测、提取和识别,从而获得目标的位置、速度、加速度及运动轨迹等运动信息,实现对目标运动行为的理解。随着廉价的摄像采集终

学位

视觉跟踪深度上下文模型区域生长法遮挡检测

无线传感器网络节点重编程研究与设计

无线传感器网络(Wireless Sensor Network,WSN)是由分布在各个区域的自组织的节点设备组成的无线网络。这些节点设备通过自身的传感器来监测周围的物理或者环境状况,比如温度

学位

无线传感网络重编程模块加载链接预连接

基于SOPC的无线多媒体传感器节点研究

为了实现更为精确、细粒度的环境监测,迫切需要在无线传感器网络(WSN)中引入信息量丰富的图像或视频等多媒体信息,从而形成具备高度感知能力的无线多媒体传感器网络(WMSN)。

学位

多媒体传感器节点可编程片上系统IP核复用在节点处理NiosⅡ软核处理器软/硬件协同设计现场可编程门阵列

面向地震救援的节能可靠的无线传感器网络的研究

随着传感器技术、嵌入式技术以及低功耗无线通信技术的发展，生产具备感应、无线通信和信息处理能力的微型无线传感器节点已经成为可能。这些廉价、低功耗的传感器节点大量部署

学位

无线传感器网络地震救援拓扑控制节能通信工作调度可靠路由协议容错

文件级I/O监控系统的设计与实现

随着计算机应用的不断发展,对应用系统执行效率的优化越来越重要。一个首要的问题就是要了解现有系统的运行状况,发现其中的规律和存在的问题,从而进行系统的改进或重新设计

学位

过滤驱动I/O数据流性能优化数据采集

数据仓库的存储研究

其他学术论文