基于缓存的数据库索引优化技术研究

来源 :南京航空航天大学 | 被引量 : 0次 | 上传用户:jibbsb12
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
缓存作为中央处理器(CPU)和主存之间的高速、低容量存储设备,可以非常快速的传递数据到CPU。当缓存当中没有CPU需要的数据时,就会引发一次访存操作,CPU需要暂停流水线并等待数据从主存传递到缓存,在此期间,CPU无法执行任何任务,即“CPU延时等待”。通过对商业数据库执行任务所消耗的时间进行分析,显示大约50%的时间浪费在CPU延时等待上,其中,90%的CPU延时等待是由于末级缓存数据失效和一级缓存指令时效造成的。索引作为数据库重要的组成部分,提升索引结构对缓存行为的感知能力是非常重要的。本文针对缓存行为特性,结合缓存优化技术,对索引机制进行如下改进:(1)针对现有缓存感知型索引结构,随着索引数据增长时,会消耗大量的存储空间,造成缓存命中率降低,并且索引结点设置成缓存行大小或是缓存行的倍数,增加了树的高度的问题,提出了空间高效缓存感知型索引机制。该索引采用数据压缩的方式,提高索引结构对缓存空间的利用率,减少索引对缓存空间的消耗。同时,采用结点分区的两级结构,使索引结点可以扩大容量,降低索引树的高度。(2)针对HBase查询列信息时需要扫描整张数据表,会使得无效数据对缓存空间进行污染,并且在查询过程中,符合查询条件的有效数据和不符合要求的无效数据交叉存储,破坏了有效数据的空间局部性特征,降低了缓存命中率。同时,无效数据还会消耗大量的缓存空间,增加了缓存失效次数的问题,提出前缀式二级索引方法,该方法通过前缀方式构建索引可以减少查询过程中扫描的存储空间,减少无效数据对缓存空间的消耗,减少缓存失效次数。(3)以流数据处理框架Spark Streaming、消息服务框架Kafka以及HBase为基础,设计实现了一个能源信息查询系统,为大规模能源信息查询提供高效、稳定的服务。论文对该系统的设计思想、系统架构以及各个模块的设计、实现进行了详细的介绍。
其他文献
难熔金属及合金在航空航天、电子信息、能源、化工、冶金和核工业等国防及民用领域有着不可替代的作用,受到世界各国的高度重视,已成为材料科学界最为活跃的研究领域之一。本文
对国内外阅读推广相关文献进行调研,探讨引入志愿服务的意义,以安徽大学图书馆基于志愿服务的阅读推广活动为例,以案例分析的方式剖析其组织结构、服务模式及影响成效,思考未
天然气是一种无色无味、燃烧热值高、安全洁净的能源,对治理全球温室效应、减少雾霾污染和节能减排等都有着非常重要的意义,并广泛用于民用、发电、汽车燃料和石油化工原料等
利用液压胀形工艺生产的桥壳,不但可以满足车辆制造轻量化的要求,而且制件壁厚分布合理、强度刚度高,因此具有较好的经济效益和应用前景。但是对其理论及工艺方面的研究仍然
为什么CH_4是正四面体结构?为什么烷烃分子中的碳链是折线形的?苯环中介于单键和双键之间的键究竟是怎么回事?有机物中怎么找相邻原子间的正负性?等等,这些都是学生在中学化
随着CAD技术在其它机械行业中的广泛应用,组合机床多轴箱CAD的设计软件也相继出炉,为设计人员提供了方便快捷的多轴箱设计工具。但在多轴箱设计过程中,不仅需要用到自然科学的基
电视节目主持人的风格和语言可谓各具特色,汪涵作为国内脱口秀节目主持人的代表,他的主持言语时而直白通俗,时而诙谐幽默,汪涵非常善于构建主持言语达到幽默效果,却又可以不
本文基于对公共行政目标导向———服务行政的分析 ,导入服务型税务的理念 ,并进一步界定和探讨了服务型税务的概念、内涵与特征。同时 ,基于对服务基本特性的认识 ,并结合税
厌学是初中阶段学生最常出现的现象,其对初中生的影响日趋严重,加强其与学习心理的相关研究意义重大。学习倦怠是正常人身上发生的由于在学业方面没有成就感而持有的一种持久
人类胚胎基因实验以人类胚胎或前胚胎为实验对象,在技术上有基因检测、基因诊断、基因筛选、基因编辑(基因改造)等类型,引发了一系列伦理、社会和法律争议。在国际范围内,人