峰值功率感知的并行散列连接算法

来源 :浙江工业大学 | 被引量 : 0次 | 上传用户:lanzhengpeng2
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着新一代存储设备固态盘的发展,如何发挥新存储设施的特性成为近年来的一个研究热点。作为数据库系统的核心查询算子,针对连接操作的性能优化以及功率控制成为当今数据中心面临的关键问题。本文针对散列连接操作,结合固态盘特性改善其性能,并提出了功率控制方法。本文主要贡献如下:1.总结了主流固态盘性能特征。通过观察固态盘I/O外部特性,即考察访问粒度与访问队列深度与固态盘性能之间的关系,得出读写混合场景使用固态盘应遵循的原则。2.提出了一种固态盘并行散列连接算法及其缓存大小优化配置方法。利用固态盘性能特征,对Grace散列连接的各个阶段进行并行化设计,并推导得到保证连接最优性能所需的最小缓存计算方法。3.提出了并行散列连接峰值功率分析方法。对并行散列连接的峰值功率产生阶段进行预估,从核利用率的角度分析缓冲区大小和I/O吞吐量与核峰值功率的关系。4.提出一种根据控制激活核数降低连接功率的方法。通过设定线程的调度策略,从而实时控制连接运行激活的处理器核数,并根据核数和动态功率的线性关系,计算应激活的核数。一系列实验结果表明本文提出的并行散列连接方法比传统方法在固态盘上性能更高,经过优化的缓存分配方案可保证算法性能充分发挥而节省内存使用;针对并行散列连接峰值功率的分析符合真实测量得到的功率图谱,且根据处理器功率特性提出的功率控制方法能够有效降低连接的功率。
其他文献
松散复制技术是分布式数据库系统(DDBS)中提高系统可用性和可靠性的一项重要技术。松散复制通过数据冗余,用本地数据读取代替远程数据访问,这样不但能降低网络通信开销和缩短
颗粒粒度是颗粒物料的重要质量指标,其准确测量对颗粒后续加工的许多技术性能和实际应用具有重要的指导意义。目前对粒度检测大多采用筛分法等人工操作的方法,存在测量时间长
幻方问题是一个历史悠久的组合数学问题,也是一个典型的NP难问题。1890年法国数学家G.Pfeffermann发现了第一个多重幻方—8阶二重幻方,幻方专家们因此翻开了构造多重幻方的新篇
信息可视化技术将各种繁杂的数据转换成直观的图形和图像,从而有利于人们正确理解数据的含义。可升级矢量图形(SVG)的出现为电力系统运行可视化图形数据的网络发布提供了一种
增强现实(Augmented Reality,AR)技术是一种将虚拟信息叠加在现实世界中的技术,使用AR技术开发出来的应用程序可以让人们感受到新颖的视觉体验和交互方式。近年来,随着移动手持设
SOA(Service-Oriented Architecture,面向服务架构)是当今业界和学术界最热门的应用及研究课题之一,基于标准、灵活、松散祸合是SOA的主题词,它将彻底改变企业现有的IT架构。
我国生产集中监控系统应用较晚且水平较低。本文以某矿山企业的实际应用为背景,提出了该生产集中监控系统的方案。系统对生产设备的工作参数,即开关量、电流、电压和功率实时
随着网络教育的流行,智能组卷问题也得到了广泛的关注。智能组卷问题(the problem of generating test paper intelligently)是一个多目标优化问题。传统的随机选取法和回溯
现代社会中,计算机软件发挥越来越重要的作用。计算机软件随处可见,大到神舟七号航天器,小到个人电脑,都有软件的身影。然而,世上没有完美的软件,几乎所有的软件都有缺陷,所
磁暴导致的地磁感应电流(Geomagnetically Induced Currents,简称GIC)对电网的影响需要研究,实际测量是掌握电网GIC水平的直接手段,本文提出在已研制的GIC监测装置基础上,开发基于GRPS的电网GIC在线监测系统。在电网GIC在线监测系统的设计中,利用GPRS技术实现了GIC数据的远程传输,并将各自独立的监测站点的数据组织成数据网络;应用.NET技术完成了监测系统后