图数据库StellarDB存储模块性能优化的设计与实现

来源 :南京大学 | 被引量 : 0次 | 上传用户:shengweizheng
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
今天,图数据库由于其在现实生产生活场景中的建模优势、在关系查找方面的性能优势,成为越来越重要的基础软件。国内外许多软件厂商都推出了自己的图数据库产品。Stellar DB是星环公司的图数据库,可以与其他组件配合,实现图存储、图分析、图可视化等重要功能。Stellar DB存储引擎采用日志结构合并树(Log-Structured Merge-Tree,下称LSM树)数据结构作为底层数据存储方式。但是,在实际部署过程中,Stellar DB遭遇了严重的性能的问题。在进行大数据集高并发写入之后,Stellar DB性能急剧下降。虽然数据库节点还处于活跃状态,但客户端发出查询请求之后,无法在预期时间内接收到回复。原定的响应超时时间为30秒,但此时的Stellar DB实际需要数分钟才能返回查询结果。本文介绍了对问题的分析过程:通过对性能数据的观察,可以看到数据堆积在LSM树的最顶层,向下流动速度极慢,导致读请求搜索数据条目主键的时候需要访问多达上千个数据文件,从而使系统无法在预期时间内回复。这是因为在数据流动过程中,由于LSM树结构本身的固有维护方式,存在大量对旧数据的重新读写,造成了磁盘读写的浪费。而此情景下磁盘已经发挥最大读写速度,所以需要提升对磁盘读写的利用效率,减少浪费。据此思路,本文实现了减少读写浪费的优化方案。首先,通过修改flush算法对内存缓冲区进行强制分片,优化文件中的数据分布,使得单个L0数据文件主键范围缩小,方便compaction调度。其次,实现更精细compaction算法,根据下层数据文件的主键范围选择尽量多的上层数据文件,并计算I/O浪费最低的方案,能降低compaction过程中的磁盘I/O浪费,加速数据在LSM树向下流动。本文详细说明了对flush算法与compaction算法的联合创新性优化方案的设计与实现,并展示了优化过程中的多次性能测试结果,从中解释算法逐步优化的根据与效果。另外,本文通过对Stellar DB的存储模块进行抽象简化,实现了一个存储模块模拟程序,用于测试、验证优化算法的有效性。最终测试结果显示,从L0到L1的compaction读扩大率从419%下降至119%,数据不再堆积于顶层,各层compaction过程顺畅,数据能够较快流动到底层。经过优化,Stellar DB在高并发大数据集写入情景下的性能问题已经解决,系统能够及时正常响应读请求。目前优化后算法已经在Stellar DB中运行,性能稳定。
其他文献
网络直播的兴起,不仅改变了人们传统的娱乐社交方式,还带动了互联网经济的繁荣。但与此同时,网络直播也带来了诸多负面效益,作为网络直播载体的网络直播平台更是一度成为了违法违规和不良信息滋生的重灾区,在社会上产生了巨大恶劣影响。2016年下半年,随着一系列监管政策出台,各部门纷纷开展专项治理行动,集中对网络直播行业进行整顿。短时间之内,网络直播平台的监管就呈现出高压态势。但随着时间推移,相关立法文件持续
活性炭作为一种高效、廉价的催化剂载体,具有巨大比表面积、丰富孔隙结构、稳定化学性质和良好吸附性能,同时还具有强度高、易于多次再生等优点。而γ-Fe_2O_3具有反尖晶石型结构、活性温窗较宽、良好的催化活性、抗水性等优点;VOSO_4高度分散能提高活性炭表面活性位数量及弱酸位数量,同时改变孔隙结构。本课题分别从活性炭硝酸活化和负载改性入手,以椰壳活性炭为原材料,以硝酸优化后的活性炭为前驱体;通过Fe
精制棉用途广泛,为现代轻纺、医药、化工、军工等工业的重要原料之一。精制棉生产过程中会产生大量的蒸煮黑液与漂白废水,在工业应用中多通过物化-生化对其进行处理,处理后水中有机污染物大大降低,但直接排放对环境仍存在一定影响,且生产中水资源消耗大,严重制约了精制棉行业的发展。当前精制棉生产工艺成熟,生产时水耗量难以降低,如何将废水回收循环利用成为解决精制棉行业发展的关键所在。本文通过对经处理排放的精制棉废
自《企业破产法》出台以来,环境债权一直作为普通债权最后清偿,这一顺位一直未曾改变。随着社会经济的发展,高质量发展已成为时代主流,单纯的经济效益优先原则已不能适应时代需求。同时,以环境责任保险制度、环境责任基金制度为代表的救济制度在我国仍不完善,资金来源、适用范围、投保方式等都尚未明确。即使在环境保险制度非常完善的美国,尚面临资金不足的问题。在这样的情况下,有必要重新调整环境债权在破产清算中的清偿顺
抑制水中舰艇的振动及噪声辐射对提高艇上机械设备寿命、提升工作人员舒适度以及增强舰艇的声学隐身性能有着重要的意义。低频抑振器是一种新形式的低频抑振设备,对低频范围内结构的振动噪声有很好的抑制作用。为了分析低频抑振器对水下结构低频带振动噪声的抑制特性,本文基于有限元分析方法,建立了附连低频抑振器的水下平板结构声振仿真分析模型,先后对低频抑振器进行了减振降噪效果及机理分析、参数化分析、多个低频抑振器和低
弱磁探测在医学和军事等很多方面都具有重要的研究价值,先进的磁场测量方法和高性能磁场传感器一直是世界各国重点研究热点。基于电磁感应透明(EIT)的磁力仪主要是利用在EIT
间歇生产过程作为现代工业过程中必不可少的生产方式,由于其多品种、小批量和高附加值等特点而备受青睐,因此在现代工业生产中有着难以撼动的地位。随着同时代发展物质的极大丰富,人们对产品的要求日益提高,间歇过程的工艺和流程的复杂程度也在增加,其系统运行时的不确定性和外部干扰等因素已成为间歇过程发展道路上的阻碍,妥善处理此类问题以提升系统性能变得极为重要,因此现阶段研究有效的先进控制方法去处理不确定性等问题
近些年来资本市场企业间的并购活动增速逐渐放缓,但是仍然有较高活跃度,基于资产重组、行业整合等目的而实施的并购依旧频繁,并购也逐渐成为中国企业迅速发展壮大的途径之一。伴随着电子商务的兴起,我国快递行业迎来了黄金发展时期,但是飞速发展的背后却面临着国际化水平低等问题,在国内市场竞争日益加剧的背景下,快递行业将目光聚焦国际市场,意欲通过并购方式发展跨境业务,打通国际物流通道,享受国家政策红利。作为我国快
童声合唱是合唱的一个分支,童声所独具的纯净、优美、宛如天籁的特点,使其在众多的合唱类别中独具魅力。在义务教育阶段音乐课程的深化改革全面铺开的背景下,学校童声合唱团如雨后春笋一般不断涌现。灵活运用教学策略,是提高课堂效率卓尔有效的手段。本文正是基于这一目的,以泰州实验学校“小海豚合唱团”为研究对象,了解童声合唱的研究现状,结合对3~4年级学生的学情分析、总结与反思自身的教学经验,对一些教学方法进行了
山羊子宫内膜炎是产后常见的疾病之一,可造成山羊屡配不孕和淘汰率升高等问题,给山羊养殖业造成巨大经济损失。大肠杆菌(Escherichia coli,E.coli)是山羊产后子宫内膜炎的主要致病菌。皮质醇(Cortisol,Cor)属于糖皮质类激素,具有免疫抑制作用。本实验室体外试验已证实皮质醇可通过调节MAPK和NF-κB信号通路,抑制脂多糖诱导的奶牛子宫内膜上皮细胞的炎性反应,但这种机制很少在山