面向小文件的高性能分布式文件系统研究与设计

来源 :华南理工大学 | 被引量 : 0次 | 上传用户:aiwaner
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着互联网的普及和覆盖率提升,人们的日常生活已经开始全方位接入互联网。由此带来的是数据量的急剧增长,和数据类型的多样化。近些年不断兴起的如短视频直播网站,图片,社交网站等产生的单个数据大小都相对较小,常见在几十KB到几MB之间不等。但是传统的分布式文件系统如GFS,HDFS等都是为大文件存储而优化过的,在面对海量小文件的时候,性能都会急剧下降甚至无法提供服务。如何设计实现一个高吞吐量,高可用的小文件系统也是目前研究的一个热点。FastDFS是一个开源的分布式文件系统,它的主要功能包括文件存储、文件同步和文件访问等,同时能提供大容量和负载均衡的要求。对比其他的分布式文件系统,它的优势是量级较轻,同时又能满足高并发访问,易于扩展等需求。为了针对小文件的存储优化,FastDFS天生支持对小文件进行了合并存储,将大量的小文件聚集成大文件来统一存储,减少元数据的数目,进而提高文件的访问性能。本文从语音小文件存储的应用场景出发,简要介绍了语音小文件存储和分析的特点,对文件聚合算法进行了改进,提出了一种高效的小文件数据分布式文件系统EastDFS(Efficient Access of Small Data in Distributed File Systems)。EastDFS的主要优势在于能加快文件读取的速率,满足一次写入多次读取的需求。EastDFS基本思路是修改文件的聚合算法,通过合理的将同个类型的文件聚合在一起,加快文件读取速率。修改聚合算法之后引入了部分元数据信息,为了保证系统的高可用,则需要对这些元数据信息进行持久化和同步。此外,还将原来的FastDFS系统改进后作为一个数据中心,构造一个能支撑海量存储的分布式系统架构,避免单个机器成为系统瓶颈。更改文件聚合算法之后招致了随机写的问题,为了加快写入速度,本文引入了缓存层。在进行文件写入的时候,直接将小文件的数据写入到缓存中,再由后台线程定时的将聚合起来的文件刷新到磁盘中。缓存算法是基于LRFU进行改进,针对实际命中的贡献率,以及在预测块到达时间上融合了语音小文件独有的特性,更能有效提高命中率。在文件读取方面,将原来单个请求聚合在一起,一次请求多个数据,有效的利用文件聚合后能连续读取的特性,加快系统的读取性能。
其他文献
为方便纳税人正确处理涉税业务,降低涉税风险,本文根据新颁布的《企业所得税实施条例》,就会计政策、会计估计变更和前期差错更正会计准则与税法差异进行分析并作了处理。
目的:建立简单、快速检测银离子的新方法。方法:建立简单、快速检测银离子胶体金/DNA体系方法,利用分光光度计扫描加入银离子前、后胶体金/DNA体系光谱,通过比较加入银离子前
为了提高直流电动机调速系统性能,通过模糊PID控制方法和MATLAB软件的控制工具进行直流电动机调速系统的辅助设计。
随着信息科学技术的发展,让翻转课堂走进了大学校园。《英语影视剧本选读》作为英语专业学生一门选修课,旨在帮助学生巩固英语语言知识,提升文化内涵。利用翻转课堂的特点与
目的:观察玉屏风颗粒在儿童支气管哮喘缓解期治疗的临床疗效。方法:选择符合条件的患儿66例随机分为治疗组和对照组,每组各33例。治疗组患儿给予玉屏风颗粒口服,对照组予固本
目的:观察不同层次埋线方法治疗单纯性肥胖者的临床效果。方法:将45例受试者使用随机数字表法分为3组,分别为脂肪层简易埋线组(简称脂肪层组)、肌肉层简易埋线组(简称肌肉层
为筛选具有重庆山地特色的烤烟新品种,在重庆12个烟区设立试验点,以目前重庆种植面积较大的烤烟品种‘云烟87’和‘K326’为对照,对新引进的‘贵烟4号’、‘南江3号’、‘韭
当前,我国内部审计的独立性较缺乏,直接导致了内部审计业务中较高的审计风险。本文对内部审计独立性的风险因素及其强化对策作了探讨。
目的:评价七叶洋地黄双苷滴眼液联合眼部热敷及穴位按摩在治疗视疲劳中的临床效果。方法:将视疲劳患者60例随机分成3组,A组20例单独使用七叶洋地黄双苷滴眼液治疗;B组20例使
在当前新的发展环境下,电视台播音主持风格应该进行不断的演变和创新,进一步适应当前新视听环境的需求,这对于提升整体节目效果和质量来说具有十分重要的意义和作用。文章就