云存储中数据压缩技术的研究

来源 :云南大学 | 被引量 : 0次 | 上传用户:fuyuanluyi13
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近些年,云存储的出现对传统存储领域产生了深刻影响,是目前企业界和学术界共同关注的热点。但是目前学术界对存储的研究大都关注于带宽、安全及基础设施方面,很少放在云存储这个大环境下来考虑,尤其是对在云存储环境中面临海量数据时数据压缩技术对负载均衡的影响。另外,在对数据压缩技术进行研究时,往往通过牺牲空间来换取低时间复杂度,造成了数据在解压缩时有损。因此无法保障数据压缩前后的一致性。最后,对私有云存储系统的研究,存在着众多的开源版本,如何选取适合私有的、灵活的及可定制的云存储解决方案是我们面临的又一重大问题。针对上述问题,本文将对数据压缩技术进行分析和研究,尤其是以字典编码及其延伸出来的LZZ77算法、LZ78算法及LZW算法作为研究对象,分析了各自的优缺点,在此基础上本文提出了一种改进型LZW算法,它在负载均衡,系统扩展方面有着天然的优势。改进型LZW算法在提高算法效率和保护用户服务质量的前提下,可以将数据冗余压缩到最小,以保证尽可能少的无用信息。最后,本文在此基础上,实现了一种私有云存储平台。论文的主要内容和工作包括以下几个方面:·分析了云存储及其数据压缩技术在国内外研究现状,结合目前存在的问题,我们得出了把数据压缩技术作为研究重点的合理性和必要性。·针对数据压缩技术领域研究状况,我们提出了一种改进型LZW算法且详细分析了其性能。通过实验验证了该算法在数据压缩比、压缩时间及压缩效果方面的优越性,为以后在该领域的研究提供借鉴价值。·基于上述研究,本文针对搭建私有云存储的特点,我们实现了一个私有云存储系统MongoDB,给想要搭建私有云存储环境的用户和科研团体打下了基础。
其他文献
随着信息技术的快速发展,XML数据的应用越来越广泛。XML应用于Web开发的许多方面,常用于简化数据的存储和共享。为了推动XML数据查询和处理的标准化,国际万维网组织W3C发展了XQu
该文将MAM模型从两个方面作了推广:一方面,由于在目前的信号、图象处理等领域 中存在着大量的复信号需要处理,MAM模型无法直接处理这些复信号,所以有必要将MAM模型推广为复形
战术数据链本质上是一种数据通信系统,它能够链接战场上的各种作战平台,从而使各种作战平台之间快速的交换各种情报信息,实现战场态势和信息的共享,提高协同作战能力,是信息化时代
农作物产量预测已经成为关系到国家粮食安全,调整宏观经济的一个重要工具,对我们国家社会的健康发展有重要的意义。极限学习机(ELM)已经被广泛地运用在很多领域,比如图像识别,生
在交互设计领域中,室内设计图形模型(设计提案、画草图、画图、施工成本计算和 评价等)依赖于客户的状态的要求.通过对施工图的认真和严格的分析可以获得上述模型.从图中析取
目前软理用在国际上受到广泛重视,该文研究在分布式环境下的基于CORBA构件的软 件开发过程.文章首先讨论了构件技术和CORBA技术,提出了CORBA构件的概念并对其进行了描述.接着
蛋白质的糖基化修饰是最常见、最重要的蛋白质翻译后修饰之一,在生命活动中发挥着关键作用。随着生物质谱技术的发展,糖基化修饰的质谱鉴定也越来越受到人们的重视,研究热点从糖
血管分割是医学图像处理中的关键技术,其中血管精细分割和高维医学图像处理是应用诉求较强的两个研究领域。Clifford代数在数据特征表示方面适用于任何维度,这为高维医学图像处
该论文介绍了基于神经网络的CAD工程图自动识别的研究与实现.项目的目的是实现 建筑工程预算工程量的自动计算.该研究需要对AutoCAD所画工程图的数据文件(DXF)进行识别和读取
随着单个芯片内部集成的核数不断增加,传统的总线、交叉开关以及点对点的通信架构面临着面积、功耗、延迟以及可扩展性等诸多不足,已经无法满足片上系统的通信需求。片上网络具