【摘 要】
:
随着大规模互联网应用的高速发展,给存储系统的可扩展性提出了更高的要求,键值数据库由于其简单高效的数据模型在可扩展性方面较传统的数据库系统有很大的优势。另一方面,随
论文部分内容阅读
随着大规模互联网应用的高速发展,给存储系统的可扩展性提出了更高的要求,键值数据库由于其简单高效的数据模型在可扩展性方面较传统的数据库系统有很大的优势。另一方面,随着硬件的发展,固态盘的性价比逐步提高,已经成为越来越多系统的首选,其随机读的优势与互联网应用的特征高度符合,但是其写性能的相对低下以及擦除次数的限制影响了它的应用场景,于是将固态盘与磁盘相结合的融合存储系统得到了大家的广泛关注。因此针对键值数据库而设计的融合存储系统是一个有价值的结合点。 针对Web应用的负载特点,通过日志的方式顺序的记录对键值数据库的操作,所有的操作都仅仅是顺序的写入内存,当内存中的数据达到了一定阈值以后一次刷写到后端存储上,日志的方式一定程度上是通过牺牲读性能来优化写性能,所以和固态盘有天然的互补关系。由于后端固态盘与磁盘的不同特性,使用层次化的方法将写的特点进行分类后写入不同的设备上,并设计实现了一个可定制文件放置与迁移策略的文件系统HybridFS,通过监控分析脚本可以对同一文件系统中不同特点的文件选择不同的放置与迁移策略。针对键值数据库的文件访问特点,日志类文件多是一次写很少读,所以直接写入磁盘。元数据类文件读写都很频繁但是文件大小和数量偏少,因此写入固态盘。对数据文件由于其海量、定长、一次写多次读的特点,根据负载特点选择性的写入磁盘或者固态盘。针对纯写入型负载使用概率选择的方式比Flashcache提升了5%-56%,而对于读写混合行负载使用LRU的迁移方式相比Flashcache有4%-14%的性能提升。
其他文献
互联网的普及和信息技术的发展在很大的程度上方便了人们的生活,但与此同时,也提出了新的挑战。当用户在计算机上使用各种信息技术时,用户的个人信息和隐私的暴露已经成为一
信息检索是指信息按一定的方式组织起来,并根据信息用户的需要找出有关的信息的过程和技术。信息检索的核心问题之一是排序问题,即决定哪些信息是相关的、符合用户的习信息需
由于文本检索的巨大成功,目前主流的图像搜索引擎如Google、百度等对图像检索采用的还是基于文本关键词的方式,即根据图像周围的文本来判断一幅图像与查询的相关性。由于文本
软件技术的快速发展,促使其应用模式呈现出网络化、平台化和服务化的特点。分布式计算、并行计算、网格计算等计算机技术的不断成熟,推动了新型软件架构的不断革新。在这种背
随着企业数据的种类的扩展,面向不同数据类型的异构数据的集成访问成为新的发展方向。本文就面向一般关系型数据、空间数据、实时数据的数据集成访问中间件进行了研究,设计并实
近年来随着网络和多媒体技术的飞速发展,网络多媒体服务(如视频会议、视频点播,数据分发和网络游戏等)应用成为网络应用的大势所趋,如果应用传统通信方式,它们大都需要消耗很
三维点云模型是以离散采样点为基元的几何模型,是三维模型的一种表示方式。三维点云模型数据结构简单、存储空间紧凑,而且由于不需要存储和处理复杂的拓扑信息,非常适于表示
集群系统(cluster)凭着其高可靠性、高可扩展性和高性价比等优势成为并行计算结构中最受欢迎的模型之一。其中曙光4000A和KD60平台是两种具有代表性的高性能集群系统。并行编
数据库系统是用来组织、存储和管理数据的仓库,它在企业、部门乃至个人的日常生产生活等诸多领域都得到了广泛的应用。随着现代互联网的迅速发展,信息呈现爆炸式增长,数据库
在数字图像的获取过程中,不可避免的要受到诸多因素的影响,导致图像质量达不到应用要求。由于受到硬件工艺的限制,如何采用软件的方法提高图像的分辨率受到很多研究者的注意。以