论文部分内容阅读
网络每天都会产生海量的数据,人们已然迈入了海量数据时代。分布式存储系统为了保障数据的可靠性采用数据容错技术,多副本技术和纠删码技术是最常用的数据容错技术。多副本技术因其修复简单而应用广泛,但是随着数据的增多,企业将无法承受多副本技术带来的高额存储成本。纠删码技术在达到与多副本技术相同数据可靠性的同时,可以有效地降低数据存储消耗。为了提高纠删码的修复速度,提出了基于带宽和网络距离的最优生成树算法,在选择出节点的同时,提高了纠删码修复的速度。