论文部分内容阅读
近年来,随着因特网和云计算的不断发展,使得面向数据密集型的应用受到愈来愈多的关注。这类应用的产生大量数据,为建立云计算系统的数据布局带来巨大挑战。为了实现数据的合理布局,在深入分析了云计算的相关概念和关键技术之后,提出了基于改进的K均值聚类算法的数据布局和基于Fisher线性判别的改进K均值算法的数据布局,目的是提高应用系统的数据移动次数。基于改进的K均值聚类算法对初始聚类中心mi的选取不足进行了优化,提高了聚类效果。再根据这种改进算法,设计出相应的数据布局策略。实验结果表明,在数据移动次数方面,使用这种改进算法比随机算法降低了43%。基于Fisher线性判别的改进K均值算法是将Fisher线性判别分析法和改进的K均值聚类算法相结合,以细化各数据分组的边界。再根据这种改进算法,设计出相应的数据布局策略。实验结果表明,在数据移动次数方面,使用这种改进算法比随机算法降低了26.6%。使用基于改进的K均值聚类算法的数据布局和基于Fisher线性判别的改进K均值算法的数据布局,能够降低面向数据密集型的应用在执行过程中跨多个数据分组的数据移动次数,有效改善了应用系统的聚类结果和整体效用。