基于Hadoop云平台的并行谱聚类算法的设计与实现

来源 :山西师范大学学报:自然科学版 | 被引量 : 0次 | 上传用户:feifei1988000
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
谱聚类(Spectral Clustering)是建立在谱图理论基础上的一种聚类算法.与传统的聚类算法相比,谱聚类能够在任意形状的样本空间上进行聚类且收敛于全局最优解.然而,实际问题中大规模数据集普遍存在,在使用谱聚类对大规模数据集进行聚类时,收敛速度变得十分缓慢,甚至无法在有效的时间内得到聚类结果.并行算法是针对大规模数据集进行处理的一种有效方法.基于Hadoop云计算平台实现大规模数据集的存储和处理是目前实现并行计算的一种高效解决方案.
其他文献
为了考虑温度的影响,人们大都采用准谐德拜模型(thequasi—harmonic Debye model)来计算钼的高温高压下的热力学性质,然而这种模型的精度有限.采用准谐近似(the quasiharmonic appr
根据带电粒子在CR-39固体核径迹探测器中的径迹面积分布,利用光学显微镜对中高能核-核碰撞中的弹核碎片进行分辨,得出弹核碎片电荷与径迹面积成线性关系.
研究定居于运城盐湖的一年生植物盐地碱蓬种子的萌发,揭示其种子萌发的规律及对盐渍化自然生境的适应机理.采用室内萌发的方法处理种子,探索了不同温度(5/15℃、10/20℃、15/25℃、20/30℃)、光照(光暗交替和黑暗)以及盐分浓度(0 m S/c、5 m S/c、10 m S/c、20 m S/c、40 m S/c、60 m S/c和80 m S/cm)下盐地碱蓬二型性种子萌发的现象,揭示其种
本文采用免疫算法来优化RBF神经网络,得到一种更加优化、更加合理的混合算法,即免疫神经网络,并将此算法用于盲均衡器的优化设计,MATLAB仿真实验结果表明,经此算法优化后的盲均衡
本文分析了城市道路绿化在城市中的作用,结合山西省临汾市城市道路绿化的现状,分析城市道路绿化选择树种存在的问题,深入分析了如何选择好道路绿化植物,提高城市道路绿化水平
运用野外实测剖面和新的地层划分方法,对鄂尔多斯盆地东部河东煤田离柳矿区苏村-毛港剖面石炭-二叠系沉积地层进行了详细的沉积岩石学研究.结果表明:本区出露的石炭-二叠系沉