方差优化初始中心的K-medoids算法

来源 :中国计算机学会多值逻辑与模糊逻辑专业委员会第十四届学术会议 | 被引量 : 0次 | 上传用户:yangzhengm
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
  快速K-medoids算法通过计算样本密度,选择前K个位于样本分布密集区的样本为初始聚类中心,并采用各类簇中距离该簇其他样本距离和最小的样本更新类簇中心,改进了传统K-medoids算法的聚类效果,节省了聚类时间,然而该算法存在密度计算复杂耗时和初始聚类中心可能位于同一类簇的缺陷.基于邻域的K-medoids算法提出邻域概念,选择位于不同样本分布密集区域的样本为初始聚类中心,改进了快速K-medoids算法的初始聚类中心可能位于同一类簇的缺陷,但是其邻域半径需要人为给定一个调节系数,缺少客观性.本文针对快速K-medoids和基于邻域的K-medoids算法的上述缺陷,分别以距离均值和相应样本的标准差为邻域半径,以方差作为样本分布密集程度的度量,选取方差值最小且其间距离不低于邻域半径的样本为K-medoids的初始聚类中心,提出两种方差优化初始中心的K-medoids算法.UCI数据集和人工模拟数据集的实验表明,本文算法花费较少时间即可得到结构更加紧密的类簇,且适用于大规模数据集的聚类.
其他文献
  针对约束优化问题复杂难解,特别是难以求得全局最优解的这一问题,提出了一种改进差分进化算法。为了避免算法早熟,对终止精度给出了新的定义并且与罚函数相结合,增强算法跳出
革命老区桑植县位于湖南省西北边陲,地处武陵山脉腹地,隶属国际旅游新城——湖南省张家界市。桑植是一块红色的土地。这里孕育了贺龙、廖汉生等一批老一辈无产阶级革命家,是
  随着用户的购买行为的日益变化,超市的经营面临着巨大的挑战。最新的调查显示,超市通过合理的分配货架,不仅可以增加利润,而且可以减少成本。为了解决这个问题,提出了使用的改
会议
  浮动质心法(FCM)是一种新的神经网络分类器算法.FCM利用K-Means算法将分区空间中的映射点划分为若干聚簇.尽管FCM算法在部分数据集上获得了较好的结果,但是由于其所采用的
会议
  单帧图像超分辨率重建是指利用一幅低分辨率图像,通过相应的算法来获取一幅高分辨率图像的技术。本文提出了一种基于非局部正则化的非负邻域嵌入单帧图像超分辨率重建算法
小麦(Triticum aestivum L.)颖果腹部韧皮部筛分子(sieve element,SEs)的主要功能是运输有机营养物质,木质部导管(tracheary elements,TEs)的主要功能是运输水分和无机盐。前期研究表明,小麦颖果腹部韧皮部筛分子的发育经历了特殊的PCD过程,发育成熟的SEs仍具有细胞活性,能将营养物质运输并储存于小麦胚乳中。本实验采用生物电镜、超微细胞化学与免疫荧
  针对快速K-medoids聚类算法不能发现非球状类簇和需要事先给定类簇数K的问题,本文将快速K-medoids聚类算法中样本点间的距离用样本间的最短路径代替,并提出改进的F统计量
本刊讯(记者李晓雅)7月28日,随着深圳证券交易所仪式大厅开市宝钟敲响,以岭药业成为河北省第一家登陆国内A股市场的中药企业,发行6500万股,发行后总股本不超过4.25亿股。本次
  基于直角坐标系,本文提出了区间值模糊软集的一些新的相似性度量,进而给出了区间值模糊软集的一些距离度量。在此基础上,提出了区间值模糊软集的熵度量,讨论了这些度量的基本
  通过举例,指出文献[15]中软直觉模糊集之间的相似测度具有不合理性,进而提出一种更为合理的相似测度。借鉴直觉模糊集(vague集)的距离测度以及熵测度的定义方法,给出软直觉