基于样本密度的全局优化K均值聚类算法

来源 :计算机工程与应用 | 被引量 : 0次 | 上传用户:ewtfgtwegv
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
针对传统K均值聚类算法中存在的聚类结果依赖于初始聚类中心及易陷入局部最优等问题,提出一种基于样本密度的全局优化K均值聚类算法(KMS-GOSD)。在迭代过程中,KMS-GOSD算法首先通过高斯模型得到所有聚类中心的预估计密度,然后将实际密度低于预估计密度最大的聚类中心进行偏移操作。通过优化聚类中心位置,KMS-GOSD算法不仅能提升全局探索能力,而且可以克服对聚类初始中心点的依赖性。采用标准的UCI数据集进行实验对比,发现改进后的算法相比传统的算法有较高的准确率和稳定性。
其他文献
目的 对蝉翼藤 (SecuridacainappendiculataHassk .)的化学成分进行研究。方法 利用硅胶柱色谱和中压液相色谱法对蝉翼藤茎的 95 %乙醇提取物进行分离 ;用UV ,IR ,MS ,1D和
对应用瞬变电磁法进行金属管道腐蚀检测作了理论上的初步研究,首先将实际问题简化为等效柱体的全空间问题,然后利用柱体在谐变场中的响应公式,由正余弦变换实现了频率域正演
对阿尔山地区野生种子植物进行了调查和区系分析,结果表明:该区有种子植物78科,298属和512种;其分布区类型以温带分布占绝对优势,地理成分混杂且具有过渡性,具有一定数量的古
<正> 一 引言 “植物园”这个词是外来语,很可能是近代从日语直接移用的。在我国历史上未见有植物园的记载,仅仅有类似植物园意味的记述,宋代司马光写过一篇《独乐园记》,其
<正> 本文是将Hubbert(1948)的线积分法用于求得密度差随深度呈线性变化的任意截面二度体的重力异常。以N边的多边形代替物体截面,利用任一边的两个顶点坐标来求其相应的重力
本文考察了国际农业跨国公司产业链布局的发展现状及成因。研究认为,由于农业产业链在加工、储藏、运输等各环节均具有自身的特征,使得国际农业跨国公司的全球产业链布局呈现
监护仪使用范围广,工作时间长,在医院是属于频繁检修的设备。正确合理使用,做好维护保养,可以提高社会效益和经济效益。
鄂尔多斯独具魅力的优秀文化和民族风情,使之在鄂尔多斯地区的改革开放和现代化建设中表现出强劲的发展势头和爆发力,成为鄂尔多斯经济现象的强大推动力。本文试从文化学的角
ADM、邦吉、嘉吉、路易达孚4家世界500强企业是目前掌握全球粮食运销的跨国企业,4大粮商的发展经验值得总结,对中国"走出去"涉农企业发展具有一定的启示。其全产业链经营模式