基于密度聚类算法的若干改进及应用研究

来源 :吉林财经大学 | 被引量 : 1次 | 上传用户：yp7611

【摘要】

：

【作者】

：

李明洋

【出处】

：

吉林财经大学

【发表日期】

：

2019年01期

【关键词】

：

密度峰值聚类算法基于密度带有噪声的空间聚类算法聚类半径截断距离聚类中心点

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

随着大数据时代的到来和人工智能的逐渐成熟,寻求分析和利用大规模原始数据并从中发掘价值信息的方式是学术界的研究重点。聚类技术在数据挖掘中占据重要地位,由海量数据中获取数据潜在内部结构是当下人工智能领域的重点研究任务。截至目前,无监督学习领域主要包括两类最具竞争力聚类技术,一是密度峰值聚类(Clustering by Fast Search and Find of Density Peaks,DPC)算法,二是基于密度带有噪声的空间聚类(Density-Based Spatial Clustering of Applications with Noise,DBSCAN)算法。但上述算法依然有一定不足:(1)采取密度峰值聚类算法时必须通过手动设置截断距离参数;(2)密度峰值聚类算法需手动圈出聚类中心点;(3)基于密度带有噪声的空间聚类算法存在全局参数聚类半径Eps需人工设定的问题。结合以上问题,对其提出针对性整改意见:(1)采取基于密度带有噪声的空间聚类算法时,必须通过人工设定获取全局参数聚类半径Eps,对于该问题提出一种改进的基于密度带有噪声空间聚类(Improved Density-Based Spatial Clustering of Applications with Noise,CS-DBSCAN)算法,利用布谷鸟搜索算法具有快速求解全局优化问题的能力,提高算法的聚类性能。(2)采取密度峰值聚类算法时,必须通过手动方式对截断距离参数进行设置,此时可利用基于密度最大值的密度峰值聚类(Density Peak Clustering Based on Maximum Density,Max-DPC)算法。该算法引入具有密度最大值样本点到密度极小值样本点距离作为截断值的改进思想,避免人为设置截断距离的同时,以此提升聚类算法性能。(3)采取密度峰值聚类算法时,必须借助手动方式完成的既包括设置截断距离参数,还包括圈出聚类中心点,提出一种基于截断距离和簇中心点自动选择策略的密度峰值聚类算法(Density Peak Clustering Algorithm Based on Choosing Strategy Automatically for Cut-off Distance and Cluster Center,CSA-DPC)。在改进方案(2)的基础上,根据可能成为聚类中心点之间的相似度变化情况确定聚类中心点,也使得聚类结果变得更加精确。(4)针对基于密度带有噪声的空间聚类算法的聚类半径Eps需人工设定的问题和密度峰值聚类算法需手动圈出聚类中心点的双重问题,提出基于蝙蝠优化聚类的再聚类算法(Re-clustering Algorithm Based on Bat Optimized Clustering and Its Applications,BA-DPC)。通过引入蝙蝠优化算法,让改进后的DBSCAN聚类算法先获得初始聚类结果,然后根据初始聚类结果自动选取DPC算法的聚类中心,以避免人为参与聚类中心的选取,且产生更优的聚类结果。

其他文献

构建东盟区域全面经济伙伴关系框架法律问题初探

本文主要通过介绍东盟区域全面经济伙伴关系框架(RCEP)谈判概况,比较分析了现存5个“东盟+1”自由贸易协定与RCEP谈判进程中出现的争议焦点,预测出RCEP谈判未来可能的趋势。

学位

RCEP谈判自由贸易区货物贸易服务贸易投资制度

补血方联合造血刺激治疗较低危骨髓增生异常综合征疗效探讨

目的:观察补血方联合造血刺激治疗较低危骨髓增生异常综合征(MDS)患者的近期疗效,分析疗效的影响因素,探讨本方案治疗优势。方法:纳入2011年1月至2019年1月广东省中医院血液科门诊和住院部接受了本方案诊治至少6个月的较低危MDS患者,治疗上均予补血方为基础方,同时接受常规造血刺激和支持治疗。回顾性分析患者的临床资料、外周血象、骨髓象、输血需求、中医症状、近期临床疗效、疗效影响因素及生存情况等。

学位

骨髓增生异常综合征补血方临床疗效疗效影响因素

黄河大合唱（之一）

因了诗仙李白的千年渲染，如今的黄河似无须亲见其模样了。只要说起黄河，只要看见黄河二字，脑子里就会叠印出一组图像：君不见黄河之水天上来，奔流到海不复还……黄河发源于青藏高原

期刊

黄河鄂尔多斯高原青藏高原巴颜喀拉黄土高原华北平原流域面积内蒙古

基于密度聚类算法的若干改进及应用研究

其他学术论文