基于聚类中心选取的聚类算法的研究

来源 :郑州大学 | 被引量 : 0次 | 上传用户:worthylifelv
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
聚类是将特征相似的数据对象放在同一个簇中,相异的放在不同簇中的过程,它在分析数据的特征以及内在结构时起到重要作用。现在聚类技术已经被广泛地应用于各个领域,如:金融行业、信息安全、生物基因序列、图像处理、客户划分等。在聚类技术中,基于聚类中心的聚类技术的研究最为广泛,也是研究的热点问题之一,如何准确地提取聚类中心是亟待解决的问题,这一问题的解决对提高聚类的质量有着重要的作用。本文主要针对聚类算法中聚类中心个数计算不精确,参数敏感,以及在密度不均匀的数据集中聚类算法精度较低等问题,基于聚类中心选取的原则展开对这些问题的研究,论文的主要创新成果如下:(1)提出了基于聚类中心动态选取的密度聚类算法CCDS:首先计算所有数据对象的局部密度,为了更准确地计算并降低局部密度中的参数敏感性,算法将截断距离自适应计算机制结合k近邻的概念引入到局部密度的计算中;同时加入了聚类中心动态选取机制,选取出合适的聚类中心;最后将剩余对象按照距离最近原则划分进较高密度的簇中,形成聚类。该算法解决了参数敏感性问题,并且在选取聚类中心时避免了人工选取而造成的选取偏差问题。为了验证算法的有效性,本文选取了不同维度以及不同规模的人工合成数据集以及UCI数据集,均验证了该算法的有效性。(2)提出了基于两阶段对象划分策略的聚类算法CA-TSP。在现有的聚类算法中,如果密度度量出现偏差,聚类中心选取失败,将导致以此聚类中心为划分依据的对象划分错误,进而影响聚类效果。因此本文提出了两阶段的对象划分策略,第一阶段的划分以统计学中的散度概念为依据提出加权散度值,去除非核心对象的干扰,并利用对象递归遍历方法建立近邻关系来划分获取的核心对象;第二阶段的划分使用密度权重从第一阶段的结果中得到聚类中心,并将非核心对象按照距离聚类中心的最小距离原则划分。对象全部划分完毕,即完成聚类任务。在人工合成数据集和UCI数据集上均已验证了CA-TSP的有效性。对比同类型算法,该算法具有较高的聚类精度。从低维到高维、从少量数据到大量数据、从密度均匀的数据到分布复杂的数据,本文的研究工作为基于聚类中心的聚类算法的研究提供了一种新的思路。通过在医疗、金融、生物等领域的实验分析与研究,加速了基于聚类中心的聚类算法的研究从理论研究迈向实际应用的进程。
其他文献
本文研究了高阶线性多智能体系统的趋同问题.鉴于状态反馈在物理上的不能实现性,本文设计了状态观测器类型的控制协议,并将智能体的动力学系统拓展到线性时不变系统,分别研究
随着物联网技术的迅速发展,室外定位已经无法满足人们的需求,室内定位技术受到大量关注,其中射频识别(Radio Frequency IDentification,RFID)技术以其成本低、非视距、非接触
近年来,随着互联网和移动设备的迅速普及和发展,图像成为了人们记录分享生活的重要手段,越来越多的图像数据在网络上出现和存储。伴随着刷脸时代的到来,人脸验证已经成为了人们日常身份验证的重要手段,同时,越来越多的人开始关注上传至网络上的包含人脸的照片的安全。因此,急需采取措施保护图像中的人脸隐私,防止出现人脸隐私的泄露和滥用。人脸隐私保护主要是为了去除图像中的人脸所包含的显著身份特征,消除人脸和其所有者
应变传感器是将机械应变转换为电信号的设备,在人体运动检测,电子皮肤,智能电子等领域有很大的前景。然而,大多数应变传感器的材料有很多缺点,例如过于柔软,刚性太大,对环境
随着全球化的推进,纳米技术彻底改变了当今科学家和工程师对智能材料的看法。纳米技术不仅提供具有低成本和高效益的工业流程,而且还提供原子和分子的精确设计和操作,以及对
中国农业科学研究越来越重视农业的数字化、智能化和仿真化,数字农业和智慧农业成为了未来发展趋势。实现数字农业和智慧农业的基础是获取作物生长相关参数信息,包括作物行信
定位技术是无线传感器网络关键支撑技术之一,节点的位置信息在诸多应用领域起着至关重要的作用。目前,大多数基于移动锚节点的定位算法都不能实现未知节点的精确定位,且都假
互联网推动了物流产业网络化的进程,而云柜在物流产业追求高效便利的配送方式中应运而生,以云柜为主体的末端配送形态不仅缓解了末端投递站运营压力,提高了物流运转效率,更便
自上世纪80年代起,以民事庭审方式改革作为起步点,民事审判方式改革在我国逐步开展,成为我国司法制度改革的重要一环。随着改革的深入,民事审前程序逐渐显现出其在审判方式改
我国人口老龄化日趋严峻,随着老年群体年龄的增加,身体机能逐渐下降,患病人员数量逐日增加,老年慢性病问题也越来越突出。慢性病病程长且难以治愈,对老年慢性病患者的生活造成严重影响,由慢性病导致的系列问题成为了老年慢性病患者面临的最大威胁。其中,老年人自我管理意识薄弱且缺乏自我管理能力,提升老年慢性病患者的自我管理能力,树立其健康管理理念,有助于老年慢性病患者群体的身心健康,探究适合老年慢性病患者自我管