【摘 要】
:
聚类分析是一种重要的无监督学习方式,被广泛地应用于交通、金融、农业和医疗等实际领域中。但在聚类分析中,类簇数的确定问题一直都是一个难题。传统的引入聚类有效性指标的方法不仅具有倾向性,而且大都是基于二支划分的,如何在刻画数据对象与类簇之间的不确定性关系的基础上从多个角度确定最优类簇数依旧是一个问题。因此,论文展开了基于多有效性指标的类簇数自动确定方法的研究工作。为了能够从多个角度探索数据集的类簇数目
论文部分内容阅读
聚类分析是一种重要的无监督学习方式,被广泛地应用于交通、金融、农业和医疗等实际领域中。但在聚类分析中,类簇数的确定问题一直都是一个难题。传统的引入聚类有效性指标的方法不仅具有倾向性,而且大都是基于二支划分的,如何在刻画数据对象与类簇之间的不确定性关系的基础上从多个角度确定最优类簇数依旧是一个问题。因此,论文展开了基于多有效性指标的类簇数自动确定方法的研究工作。为了能够从多个角度探索数据集的类簇数目,论文提出了基于加权内部有效性指标的类簇数自动确定方法。首先,基于三支决策思想,论文对k-means算法做三支改进,迭代运行三支k-means算法,生成不同k值的三支聚类结果。三支k-means算法的每个类由核心域、边缘域和琐碎域三个域表示。然后,基于已有的多个有效性指标构建多指标评价体系,从不同角度评估不同k值的聚类结果的质量。最后,根据制定的寻优策略选取最优类簇数。相对于融合前的单一有效性指标,论文验证了该算法在Vowel、Waveform、Wine等多个UCI真实数据集上的有效性。为了进一步提高算法性能,尽可能地利用现有的有效性指标,论文借鉴聚类集成研究中的中心划分法的思想,将每一种k值的聚类结果作为潜在的最优聚类结果,从而有效地将多个外部有效性指标引入到多指标评价体系的构建过程,进而提出了基于两类有效性指标的类簇数自动确定方法。此外,论文给出了基于多有效性指标的类簇数自动确定方法具有有效性的显式证明。同时,针对选多少个有效性指标构建评价体系的问题,本文也进行了讨论和分析。论文在多个UCI数据集上进行了多组对比实验,实验结果表明该算法相对于融合前的单一有效性指标和其他方法在自动地确定类簇数上更具有准确性。同时,论文讨论了如何将本算法应用到葡萄酒领域,解决葡萄酒品质鉴定的问题。
其他文献
法律上的落后产能系指生产结果或后果落后于行业平均水平,且负面影响大于正面影响的产能。根据其正面影响的紧迫性与可替代性,可将其进一步划分为可限期淘汰的产能与应立即淘
磁力耦合器作为一种以电磁感应为原理的永磁传动装置广泛应用于电力、石油化工、泵、水处理、农业灌溉和其他工业领域,该耦合器主要通过相互隔离的永磁转子与导体转子实现无
随着人工智能、大数据、工业互联网等技术的兴起,世界制造正朝着智能化、互联网化、自动化方向发展,我国制造业也正处于智能化转型的关键时期。我国提出“中国制造2025”,要
图像描述融合了计算机视觉与自然语言处理两个方向,是用人工智能算法解决多模式、跨领域问题的典型代表。目前该领域的研究大多数是基于编码器-解码器架构的神经网络描述模型
全无机卤化物钙钛矿纳米晶作为一种新型的半导体材料,因其在光电子器件方面具有潜在的应用价值,近年来受到了研究者们的广泛关注。但是,如何获得高质量高效发光的钙钛矿纳米
音乐剧是一门新兴的综合舞台艺术,原创音乐剧《水火心》是由音乐剧《虎门销烟》整合改编而成,以舞台表演、人物塑造的方式为基础,立足于中国传统审美的角度,运用了恰当的音乐
近年来,随着绿色、健康、共享出行理念的提出,公共自行车系统获得了蓬勃发展。截至2018年底,全球有1000多个城市建立了公共自行车系统。该系统具有绿色、低碳、环保等特点,可
湖北土陶作为日用陶器,极具地域性文化特色,整体呈现出古拙质朴、粗狂豪放的艺术风格,是民间艺术造型的自然生成和演变。花鸟纹饰作为湖北土陶的重要装饰题材之一,文化意蕴丰
近年来,全无机卤化物钙钛矿纳米晶已经在整个可见光范围内实现了高效发光,在光电领域显示出了巨大的应用潜力。然而,高效发光的纳米晶表面常常需要长链有机配体进行保护,这些
抽象危险犯作为危险犯的分支之一,因自身理论模型符合现代刑法发展的需要而备受立法欢迎。尽管抽象危险犯正当性依旧备受争议,但其在立法中呈现扩张的趋势,也是不可回避的事