基于轮廓系数的层次聚类算法研究

被引量 : 0次 | 上传用户:pengpeng91
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
通过对国内外聚类算法的研究情况分析可知,以往的聚类算法还存在诸多问题。传统的层次聚类算法需要提前设定算法结束参数,决策过程时间复杂度高;层次聚类算法大多没有利用已知的背景知识指导聚类过程,导致聚类结果的精确度不高;多数层次聚类算法忽略了对序列数据进行聚类分析与应用。本文针对这些问题,将研究重点放在基于轮廓系数的层次聚类算法的研究上,解决这些问题,对生命科学、医学、社会科学以及地理科学等领域都有重要意义。首先,提出一种基于轮廓系数与熵的层次聚类算法。该算法通过增量地绘制待聚类数据集的平均改进轮廓系数曲线得到最佳聚类簇数k。在其后的凝聚层次聚类过程中,把熵作为指导聚类簇合并的相似性度量标准,通过计算簇间的加权距离排除孤立点簇。其次,提出一种基于轮廓系数与约束的层次聚类算法。该算法把已知的成对实例约束结合到凝聚层次聚类过程中,利用已知的约束条件更新凝聚度矩阵,通过引入惩罚因子分别解决违反约束must-link和约束cannot-link的问题。最后,提出软件安全分析中基于轮廓系数的序列层次聚类算法。该算法在已知故障序列模式的前提下,利用故障特征矩阵反映软件故障特征与其所对应的行向量之间的关系,从而把对序列的聚类转化为对特征矩阵中行向量的聚类。通过对已有故障序列的层次聚类,缩小了软件故障特征分析时故障特征的匹配范围。
其他文献
裂纹是连铸板坯常见的质量缺陷,它的存在是发生钢板开裂、断板等质量问题的重要原因。随着市场经济的深入发展和竞争机制的不断深化,产品质量就显得特别重要。要想使企业在激
非物质文化遗产同人们的日常生活、精神生活休戚相关,是我国多民族多文化的重要体现。21世纪是科技文化日益繁荣的时代,数字化、新媒体技术的飞速发展为非物质文化遗产的保护
目的探讨农村地区儿童慢性咳嗽的病因。方法回顾分析了2005年1月~2010年1月在儿科门诊就诊的98例慢性咳嗽患儿。结果感染后咳嗽最多,共62例占63.3%,(支原体抗体阳性23例,占23.
近年来我国掀起了一股低碳城市建设热潮。但在这股热潮背后,还有许多尚不明晰的问题需要理性思考。围绕低碳城市相关议题,开展了如下5方面工作:①解读低碳城市概念,指出低碳
"十一五"期间中央环境保护专项资金下达近91亿元,为我国环境污染防治和监管基础能力建设提供了强有力的资金保障。随着财政资金使用改革的不断深入,财政部和环保部对中央环境
体外预应力加固是采用外加预应力钢丝束或预应力拉杆(粗钢筋)对结构构件或整体进行加固的方法。因为其具有提载效果明显、对原桥结构损伤小、施工简单、便于检查维修等特点而
目的:研究灰树花子实体粉(Grifola frondosa)、姬松茸子实体粉(Agaricus blazei)、猴头子实体粉(Hericiumerinaceus)和毛头鬼伞子实体粉(Coprinus comatus)等4种食药用菌对正
近几年随着铁路客运密度、货运密度的不断增加以及城市轨道交通的大力发展,修建多线铁路桥梁已经成为一种趋势,目前我国已修建了多座四线、六线铁路桥梁。多线铁路桥梁设计中
每一个公民都有自由选择职业和提高劳动能力的权利。改革开放后,农民获得了自主选择职业的权利,但由于制度惯性和路径依赖,农民工在城市就业中还存在着诸多亟需解决的问题。
评波普尔和邦格对辩证法矛盾观的批判仓茫自70年代末以来,西方著名科学哲学家卡尔·波普尔和马里奥·邦格的学说,在我国得到了广泛传播,对于我国科学哲学与科学方法论研究,起了重要