谱聚类算法及其应用研究

被引量 : 0次 | 上传用户:qwertcbt
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
聚类分析是一种研究样本分类的统计方法,也是一种数据挖掘的方法,可以有效地实现数据结构的探测,在国际上已成近年机器学习领域的研究热点。谱聚类算法作为聚类算法的一个分支是一个重要的研究方向,以图论作为理论基础,基本思想是将聚类问题转化为图论中的对无向加权图的最优分割问题。与现有的其他典型的聚类分析算法相比较而言,谱聚类算法在聚类的过程中降低了对样本空间形状的要求,同时谱聚类算法还可以有效的克服一些经典聚类算法易收敛于局部最优解的缺点,可以得到收敛于全局的最优解。本文在对前人研究谱聚类算法所取得的现有成果进行了系统的学习,对已有的相关算法进行了部分改进。具体的工作内容概括如下:1)首先介绍了关于聚类算法特别是谱聚类算法的基本概念以及理论基础,分析了谱聚类算法中的一些相关技术的已有的研究成果以及应用的现状,然后对谱聚类研究领域中所涉及的几个关键性问题进行了总结,归纳了谱聚类算法未来的几个关键的研究方向。2)针对传统的谱聚类算法中的两个基本的难点:相似矩阵的构造以及自动确定类的数目问题,本文通过定义的一种新的距离度量—密度敏感的距离和引入的特征间隙两个概念,提出了一种基于密度敏感的自适应谱聚类算法。新提出算法的有效性在模拟数据集以及UCI数据集上的实验中都得到了较好的验证,同时本文还计算了该算法与传统的SC算法的分类正确率,比较结果显示新算法的聚类性明显优于SC算法。3)针对IPCM算法对稀疏程度不同的样本集的聚类效果不理想,而且需要人工手动输入聚类数目的缺点,本文通过引入密度敏感的距离与特征间隙两个概念,提出一种基于谱聚类的自适应IPCM算法,该算法用密度敏感的距离代替传统的欧氏距离,并通过特征间隙的性质准确地计算出聚类数目。通过数据实验,证明了改进后的算法的有效性以及正确率都有所提高,同时该算法能够有效的弥补IPCM算法及谱聚类算法在各自单独聚类时所存在的缺点。4)将本文所提的密度敏感相似性度量引入到判别割算法中,代替原有的欧氏距离,以此对判别割算法进行改进,在此基础上提出了一种基于密度敏感的判别割的图像单阈值分割算法。该方法在算法实现的复杂度和实现时所需存储空间等问题上都有了一定的改进。
其他文献
目的观察前列地尔联合银杏达莫治疗糖尿病肾病的疗效及前列地尔的最佳剂量。方法选取96例糖尿病肾病患者,按随机数表法分为A组、B组、C组3组,每组32例。三组均采取常规降糖、
人们盲目的追求城镇建设的速度,给人居环境造成了严重的威胁。我国城镇综合病患越来越突出,特别是内涝严重,污水横流,自然生境日渐毁灭破坏,环境问题令人堪忧。政府已针对治
乙醇法制浆污染轻、投资小,且其副产物有很高的利用价值,尤其是乙醇木素的改性利用,发展前景非常广阔。本文选取芦苇乙醇木素为原料,探索了其反应活性,优化了木素的提纯方案,并系统
近年来,随着我国节能减排的力度越来越大,天然气作为清洁能源的优点日益突出,我国天然气消费量增长迅速,产量的增长远不能满足消费增长的需要,对外依存度已高达28.9%,且这一数值仍
“红色文化”是中国共产党领导中国人民在反帝反封建革命斗争中逐步形成、完善的,并在新中国建设中进一步发展的,以新民主主义、社会主义和爱国主义、革命英主义为标志的中华
旅游产业的发展,是国家十二五规划的重头戏,是国家经济又快又稳发展目标的重要组成部分,在国家十二五规划推动的过程中,一直将我国旅游产业的集约化发展作为国家经济发展的重
刑事证人保护制度是法治社会要求的一个重要制度,是刑事诉讼得以良性运转的重要保障,是衡量一国刑事司法制度是否完善和健全的重要标准。无论从理论还是实践上追溯,我国刑事证人
《金瓶梅》出现以后,掀起了人情小说写作的高潮。小说从以往写神魔、历史及英雄传奇的宏大格局叙事中解脱出来,转向以家庭婚恋、闾巷琐事为主的人情描写。小说中涉及人情,魏晋已
随着全球化趋势的快速发展,中国与世界各国的文化、经贸往来更加密切。语言是交流的桥梁,作为世界语言的英语在国际商务中发挥重要作用。为了实现经贸双方有效地交流与合作,
药物防治是当前水产养殖病害防控的重要手段之一。由于当前渔药市场上产品质量良莠不齐,养殖户难以对药物准确用量形成统一标准,从而造成渔药乱用、滥用,不仅导致部分致病菌耐药