多视图矩阵分解的聚类分析

来源 :大连理工大学 | 被引量 : 0次 | 上传用户:airbike
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着多媒体技术的飞速发展,人们可获得的信息越来越多,而这些信息中既包含大量的无用信息,又存在很多的“看不见”的有用信息。因此,利用流行的机器学习和人工智能等手段,对信息进行提取、挖掘和分析显得尤为重要。聚类分析是一种无监督学习方法,它可以在没有任何先验知识的条件下,对数据集进行聚类,使得类别内样本尽可能相似,类别间样本差异尽可能大。因此,作为一种数据挖掘的重要手段,聚类分析可以揭露出样本间的从属关系,从而在模式识别、人工智能等领域有着极为重要的意义。多视图聚类分析因其利用多个不同视图特征的信息,可以更加全面地描述数据库,从而获得比单视图聚类更好的聚类性能。传统的多视图聚类算法只考虑不同视图间的一致性,而忽略了同一个视图内部不同样本在特征学习前后也应保持相同的相似程度。因此,本文将局部空间结构约束引入传统的多视图学习框架,提出了一种多视图聚类算法——MLN。但是,MLN算法是基于NMF矩阵分解的,该方法只适用于非负的特征矩阵。而现实场景中,很多数据的特征难免存在负数,因此本文又提出了基于SemiNMF矩阵分解的多视图聚类算法MLSN。无论特征数据矩阵是否存在负数,MLSN都有较好的聚类性能。在三个公开的数据库上进行实验,结果证实MLN和MLSN算法都有着较好的聚类性能。线索集聚聚类作为一种集成聚类方法,可以通过结合策略将一组不同的基聚类器进行集成,从而提高聚类的泛化能力,获得更高的聚类准确率。线索集聚聚类主要分为构建共联矩阵和对其进行凝聚型层次聚类两个步骤。然而,传统的加权线索集聚聚类方法仅考虑基聚类器的影响,或者仅考虑团簇质量的影响,而实际上二者都会影响样本间的相关性。因此,本文提出一种新的加权线索集聚聚类方法——GLWEA。该方法在构建共联矩阵时,将基聚类器质量和团簇质量都作为影响权重系数的因子,进而再使用凝聚型层次聚类得到最后聚类结果的集成聚类方法。实验结果表明了该算法的有效性。结合集成聚类的多视图聚类,可以利用集成聚类的优势来降低参数对多视图聚类的影响,从而提高聚类性能。因此,本文将两种线索集聚聚类方法LWEA算法和GLWEA算法与多视图聚类算法MLSN相结合,得到了两种多视图矩阵分解的集成聚类方法——LEMGSN和GLEMGSN。实验结果证实该算法相较于MLSN有所提高。
其他文献
1899年创刊于重庆的《华西教会新闻》(West China Missionary News)是中国华西地区最早的基督教杂志。本文以该杂志在1899年至1911年出版发行活动及内容为研究对象,结合历史
风险投资作为一种权益性投资,既能够为中小企业的发展提供资金解决方案,又能够利用掌握的丰富资源和管理经验为公司的发展提供各种服务和支持。IPO也作为风险投资全过程中最重要的环节,是其成功退出并实现收益的最优方式,同样也是资本市场中的重要组成部分。当前,中小板及创业板市场为解决中小企业融资难问题提供了渠道,为中小企业搭建了融资平台,也为我国风险投资的健康发展拓宽了空间。本文以我国中小板和创业板2009
国内对优质苹果苗木的研究逐渐深入,理论逐渐成熟。随着现代苹果产业的快速发展,多数地区发展规模化栽植果园,对于优质苗木的需求也越来越大,因此进行相关的分析意义重大。一
建设社会主义法治国家已经成为我国新时代发展过程中的一个重要目标,随着这一目标的不断推进,法治意识与法治思维已经成为公民生活中必不可少的教育内容,“法治”两个字的重要理念也进入了生活的各个方面,其中最重要的就是法治教育在大、中、小学中的开展。虽然法治教育已经在学校教育中占有一席之地,但是它还存在一些问题,其中最重要的就是学生的法治观念还没有内化于心外化于行,这在一定程度上影响了将我国建设成为具有中国
近年来我国电力企立发展取得了良好的成效,在推动全国社会经济发展中发挥了不可替代的作用,这些成绩与电力企业全体领导和职工的辛勤劳动与付出是分不开的,这也是电力企业办
习近平总书记在党的十九大报告中深刻指出,要以提升组织力为重点,突出政治功能,把基层党组织建设成为宣传党的主张、贯彻党的决定、领导基层治理、团结动员群众、推动改革发
目的:骨性Ⅲ类高角患者前牙区的牙槽骨厚度最为菲薄,是临床正畸医师关注的重点。舌位于口腔中,其位置、大小对下前牙位置及下前牙牙槽骨形态的影响尚不明确。本研究通过应用C
近几十年我国地震频发,每一次地震的发生都造成了人员伤亡和无法估计的经济损失。由于第五代《中国地震动参数区划图》发布,部分地区的设防烈度将有所提高,既有建筑将会因地