基于多样性约束的多视图聚类研究

来源 :山西大学 | 被引量 : 0次 | 上传用户:wysaccp
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
现实生活中的许多数据都是从多个角度描绘的,例如,一些新闻是从各种来源进行报道的,从这些数据中探索有用的知识是数据挖掘的一个主要课题。现有大多数多视图数据都是未标记的数据,从大量未标记数据中挖掘有用信息成为不可避免的挑战。K-Means聚类算法被提出用于从大规模未标记数据中提取知识并获得了广泛的应用,然而,传统的K-Means算法的缺点是它只适用于单视图数据。近年来,不少学者已经提出了多视图聚类方法来克服传统聚类算法只能对单个视图进行聚类的限制。但是,这些方法几乎都没有充分考虑视图之间信息的相关关系从而没有使得参与聚类的各个视图信息拥有较高的互补性以及较低的冗余性。本文从两个角度讨论了多视图聚类的研究进展,针对现有多视图聚类方法存在的问题进行了深入细致的研究和探讨,取得的成果如下:(1)针对现有基于K-Means的多视图聚类方法未能有效权衡多视图之间信息的一致性与互补性这一不足,本文提出一种基于Bregman散度的多视图K-Means聚类方法。该聚类方法利用一种新的一致性度量指标—Bregman散度来度量聚类结果与多个视图之间的信息失真,聚类结果是通过最小化多视图一致性表示形成的聚类结果与多个视图之间的信息偏差来获得。此外,本文通过希尔伯特-施密特独立准则来度量视图之间的相似性,并通过权重向量来衡量各个视图的重要性,从而使得参与聚类的各个视图信息具有最佳互补性与最低冗余性。(2)现有的基于非负矩阵分解(NMF)的多视图聚类方法通常通过对多个视图数据学得一个公共的表示矩阵,然后在学到的一致性表示矩阵上应用K-Means等经典聚类算法得到聚类结果。虽然现有基于非负矩阵分解的方法由于其易于理解以及复杂度低获得了广泛应用,然而现有方法只考虑到各个视图的表示矩阵与学得的一致性表示矩阵之间的相关性,而没有考虑到多个视图表示之间的相关性。本文针对该问题,提出一种新的基于多样性约束的联合非负矩阵分解多视图聚类方法,该方法在联合非负矩阵分解的目标函数中添加对NMF得到的多个视图系数表示之间的多样性约束,利用希尔伯特-施密特来实现来对多视图系数表示之间的相关性的度量,通过权重来实现对参与到聚类的视图信息的多样性的控制。总之,本文针对多视图信息存在的一致性、互补性以及冗余性,考虑现有多视图聚类方法在信息融合方面的不足,提出两种多视图聚类方法,并在实验数据集上对所提方法的聚类性能以及收敛性能进行验证。本文的研究为多视图聚类提供了新思路与新方法,在多视图聚类领域有一定的理论和应用价值。
其他文献
目的:建立一种胃酸与内毒素的协同作用的实验性吸入性肺炎模型并探究吸入性肺炎与细胞焦亡的关系。方法:雄性清洁级SD大鼠74只,体重约为200-240g,10只大鼠用于提取大鼠胃内容
研究目的:自噬(Autophagy)是一种高度保守的溶酶体依赖性的胞内物质降解过程,与癌症、自身免疫性疾病和心血管疾病等密切相关。心血管疾病患者死亡的主要原因是由于动脉粥样
对流云是我国各地常出现的重要降水云系,深入研究对流云的演变规律、降水机制和对流云催化方案和效果,对于其降水预报以及实际外场人工消减雨作业都是至关重要的。本文使用CA
"健康就是金子"这是1953年4月7日世界卫生日主题口号,旨在号召人们重视健康,关爱自己,提高生活、生命质量。健康与长寿,人皆求之,但得之却不易。这并不是人天生就命短,当古代
会议
2015年6月以来,我国股票市场的不景气和股灾爆发,使融资融券再次成为大众关注焦点,卖空制度更是成为争议焦点。在2010年3月我国正式启动融资融券交易试点,实现了证券市场的双
由于高新工业科技的飞速发展,机械产品的内部结构变得日益复杂,造价成本高,更换产品会造成大量资源浪费,因此研究复杂系统的维修策略问题是可靠性工程应用中备受关注的问题。本文针对特定的带有一个冷贮备两部件串联系统,基于几何过程模型和广义几何过程模型,分别研究三种不同的维修策略,然后对比分析三种维修策略。对于系统的故障维修策略,利用几何过程模型和更新报酬理论,以部件2的故障次数N作为更换策略,分析系统长期
目前,癌症已经成为影响人们健康的重大疾病,寻找有效的抗肿瘤药物成为治疗癌症的主要方向。抗菌肽(antimicrobial peptides)是多种生物天然免疫系统中的重要组成部分,它对正
目的:分析慢性肉芽肿病继发肺部烟曲霉感染的患儿的临床特点,提高对慢性肉芽肿病、侵袭性真菌感染的认识和临床重视程度。方法:详细分析我院儿科ICU收治的1例慢性肉芽肿病继
随着多媒体技术的发展和人们对世界认知的提升,三维视频技术逐渐得到重视。但三维视频技术在利用深度图的绘制技术(DIBR)进行新视点图像合成时,由于前景遮挡、视点变化等原因
目的:探讨超声声脉冲辐射力弹性成像(Acoustic Radiation Force Iimpulse,ARFI)量化技术与超微血管成像(Superb Microvascular Imaging,SMI)联合运用对提高早期乳腺癌诊断率