基于稀疏表示的多视角聚类研究

来源 :广东工业大学 | 被引量 : 0次 | 上传用户:c566178
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在机器学习领域,多视角聚类是一个热门的研究方向,其主要的任务是根据多视角数据自身的数据特性,对不同视角的数据进行融合,获取数据的潜在模式,从而将数据划分为不同簇类。目前,针对多视角聚类的研究,研究者们提出了许多方法。其中,比较受关注的是基于表示学习的多视角聚类方法。该类方法的核心思想是在子空间中,从多个视角数据中学习一个统一的表示,用于聚类。因此,基于表示学习的多视角聚类方法的关键在于如何从多视角数据学习到一个高可分辨性的表示。近年来,由于数据的有效信息存在稀疏性这一先验知识,稀疏表示方法在许多领域中被广泛应用。已有研究者将稀疏表示用于研究多视角聚类,取得了不错的聚类结果,但仍有进一步提升的空间。本文阐述了多视角聚类和稀疏表示算法的研究背景及意义,详细地分析了稀疏表示学习模型和多视角聚类的研究现状,并总结了现有的多视角聚类方法所存在的问题,从而设计了对应的解决思路与方法。本文的主要贡献如下所示:(1)针对现有的多视角聚类方法只考虑了一致性和互补性等多视角数据属性,或视角内信息的冗余性问题,本文设计了一种基于l1范数正则化约束的稀疏表示多视角学习方法,采用部分共享策略来联合利用一致性和互补性,获取多视角数据的潜在模式,并采用l1范数稀疏约束来降低视角内的信息冗余,从而获取一个高质量的表示,以提升聚类效果。此外,该方法引入了图正则约束,来保持数据的内在流形结构,进一步提升聚类效果。同时,根据所设计的多视角学习模型,本文设计了一个高效的优化算法来加速模型的训练。实验上,在六个真实的多视角数据集上,和现有的单/多视角聚类方法相比,该方法具有一定的优越性。(2)针对现有基于稀疏表示的多视角方法未能充分利用多视角数据的数据特性,且忽略了样本之间的局部结构等问题,本文设计了一个基于局部约束编码的稀疏表示多视角学习方法,不仅联合利用了多视角数据的一致性和互补性等数据特性,而且采用局部约束编码技术来实现所学到的表示的稀疏性和获取样本之间的局部结构信息,提高所学到的表示的可分辨性,以提升聚类效果。同时,该方法采用图正则约束来保持数据的潜在流形结构,进一步提高聚类效果。另外,根据所提出的多视角学习模型,本文设计了一种有效的优化算法来训练模型。实验上,在四个通用的多视角数据集上,该方法优于现有的多视角聚类方法。
其他文献
周期特性广泛存在于工程应用中,如天体力学,卫星姿态控制,弹性力系统、电力系统等。从19世纪开始,Floquet等各国知名学者就周期系统理论问题展开了研究,并尝试解决周期系统的控制问题,但由于其本身复杂的特性以及数值计算等问题导致其控制问题难以研究。近年来,周期分段线性系统作为一类特殊的具有混杂特性与周期特性的系统,被认为是对周期时变系统最有效的近似手段,因此受到了众多学者的关注。周期分段线性系统由
学位
由于技术的发展,新化合物的合成速度加快,每年诞生的化合物数以万计,传统的评价方法不可能高效的对所有化合物进行评估。并且近年来患癌人数急剧上升,目前仍不清楚大多数的癌症是暴露于何种致癌化合物而导致。世界卫生组织国际癌症机构致癌清单中仅有429种物质被归为具有致癌性物质,但仍存在多种化合物未进行判定。传统的化合物致癌性评估主要通过实验测试进行,试验周期长且成本昂贵,不确定因素过多,因此迫切的需要开发替
学位
随着平视显示器(HUD)系统在飞机上普及应用,其配套的训练课程和训练设备的需求量持续增长,HUD将会成为D级飞行模拟机必选功能件。主要介绍了飞行平视显示器的各组成设备及功能,实现了HUD真机件在飞行模拟机上的安装、接口信号激励以及与视景系统的校准。安装、激励和校准完成后,参照中国民航局的HUD鉴定标准对飞行模拟机上集成的HUD系统进行了功能、性能和精度的验证,结果表明,方案具有良好的稳定性、实时性
期刊
肿瘤涉及DNA、RNA、蛋白质和代谢物水平的多种异常,是一种复杂的全身性疾病。根据中心法则衍生的组学方法分别为基因组学、转录组学、蛋白质组学和代谢组学。在过去的数十年间,关于肿瘤的单一组学研究取得了显著成绩,但肿瘤发生发展的确切机制尚不清楚。为了更加系统地揭示肿瘤发生发展的过程及其机制,多组学研究应运而生,推动肿瘤研究范式从单参数模型向多参数系统模型的转变。多组学方法的整合有望阐明肿瘤的发生发展机
期刊
激光波数扫描干涉(Wavenumber Scanning Interferometry,WSI)是一种具有非侵入、高灵敏、高精度和层析测量的方法。通过借助光源的波数线性扫描和全场干涉特性,WSI在无需机械部件扫描前提下,就能实现被测样件内部三维体变形场测量,被广泛应用在医学诊断、生物成像和复合材料检测等领域。然而在测量过程中,样品的深度变形场是由光谱干涉图经过傅里叶变换得到的,为了重构傅里叶变换后
学位
市政工程主要包括道路、桥梁等与居民生活相关的工程建设。由于使用人数众多,市政工程不单单是使用质量那么简单,更关系到城镇正常生活及秩序的平稳。因此,强化市政工程建设,优化施工质量,对于推动市政工程有着重要的价值意义。
期刊
近年来,区块链已经和人工智能、大数据、物联网等前沿信息技术深度融合。其中,区块链下的物联网相关研究,如隐私保护、能源和数据交易、物联网下的共识机制等正在如火如荼地开展。然而,基于区块链的物联网面临一些严峻的挑战,这些挑战源于解决共识机制中的工作量证明问题(Proof-of-Work,Po W)需要大量的计算资源,但是物联网设备的计算资源有限,这限制了更复杂研究的开展。为了解决这个问题,可以将边缘云
学位
近年来,目标跟踪领域的新技术不断出现。其中,动态目标跟踪是移动机器人领域的研究热点,从公共场所的治安监控、道路中对违章车辆的监控、自动驾驶车辆再到无人机对目标的跟踪,目标跟踪技术已经广泛应用于各个领域。然而,目前的动态目标跟踪技术依然存在一些关键问题。首先,用于监控领域的目标跟踪基本都通过固定形式的摄像机拍摄视频,即使能够在支架上旋转,单个摄像机能够观察的视野非常有限。其次,应用于机器人领域的动态
学位
在实际控制系统中,因为被控对象本身或所处环境的物理局限性,往往会约束控制系统的输出或状态。与此同时,控制系统的性能是考察控制器是否有效的关键评判因素。所以,研究面向性能的非线性系统约束控制问题具有重要的意义和价值,并且取得了一定的研究成果,但依然存在未解决的难题,即:现有基于障碍李雅普诺夫函数的控制方法通过约束跟踪误差来实现对系统输出的约束,要求系统输出初始值必须限制在一个比给定约束区间更小的区域
学位
肿瘤药物敏感性预测在指导患者临床用药方面具有重要意义。本文基于癌症药物敏感性基因组学数据库(genomics of drug sensitivity in cancer, GDSC) 198种药物的细胞系敏感性IC50数据,通过Stacking集成学习构建了包含基因表达、基因突变、拷贝数变异数据的多组学癌症药物敏感性预测模型。采用多种特征选择方法对基因特征进行降维,使用Stacking方法集成6种
期刊