流形上的子空间聚类算法及应用

来源 :江南大学 | 被引量 : 0次 | 上传用户:yin_guohan163
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
聚类分析作为数据挖掘和模式识别等领域的重要工具,一直以来都是非常热门的研究话题之一,并得到了非常广泛的应用。但是,随着应用环境的不断变化,特别是进入“大数据”时代,数据规模的庞大性和结构的复杂性对聚类分析提出了越来越严峻的挑战,特别是数据的高维度越来越普遍,包括各种图像数据、生物基因表达数据、搜索引擎数据等的维度往往高达上万维。传统聚类算法通常是针对低维度数据设计开发的,在进行高维数据的分析处理时通常会遇到严重瓶颈,无法满足高维数据的稀疏性以及避免“维数灾难”的影响。如何设计开发高维数据聚类算法,满足日益增长的需求,正成为数据挖掘和模式识别领域的重要研究课题。高维非线性数据的表示是困扰聚类任务的一个难题。现有的聚类算法尽管可以通过凸松弛来缓解这个问题,但毫无疑问这不是原始问题的最优解。近年来,流形学习理论揭示了图像视频等数据具有潜在的非线性低维流形结构,从而成为图像视频等高维数据的处理和表示提供了有效的理论和技术工具。本文在基于自表示的子空间聚类的基础上,通过结合数据的流形表示和子空间聚类的方法,在符合数据内在结构的流形空间上进行聚类,探索数据的流形表示和子空间聚类更优的结合方案以及合适的应用场景,构造新的子空间自表示聚类模型,并给出相应的优化求解方法。本文的主要工作概括如下:(1)提出了一种利用多阶统计特征的子空间聚类表示模型。对于无监督的任务,充分利用先验信息非常重要。基于此,我们使用多阶统计特征从不同视角对数据集进行特征描述提出了多几何稀疏子空间聚类算法(MGSSC)。从其在人脸,物体,纹理等数据集上的实验结果可以看出我们提出的方案是可行和有效的。(2)提出了一种在SPD流形上基于低秩核子空间聚类表示模型。实验发现,构造样本的协方差矩阵作为样本的二阶特征能够获得较优的聚类结果。这是因为高维图像数据的SPD流形表示具有捕获数据非线性流形结构固有分布特征的能力。然而,仅仅将流形数据映射到能够使用欧氏方法的特征空间可能无法让流形数据在高维特征空间形成线性的子空间结构。基于此,我们使用SPD流形作为图像样本的流形表示,首先提出了一种基于SPD流形表示的低秩核子空间聚类算法。此外,基于核方法的聚类,其聚类表现很大程度上取决于核函数的选择,而对于无监督的聚类问题无法获得充足的先验信息选择合适的核函数。因此,我们进一步将多核学习能力结合起来,进一步的拓展了我们的模型。大量的实验表明,本章所提出的模型与现有的模型相比具有优越性。(3)提出了一种在Grassmann流形上的低秩核子空间聚类表示模型。欧氏距离这种线性的度量方法不适用于图像视频等具有复杂非线性结构的高维数据。基于此,我们利用基于正交子空间的流形表示方法将图像集、视频数据建模到Grassmann流形上,通过使用核方法将Grassmann流形数据映射到再生核希尔伯特空间中,并且对这个过程施加了低秩约束,以期望能够在高维特征空间中形成线性的子空间结构。并且我们将相似度矩阵计算和后续谱聚类过程融合到同一个模型当中。此外,在本章中,我们提出了一个新的JN-art style图像集数据集,包含了中外15位画家的共300幅画作。在多个图像集以及视频数据集上的实验结果可以看出我们提出的方案是可行的,并且获得了很好的聚类效果。(4)提出了一种针对行为识别视频数据的多流形子空间聚类表示模型。针对视频数据,尤其是行为数据集,时序信息可能会对聚类效果有所帮助。此外,不同的行为视频所对应的声音信息往往也很有鉴别性。基于此,我们在利用原始视频数据中的图像信息为基础,通过利用提取视频的光流特征以及视频对应的声音信息,并建模到流形空间中,提出了一种新的多流形子空间聚类表示模型。通过研究多流形表示间的差异,实现多个流行表示的互补性,以此增强该模型对于视频数据的聚类性能。
其他文献
视频监控是“天网”系统的重要组成部分,也是近年来治安防护水平提高的重要推动力之一。随着视频监控设备的普及率逐年上升,监控系统智能化的需求也日益提升。目前,国内大多数的视频监控系统都需要人工值守,安排监控人员24小时轮班来实现监管。通常,每个监管人员需要同时监控多个显示屏,存在效率低、抗干扰能力差、容易受监管人员主观意识影响等问题。随着科研人员对图像处理、视频分析、行为识别等技术的研究越发深入,智能
随着互联网的高速发展,很多电子商务平台逐渐兴起并提高了大众生活质量,但随着数据规模的爆炸式增长,正在使用推荐系统的互联网平台(如阿里巴巴、Paper Weekly等)面临着严重的信息过载问题,无法针对用户特点做有效的个性化推荐。由于传统推荐算法的模型表达能力不够强,而概率图模型同时具有概率论和图论的优势,故可使用概率图模型对推荐问题中各变量之间的依赖关系提供解释性更强的建模,但很多基于概率图模型的
随着社会的飞速发展,大型集会和游行活动的增多,活动中频繁的践踏事件造成大量人员伤亡,因此人群计数的研究成为近几年来计算机视觉领域的主要研究方向之一。本文通过深入分析卷积神经网络中的优势、充分考虑特征层内部之间的联系以及从分群分布随机的角度出发,提出以下三种不同的人群计数网络结构模型。(1)提出基于特征自学习多尺度残差生成对抗人群计数算法(Generative Adversarial Network
人体行为识别旨在针对数据中人体的行为和意图进行识别和理解,是计算机视觉领域一个重要且热门的研究课题,并在机器人技术、人机交互和智能监控等领域起着至关重要的作用。虽然行为识别算法在早期的研究中已经取得了极大的进步,但仍会受到光照改变、尺度变化、细粒度动作多等因素的影响。随着行为识别数据日趋丰富多样,利用多模态数据间的互补优势实现联合预测来提升识别性能逐渐成为许多研究者的重点研究方向。许多现有工作倾向
在文化消费升级的背景下,敦煌文化数字化产业进入了一个新的发展阶段。敦煌文化App作为敦煌文化的重要组成部分,是文化和历史记忆的载体,是敦煌文化与受众之间的桥梁。以移动端平台为基础的敦煌文化数字化传播方式,不仅为敦煌莫高窟带来了利润,也为受众提供了独特而个性化的体验。但目前市场上对敦煌文化App的设计还存在一些不足,这使得对敦煌文化App的设计研究越来越迫切。本文共五章,首先根据莫高窟文化研究现状,
为了应对日趋严峻的物联网恶意软件攻击,需要对恶意软件进行详细的分析并获得有效的威胁情报,从而增强对物联网攻击的发现与预警能力。本文面向物联网威胁情报的需求,分别从恶意软件分析、轻量级物联网异常流量检测角度展开威胁情报挖掘关键技术研究。本文的主要工作和创新内容概括如下:(1)针对当前物联网恶意样本的检测率不高,物联网恶意软件架构复杂,用于训练的正常样本提取困难,动态分析检测耗时、耗费资源等问题,提出
甲状腺癌是全球增长最迅速的、最多见的内分泌恶性肿瘤之一。在最近的几十年中,甲状腺癌的世界发病率显著升高。甲状腺癌还是女性中排名第五的最普遍的癌症,并且女性患癌的概率是男性的3倍。由于甲状腺癌复杂的疾病进展过程,预测这种癌症的潜在生物标志物仍然面临巨大的挑战性。本文基于TCGA数据库和GEO数据库中甲状腺癌的多组学数据以及新近开发的一些特定的生物数据存储库,通过基因差异表达分析、构建生物网络以及基因
信息的爆炸性增长导致数据流广泛出现在各个应用领域中,如无线传感器网络数据流、股票交易数据流、电子商务数据流等,如何高效获取这些数据中蕴含的信息成为数据流挖掘的主要任务。区别于一般的静态数据,数据流通常具有到达速度快、规模大、动态变化等特征,并且数据流中的目标概念随时间推移会发生改变,导致概念漂移发生,严重影响数据流挖掘效果。此外,数据流中通常存在类别不平衡问题,导致少类实例中蕴含的信息难以获取。因
近年来,因严重交通事故、火灾及工业意外等所致的高能量损伤急剧增多,据估计我国每年因此而接受创面修复手术的患者有近百万例。不合理的术前设计方案易造成皮瓣崩裂、坏死等而引发患处功能障碍,甚至可致截肢,给患者增添更多的痛苦和经济负担。因此,研究并创新现有的术前皮瓣设计方法,快速制定合理的术前指导方案,是基础研究转化为临床应用极好的切入点,具有重要的理论意义和实际价值。本文面向临床中的创面实例,就三维创面
移动互联网时代,信息数据如图片、文本、音视频等呈现爆炸式增长。如何从这些语义关联且模态多样的数据中获取有价值的信息显得尤为重要,跨模态检索也因此备受关注。与图片检索等单模态检索不同,跨模态检索能跨越不同模态实现信息检索,更能满足用户日益增长的检索需求。而不同模态的数据特征表示间存在天然的异构鸿沟,无法直接度量其相似性,同模态数据的底层特征表示与高层语义类别间又存在语义鸿沟,难以获得语义一致的数据表