【摘 要】
:
子空间学习是图像特征提取的基本方法之一。子空间学习方法力图保持原始数据的某种结构信息或鉴别信息的同时将高维数据投影到低维子空间上,从而达到降维和获取最优鉴别特征信息的目的。然而,大部分子空间学习方法对噪声、野点和其它干扰等较为敏感,使得他们在实际应用环境中缺乏鲁棒性。近年来很多研究致力于提高子空间算法的鲁棒性,但它们在应用到图像特征提取与识别任务仍存在一些系列的问题。现有子空间学习方法存在的问题可
论文部分内容阅读
子空间学习是图像特征提取的基本方法之一。子空间学习方法力图保持原始数据的某种结构信息或鉴别信息的同时将高维数据投影到低维子空间上,从而达到降维和获取最优鉴别特征信息的目的。然而,大部分子空间学习方法对噪声、野点和其它干扰等较为敏感,使得他们在实际应用环境中缺乏鲁棒性。近年来很多研究致力于提高子空间算法的鲁棒性,但它们在应用到图像特征提取与识别任务仍存在一些系列的问题。现有子空间学习方法存在的问题可以总结为以下四点。首先,传统的子空间学习方法大部分是以欧氏距离作为度量,它们的识别率会受污染数据的影响,因此这类模型的鲁棒性并没有得到充分的考虑。其次,基于稀疏表示的子空间方法大都是将低维嵌入和稀疏回归分别进行的,这样既无法获得最优子空间也影响了对图像识别的精度。不仅如此,大部分基于低秩表示的子空间学习方法不仅无法将训练样本投影到低维子空间,而且无法利用样本的类标签来获得有鉴别力的子空间。最后,小类别问题也是子空间学习方法常常忽视的问题,大量方法学习到的投影个数受制于样本的类别数,在类别数较少的情况下无法获得足够的投影而获得较高的识别率。为了解决以上问题,我们系统地提出了一系列新的方法,分别为鲁棒嵌入回归(Robust embedding regression,RER),松弛局部保持回归(Relaxed local preserving regression,RLPR)以及鉴别低秩投影(Discriminative low-rank projection,DLRP)。这一系列模型的核心思想就是运用子空间学习算法来增强模型在噪声环境下的学习能力并提升鲁棒性。首先,RER方法采用L2,1范数作为目标函数基本度量以提高算法的鲁棒性,并将低维嵌入过程和稀疏投影学习过程统一起来,这样它不仅在回归过程中获得联合稀疏投影,在嵌入过程中又能获得稳定且鲁棒的低维重构。其次,RLPR及其基于L2,1范数的改进方法通过引入松弛标签矩阵和权重图不仅避免了过拟合问题,而且使类间距尽可能扩大,让同类样本在低维空间更加紧凑。该模型还通过拆分投影矩阵解决了特征提取算法中存在的小类别问题。最后,为了进一步提高算法的鲁棒性和有效性,本文结合低秩表示和最小二乘回归提出了DLRP算法。该算法将污染图像恢复成干净数据的同时学习了具有鉴别性的低维子空间。此外,该算法也同时在一定程度上解决了低秩回归模型中的小类别问题,提高了人脸识别的效果。本文针对提出的模型设计了相应的迭代算法,并运用了多种技术进行优化,包括线性交替方向法、自适应惩罚、奇异值分解以及特征分解等。除此之外,本文还给出了这一系列模型的理论分析,比如收敛性分析、时间复杂度分析以及参数敏感度分析等。通过在图像数据库上进行大量的实验,证明了所提出的一系列方法的鲁棒性和有效性。
其他文献
随着在线学习的兴起,泛知识平台如微信读书、喜马拉雅、得到、知乎等可以在线学习、看书、听课的平台也随之兴起。互联网用户对在线知识平台的选择度越来越大,在线知识平台希望可以增加更多的用户留存和主动使用。因此,在线知识平台相继设计了很多游戏化元素来刺激用户持续学习和使用平台。例如微信读书设计的读书小队,比较好的留住了用户。所以本文希望探究游戏化设计和用户期望满足以及用户留存意愿之间有什么样的相互关系。本
投资是公司理财的核心内容,投资活动的成败直接关系到公司的稳定发展乃至生存。近几年来,我国上市公司投资效率普遍不高,部分公司出现了过度投资现象。过度投资会导致公司经营效率下降,降低公司价值。由此,如何有效抑制过度投资行为,对于保障公司健康发展、提升公司价值至关重要。理论上,股票回购作为发放现金股利的替代方式,减少了公司自由现金流,能够抑制公司过度投资行为。我国上市公司股票回购能否有效抑制过度投资,管
由于我国资本市场起步晚、发展不完善,股价崩盘现象时常发生,它扰乱了资本市场的运行规律,影响了投资者对资本市场的信心,甚至可能会对实体经济的稳健发展造成一定影响。在这一背景下,关于股价崩盘风险影响因素方面的研究越来越受到国内学者的关注。内部控制作为现代公司治理体系中的一种重要机制,目前已被投资者以及资本市场广泛认可,上市公司披露的内部控制缺陷信息是评价内部控制质量的重要信息之一,近年来越来越受到我国
图片马赛克作为一种艺术形式,已经在如广告、家具装饰、娱乐等诸多领域被广泛应用。传统意义上的马赛克合成方法通常使用纯色色块或具有一定纹理特征的图块作为算法输入,而图片马赛克则是使用由数据集检索所得的图片集合合成马赛克结果。由于图片马赛克作品中存在目标图像主题内容与合成图块视觉内容两种图像信息,因此图片马赛克合成结果的优劣主要集中于两个方面,一方面是整体上对目标图片主题内容的表达,另一方面是局部尺度上
度量学习是文本分类算法的主要研究问题之一。通过学习一个距离度量函数,将样本间距离转化为相似度,对原始数据分布进行重构,将原始数据映射到一个容易划分的拓扑空间。使两个具有同样标签的样本在新的编码空间内距离更近,两个具有不同标签的样本在新的编码空间内距离更远,从而具有更优的分类性能。近年来,不同学者结合深度学习方法的研究发现深度度量学习网络的性能显著优于传统度量学习方法,其核心是构造用于度量学习的深度
在近期生成式对抗网络的研究中,基于生成式对抗网络的人脸图像翻译领域工作取得了令人印象深刻的进步。现有的方法通常是使用判别器与生成器进行对抗来生成更逼真的图片,再辅以一个分类器约束来促进不同域之间的图像翻译从而达到最终的目的。但是他们忽略了一个非常重要的问题——域分布的匹配问题,即生成图像的分布与真实图像的分布并不相同。为了解决这个问题,本文提出了一种开关式生成对抗网络,这个网络具有一个更适合于多域
社交网络平台是近十年来互联网用户最广泛应用的大型信息系统,已经成为海量用户交流与资讯获取的重要渠道。其中,大众社交网络平台(微博、领英、QQ等)很少从研究领域或研究兴趣的角度组织用户和传播信息,因此又逐渐衍生出专为科研人员提供专业学术资讯的科研社交网络平台。这些平台通过提供用户搜索服务帮助科研工作者寻找合作伙伴,并借助推荐系统解决信息过载和需求不明的问题。目前,科研合作者推荐领域重点关注特征的选择
颜色是数据可视化中最重要的视觉通道之一。为不同的可视化任务设计适当的配色,既能促进数据隐藏模式的发现,也可以带来视觉美感。特别是在类别型数据的可视化展示中,合适的配色能美观且清晰地传达每个数据类别之间的关系,用户可以根据颜色快速感知到类别信息。但即便对于专业设计师来说,为给定的类别型数据设计合适的颜色映射也是比较困难的。用户往往使用可视化设计软件提供的配色模板,或ColorBrewer等软件建议的
中文分词问题的研究能够为其他中文处理问题提供更准确的特征。诸如:文本分类,信息检索,问答系统,机器翻译,机器阅读等研究问题都非常依赖中文分词。在应用方面,搜索引擎,舆情分析,翻译系统,智能问答系统等,也需要更好的中文分词来达到更好的效果。而且,随着中文文本数据的急剧增长,这些应用都面临着更多的挑战。在中文文本的特征工程中,中文的词是非常重要的特征之一,虽然中文字符也可以作为特征,但是相对而言语言中
随着物联网技术的不断发展,越来越多不同类型的传感器被运用到最新的电子产品中。电阻式传感器因其应用场景众多(如:温度、湿度、压力等物理量的感测)而备受业界关注。而作为连通自然界模拟量与计算机数据处理所用的数字量之间的桥梁,读出芯片(Readout IC,ROIC)向来是传感系统中不可或缺的一环。Sigma-Delta型模数转换器(Analog to Digital Converter,ADC)凭借过