交叉领域识别中若干问题与方法研究

来源 :广东工业大学 | 被引量 : 1次 | 上传用户:wenliang729
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近年来,随着网络、视频监控的普及以及数据存储媒介不断廉价化,数据的采集和存储变得越来越容易。目前,大多数算法通常依赖数据的分布不随环境而改变这一假设。但是在实际应用中,数据采集和生成机制都是随需要而改变,例如在一些车站、机场等公共场所,为了更好地监控和分析潜在的危险,视频设备往往安装在交叉的位置,交叉视频设备由于光线、角度及遮挡等因素造成采集到的数据(交叉领域数据)概率分布不同。与传统数据相比,这些分布不同的数据由于结构的差异处理起来更为复杂。如何有效地利用交叉领域数据的内在分布来准确地寻找和分析用户需要的信息已经成为计算机视觉、机器学习和模式识别领域的研究热点,其中最为显著的成果就是交叉领域识别与分析。通过减小交叉领域数据的分布差异,使得知识可以在领域之间实现复用,以增强算法的学习性能。随着大数据时代的到来,亿万级规模的数据导致数据的标签缺失性和统计的差异性问题愈加凸显,如何在不同分布的数据之间进行知识迁移/复用将不可避免,特别是针对应用越来越广泛的交叉领域数据尤为如此,这也使得交叉领域学习在未来有望成为机器学习领域和工业应用的一个重要的研究方向。尽管目前学者们提出了众多方法来解决交叉领域识别中的一些问题且已取得显著效果,特别是推进了其在视频分析和图像检索方面的应用。但是由于处理不同分布数据的复杂性,在交叉领域数据学习中仍然存在亟待探索和解决的问题。由于这些问题交错叠加,极大地增加了解决问题的难度。针对上述问题,本文提出了一系列交叉领域识别学习理论方法与算法框架。本论文的研究成果不仅可以进一步拓展到多领域、多视角和多模态数据,而且可以应用在实际的目标识别(如交叉摄像头下的行人再识别)、视频分析(如交叉视角下的视频检索)、语音识别(如方言和普通话交叉识别)、生物特征识别(如多特征/交叉特征联合识别)和多模态/多视角图像检索等,因此具有重要的理论价值和广泛的应用前景。具体地,本论文的主要工作概况如下:(1)针对传统的线性鉴别分析方法不能有效处理具有不同分布的数据的缺点,提出了一个基于矩阵低秩转换的可迁移线性鉴别分析方法,进一步拓展了传统的线性鉴别分析方法到可迁移的环境下。该方法主要思想是基于来自于同一个子空间的数据具有低秩的结构,因此在大间隔准则的线性鉴别方法模型框架下,以矩阵的低秩转换为主要准则,提出了局部低秩转换和全局低秩转换,通过转换矩阵将不同领域数据转化到一个子空间,并利用转化后数据矩阵秩之间的差值来使得具有相同标签的转换后的数据具有低秩结构,进而有效减少来自于不同领域的且具有相同标签的数据之间的分布差异,因此转化后的具有相同标签的数据能够较好地排列在一起,使得领域知识得以复用。(2)提出了一种新的数据重构方法,即利用投影数据的自重构和交叉重构来学习一个单一的字典。不同于传统的交叉领域识别字典学习方法,通过学习两个不同的字典来匹配不同领域的数据,本文提出的方法通过使用投影数据的自重构和交叉重构来分别地保证字典的重构能力和字典的可迁移能力。为了提高字典的鉴别能力,本文进一步提出了一个更灵活的标签一致项。该标签一致项通过引入一个非负矩阵来尽可能地拟合交叉领域数据的标签,通过学习一个非负的标签矩阵,该标签一致项可以避免因数据分布差异而导致的语义间隔,进而有效地利用标签信息来学习一个鉴别的重构系数矩阵。(3)提出了一种新的分类器学习方法,该方法首先分析了传统方法通过减少交叉领域数据条件概率分布和间隔分布并不能完全使得不同领域数据交叠在一起,因此,本文进一步提出了先在不同领域数据新的特征表示上各自训练不同的分类器,并且通过动态逼近的策略,使得两个不同的分类器在学习的过程中相互逼近,最终使用平均分类器的方法来融合两个分类器。通过理论和实验验证,该动态分类器逼近策略可以学习一个迁移能力较强的分类器。(4)为提高交叉领域识别的效率,提出了一种潜在弹性网迁移方法。该方法通过1)投影所有原始数据到一个潜在子空间以减小交叉领域数据分布差异;2)引入提出的基于低秩约束的矩阵弹性网回归技术来转化潜在的数据特征到数据的标签空间,同时利用低秩抓住数据的类结构。理论和实验表明:该方法可以有效使得来自于不同领域但是同类的数据充分交叠在一起,有效减小数据分布差异,大幅提高交叉领域识别率。
其他文献
随着对煤、石油和天然气等传统能源的高度开发与利用,能源问题将成为制约中国经济持续发展的严重瓶颈。风能作为最具前景的替代能源之一,其开发和利用越来越受到世界各国的重
目的 :探讨对康复医学科的住院患者实施综合护理对预防其跌倒、坠床的临床效果。方法 :对近年来我院康复医学科收治的150例住院患者的临床资料进行回顾性研究。我院随机将这些
背景妊娠期糖尿病(gestational diabetes mellitus,GDM)是指孕妇在妊娠期间首次产生或者首次发现的一种糖耐量异常,通常于妊娠中晚期出现,是一种常见的妊娠合并症,给孕妇和胎
对外开放是一把双刃剑,它在为我国经济发展带来了无限的机遇的同时,也使得大量外资企业涌入我国,给我国的本土企业带来了巨大的挑战。对于教育行业来说,以往"填鸭式"的教学方
针对基本蚁群算法 ,设计出一种新颖的随机扰动蚁群算法 ,并将其应用于求解复杂 TSP问题 .该算法包含了两个重要方面 :一是提出了采用倒指数曲线来描述的扰动因子 ;二是设计出
5月中旬,桂林市地产早熟优良杨梅品种荸荠种如期成熟开园上市。初市期,市场零售价16~20元/kg;上市旺期,销售价格有所下降。与上年同比,其销售价格上涨。目前,荸荠种杨梅在桂
期刊
随着磁共振成像在临床诊断中的普及,磁共振成像造影剂的需求也与日俱增。面对目前临床上的造影剂存在的一些不足,设计高性能的磁共振造影剂已成为分子影像学和活体成像分析领