图像分类中的类别结构与特征学习

来源 :中国科学院大学 | 被引量 : 0次 | 上传用户：jiahenglipin

【摘要】

：

计算机视觉的主要研究目标是有效地根据图像等多维数据建立人工智能系统从而认识现实世界。图像分类是计算机视觉领域基础研究问题，是理解和分析图像内容的重要技术方法。而在

【作者】

：

申丽

【机构】

：

中国科学院大学

【出处】

：

中国科学院大学

【发表日期】

：

2015年期

【关键词】

：

图像分类类别结构特征学习

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

计算机视觉的主要研究目标是有效地根据图像等多维数据建立人工智能系统从而认识现实世界。图像分类是计算机视觉领域基础研究问题，是理解和分析图像内容的重要技术方法。而在当今大数据的时代背景下，处理大规模图像问题已成为研究趋势。同时数据量大、标签信息复杂而丰富等问题也向传统的分类模型和特征提取方法提出了严峻的挑战。如何挖掘和利用视觉信息、建立分类模型来有效处理大数据分类问题是本文研究的目标。结合类别结构和特征学习两个研究点，本文提出了一系列的方法，主要研究内容和贡献如下:　　(1)提出基于层次结构的多级判别字典学习算法。判别（有监督）字典学习算法相比于无监督字典学习方法，将判别性准则融合到字典学习中，捕捉有判别力的信息。然而，这些方法伴随着非常高的时间复杂度，尤其在处理较多类别的图像时，制约了其在大规模数据上的可用性。本文提出的这个算法，将层次化的类别结构运用到判别字典学习的算法框架中，将原始问题分解。层次化训练和预测机制显著降低时间复杂度。另外，结合类别结构蕴含的视觉性质，采用层次化的判别字典学习方法，位于不同层的字典被用来捕捉不同尺度的视觉信息，并结合字典继承策略来提升较低层次节点的可分性。相比于传统的判别字典学习方法，该算法能有效地捕获和利用丰富有判别力的信息，大量实验证明其在处理大量类别的分类问题时展现出的良好性能。　　(2)提出联合判别学习特征和类别结构的算法。在层次化模型中，类别结构影响着信息的传递，对模型性能（准确性与效率）起着决定性的作用，因此如何定义一个好的类别结构至关重要。传统的层次结构学习多基于预先计算的特征表示，不同层的分类子任务建立于相同的特征空间，当处理到较低层时，不充足的判别信息导致节点间的低可分性。我们提出的这个算法，将深度特征学习的能力引入到类别关系建模中，基于多层特征的动态抽取和学习，充分利用视觉信息来建模类别关联性，从而得到更合理的类别结构和分类模型。实验表明，该算法相比于其他层次化模型方法在类别结构学习和分类两个问题上非常有效;相比于基于平坦类别结构的特征学习方法，该算法则在测试效率上展现了明显的优势。　　(3)提出基于特征学习的共享模型分类算法。不同于层次化模型框架，将图像分类问题形式化在多任务共享学习框架下，利用任务（类别）之间信息的共享来提升整体系统的分类准确度。基于不同的先验假设，将特征学习和多任务共享机制相结合:一是采用树结构先验，提出一种基于树先验的层次化特征共享分类算法，实现任务（类别）之间多层信息的传播和共享;二是采用特征子空间假设，提出一种基于正则化约束的适应性共享分类算法，目的在于鼓励类别之间选择性地共享信息，同时捕捉各自的差异。本文利用一个参数组合，加以不同的正则化约束来实现这一目标。除了用于对预提取特征的分类模型学习，还将此共享机制扩展至深度神经网络框架，利用类别之间的关联性增强系统的判别能力。大量实验验证了算法的有效性，并展示出将特征学习和共享学习范式结合的显著优势。

其他文献

真实感人脸纹理关键技术研究及实现

在计算机图形学领域中，再现具有真实感的人脸纹理有着重要的学术价值和广泛的应用前景。本文以生成具有真实感的人脸纹理为研究月标，针对此问题中的有效的带约束纹理映射技术和

学位

真实感人脸纹理主动外观模型多角度纹理混合带约束纹理映射计算机视觉

基于集中式架构的异构网络无线资源管理关键技术研究

随着移动互联网的迅猛发展，移动数据流量呈指数倍增长。一方面，由于80％的移动数据流量仅发生在20％的热点区域，在传统的宏小区区域重叠覆盖低功率节点的异构无线网络成为满足局部区

学位

集中式基站异构网络无线资源管理负载均衡服务质量

协同工作环境中基于标签的文档检索技术研究与实现

e－Science旨在重要的科学领域中通过因特网进行分布在全球的合作，并充分利用极大规模的数据、万亿次规模的计算资源和高性能的可视化设施促进广泛、深入的科学研究和产生新的科

学位

协同工作环境标签文档检索协同文档库自由分类法虚拟实验室

三维扫描系统仿真及其应用

随着三维扫描仪的广泛应用，三维扫描相关算法的研究与测试成为了时下产业内的热门问题。在工业应用中，算法的稳定性是衡量一个算法是否优秀的重要指标，对三维扫描仪算法的开发者

学位

三维扫描仪网格处理三维重建路径优化

科学计算环境SCE客户端的设计与实现

科学计算是伴随着电子计算机的出现而迅速发展并获得广泛应用的新兴交叉学科，是数学及计算机应用于高科技领域的必不可少的纽带和工具。在当代科研活动中，科学计算已经成为与实

学位

作业管理数据管理浏览器编程SCE客户端科学计算

面向网络传输的全景视频编码技术研究

全景视频亦称为沉浸式视频，观察者视点不变，通过改变观察方向，能够观察到周围的全部场景。利用全景视频可以建立起供用户观察的虚拟环境，用户通过在其中的漫游，能够交互地从不同观

学位

全景视频视频编码分块编码最优编码块尺寸数据提取运动估计网络传输

基于CAS构建门户平台的单点认证模型

随着基于Web的分布式企业级应用规模的不断扩大，组织中的孤立的、分散的应用系统访问点不断增加。在这个发展过程中，人们逐渐意识到信息共享和统一视图的重要性，企业应用集成的

学位

身份认证单点登录安全机制单点认证模型CAS协议Java语言

片上光互连网络关键技术的研究

微处理器体系结构正在从多核走向众核。随着片上集成IP(Intellectual Property)核数目的不断增加，功耗、带宽、扩展性等问题日益凸显，片上互连(On-chipInterconnection)开始成

学位

片上网络光互连维序路由流量预测自适应合并

RFID读取率优化策略研究

无线射频识别RFID(Radio Frequency Identification)技术是现代信息技术领域中最具活力和前途的高新技术。射频识别技术也被广泛应用于众多的领域，本文基于RFID在食品安全中的

学位

无线射频识别读取率正交试验粗糙集BP神经网络食品安全

医疗数据流模式查询处理的设计与实现

随着传感器网络、互联网和普适计算等领域的蓬勃发展，数据流技术得到了越来越广泛而深入的应用，也引起了学术界和工业界的高度重视。重症监护病房(IntensiveCareUnit，ICU)是一个

学位

医疗数据流数据查询模式查询查询处理

图像分类中的类别结构与特征学习

与本文相关的学术论文