基于深度学习的多属性图像分类方法研究

来源 :中国科学院大学 | 被引量 : 0次 | 上传用户:jinjiajie
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
人类所获取的外界信息中有80%是来自视觉的,而且通过视觉获取到的信息是最丰富也是最复杂的。我们人能够很好的看清楚并理解视觉所捕获到的信息,但是如何让计算机看懂并理解图像信息却是一件非常困难的工作。图像分类是让计算机理解世界的基础,也是多媒体技术研究的一个重要方向。而图像分类中的多属性图像分类则可认为是多媒体技术中一个基本而富有挑战性的研究领域。多属性图像分类工作有助于机器从多个层面来更详细的理解图像,从而为计算机理解世界奠定更坚实的基础。  对于多属性图像分类任务,本文研究了如何利用图像多属性标签之间语义关系的嵌入和卷积神经网络模型不同网络层特征的融合来提高模型的分类准确率。文中提出了两种用于图像多属性分类的卷积神经网络模型,分别为:1)局部非对称的多任务卷积神经网络模型(PAMT-CNN),2)融合多层特征的互影响卷积神经网络模型(ME-DAG-CNN)。文中将两种模型分别应用于多属性图像的分类工作中,并在两个数据集上验证所提模型的有效性。  1.与传统的多属性图像分类工作不同的是,局部非对称的多任务卷积神经网络模型在多属性图像特征的提取过程中考虑了图像多属性语义之间的相互影响,以及图像多属性语义相互嵌入对学习图像特征表示的影响。卷积网络低层更多关注的是图像边缘、颜色等共通的特征表示,而高层则关注的是具有类别倾向的区分性特征。在此基础上局部非对称的多任务卷积神经网络模型通过低层网络参数共享实现图像多属性标签语义的相互嵌入,从而提取出共通的低层特征表示。之后通过在相同传统卷积神经网络模型上表现出更好分类性能的图像属性语义在模型中间层对其他图像属性分类任务进行指导,从而提高模型在图像各属性分类任务上的分类正确率。  2.融合多层特征的互影响卷积神经网络模型是在局部非对称的多任务卷积神经网络模型的基础上改进而来的。局部非对称的多任务卷积神经网络模型在设计时考虑了图像多属性标签语义在特征提取过程中的指导作用,但并未考虑融合多层网络特征对模型分类性能的影响。因此,我们在设计融合多层特征的互影响卷积神经网络模型时同时考虑融合多层网络特征和多属性标签语义相互嵌入对模型分类性能的影响。文章通过实验验证了融合多层特征的互影响卷积神经网络模型在提高多属性图像分类任务正确率上的有效性。
其他文献
随着通信技术的发展,电信新业务的发展越来越快,能够方便地增加电信新业务的智能网技术也发展迅速.同时,移动通信技术在全球范围内发展迅猛,移动语音业务用户数迅速扩大.随着
该文通过扩展基于P2P模式的JXTA协议集来实现改进的连接机制并成功开发了P2P信息交换和共享系统,利用成员资格服务策略限制和确认加人对等实体群的对等实体身份.使用双向单播
时空数据库管理系统是管理既具有时间属性又具有空间属性的数据集合的数据库管理系统.近年来,随着GPS、GIS以及环境数据管理系统等技术的应用和发展,时空数据库管理系统逐渐
入侵检测是一种新兴的网络安全技术,专门用于检测发生于内部网络的恶意行为,它能与防火墙相互配合工作,防止网络从内部被攻破,为网络提供全面的防护,研究入侵检测技术十分必要。 
本文基于动态模糊逻辑理论,针对多Agent系统中在对抗和非对抗环境中的工作机理,建立了多Agent基于对抗和非对抗环境的协调工作模型,主要包括如下几个方面的工作: (1)基于让步
随着网络大数据时代的到来,知识库作为对网络数据进行存储,组织和管理的一项重要技术,其数量和规模也空前地增加。一方面,知识库的快速增长将越来越多的知识存储到计算机中,让用户
该论文主要由两部分构成,第一部分介绍了嵌入式WEB服务器/浏览器的特点以及国内外目前在网络上运行的主要安全系统,详细介绍了当前最流行的用于WEB系统的安全传输协议—SSL,
随着信息化进程的不断深入,计算机软件的应用已经渗透到人们生产、生活的各个方面。在这种形式下,提高软件的开发效率已经成为当前软件开发人员的一个重要课题。软件复用和构件
知识经济的到来,提出了知识管理.办公自动化系统也发展到了以知识管理为中心的第三代.办公自动化(Office Automation)系统出现了新的需求:与其它系统的集成、流程优化、知识
在以计算机技术、通讯技术相结合的信息时代的快速发展和互联网的广泛应用的形势下,3C(Computer、Communication、Consumer)合一的趋势已经形成,其结果必然就是将计算机工业的