卷积网络在图像感知分类中的应用研究

来源 :中国科学院大学 | 被引量 : 0次 | 上传用户:xxxmmm1236
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
人类接受的大量信息都是通过视觉系统加工处理而产生的。图像是一种重要的视觉信息,具有形象、直观、内容丰富等特点,是视觉媒体信息中重要的一种。对图像内容的理解与感知已经成为当前人工智能领域一个极富挑战的课题。如何对海量的图像数据进行有效的组织、存储和检索,已经成为近年来重要的研究课题[1,2,3]。本文中利用深度学习与卷积神经网络等技术,通过对图像特征的抽取、表征以及标签内容学习,建立图像感知分类模型让计算机对图像内容感知,实现对图像的自动分类。  近年来,图像分类技术研究取得很大的进展,但是由于传统的底层视觉特征提取方法与分类模型分离的技术结构的局限,图像感知分类仍然存在许多亟待解决的问题。深度学习近年来在多个领域取得突破性的研究进展,对于将深度学习技术应用到图像感知的研究也成为一个重要的方向。卷积神经网络由于独特的特性,在图像、语音等领域[4,5]得到广泛的应用并且取得不错的研究进展。卷积神经网络具有局部连接、权值共享,拥有对局部空间特征采样的能力,对平移和放缩拥有不变性,在图像等领域得到广泛的应用。由于神经网络模型本身结构复杂,对于特征的学习以及图像数据的感知分类仍然有许多问题需要解决,因此它还是机器学习与图像感知分类领域的一个研究热点。  本文以深度卷积神经网络模型与理论为研究基础,着重研究卷积神经网络模型在图像感知分类中的应用。研究工作围绕特征学习与表示、深度卷积神经网络的结构设计以及特征交互等工作展开。取得的主要成果有:  1.提出基于卷积特征交互的卷积神经网络层。该神经网络层通过因式分解技术实现了在传统卷积神经网络基础上的特征交互过程。挖掘卷积特征间的隐含关系,对原始图像特征进行更高维的表征。通过对卷积特征的交互学习,加强了特征间的学习与理解。通过对图像数据的分类实验,验证了本文提出的基于卷积特征交互的卷积神经网络层在构建神经网络模型在图像感知分类中的有效性。  2.提出多尺寸图像输入的卷积神经网络模型结构。该结构支持单模型中接收多个尺寸的图像特征输入,通过不同的卷积特征提取过程,挖掘多尺寸下不同的特征表示,然后将各个尺寸下的特征表示聚合继续学习,最后用于图像的感知分类。该结构能够结合多个尺寸特征的特点可以作为正则应用在深度学习图像感知分类模型中。实验表明了这种多尺寸输入结构的模型在图像感知分类中的有效性。  3.提出多尺寸多损失的卷积神经网络模型。该模型结构在多尺寸输入的基础上,在深度模型中引入多损失。首先在深度模型中引入多个损失函数可以加快学习的速率,避免梯度消失、梯度弥散等问题的出现;其次,针对不同尺寸的图像特征输入加入损失函数进行学习,加强局部的有监督的特征学习。
其他文献
学位
学位
随着物联网概念的快速发展,作为物联网最底层的交互单位——智能物件,越来越受到关注和研究。智能物件作为可以独立感知和执行的个体,在物端协同、信息物理系统等方面发挥着重要
视觉障碍给盲人和视障患者的日常生活带来极大的不便,由于缺乏对周围场景的了解和视觉感知,盲人的行走存在安全隐患。为了帮助盲人安全行走,国内外研发了基于超声波、激光、红外
随着web技术的快速发展,网站的交互性越来越强。人们开始从单纯的信息接收者,转变为信息的生产方。网络上存在着大量的文本数据,并且每天都在不断增加。比如facebook等社交媒体
学位
随着现代计算机技术的飞速发展,数控技术也日趋成熟。为数控产品设计并实现零件加工库是提高生产效率和产品质量的一种有效方法。零件加工库能有效缩短产品的设计和生产周期,提
学位
随着Web的发展和Web复杂性的提高,越来越多的用户开始遇到诸如Web页面加载缓慢的Web性能问题。Web性能的好坏直接影响着业务的成败,对于提供商企业和用户都十分重要,因而有必要
目前,化学交联质谱技术已成为研究蛋白质结构与蛋白间相互作用的主流技术。虽然近几年交联质谱技术有了很大的发展,但由于交联二肽的搜索空间巨大,在计算方法方面的研究相对滞后