深度神经网络在图像识别中的研究与应用

来源 :北京邮电大学 | 被引量 : 4次 | 上传用户：hesion001

【摘要】

：

计算机视觉是当前人工智能领域最热门的研究方向之一,它的研究目标是让计算机具有从一幅幅图像中感知和认知周围环境的能力。图像识别是计算机视觉领域一个重要的研究方向,它

【作者】

：

朱晓宁

【出处】

：

北京邮电大学

【发表日期】

：

2019年01期

【关键词】

：

卷积神经网络图像识别随机优化特征提取目标检测

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

计算机视觉是当前人工智能领域最热门的研究方向之一,它的研究目标是让计算机具有从一幅幅图像中感知和认知周围环境的能力。图像识别是计算机视觉领域一个重要的研究方向,它在视频监控、生物识别、无人驾驶、人机交互、医学影像识别等行业应用中,具有重要的研究意义和应用价值。近年来,虽然基于深度学习算法的图像识别模型取得了突破性的成果,各种图像识别任务的准确率记录不断地被刷新。然而,模型在样本采集条件、语义理解、计算复杂度、模型鲁棒性和训练样本不足等方面仍然面临诸多问题和挑战。为了克服上述挑战,本文通过对深度神经网络相关技术进行改进,取得了如下创新性成果:1.针对现有特征池化(聚合)方法容易出现过拟合,导致图像识别模型鲁棒性差的问题,本文提出加权池化特征池化法方法,其首次基于信息熵量化出特征图的各个局部区域的信息量,并使用互信息衡量出每个局部区域中各个特征的重要程度(权重)。实验结果表明,本文提出的池化算法不但可以准确地选取出局部区域的激活代表,而且有效地提高了图像识别模型的准确率和泛化能力,其中模型在CIFAR-10测试集上的准确率比当前经典的特征池化方法提高了约1.81至2.77个百分点。2.当前深度学习模型收敛速度慢、梯度容易消失和陷入局部最优的问题,仍然是基于深度学习技术的图像识别模型训练时要解决的难点之一。本文首次使用多点矩估计法和权值衰减法提出自适应多点矩估计随机优化算法。算法的特点包括:每个矩估计点将模型误差梯度的偏度和峰度进行考查,提高了模型训练时参数更新的效率;权值衰减法的引入,进一步地增强了模型的鲁棒性。MNIST、CIFAR-10等数据集上的实验结果表明,使用本文提出的优化方法训练的图像识别模型无论是收敛速度,还是准确率都有很大提高。其中,在收敛速度方面本文提出的优化方法比基线算法快约3%,测试集上的准确率提高约1.1个百分点。3.针对深度学习模型,一方面需要大量样本进行训练,另一方面存在目标检测模型样本制作代价高昂的问题。本文通过改进像素权重计算的方法,提出一种以无监督的方式将图像分类数据集制作成目标检测数据集的方法,有效地解决了目标检测数据集制作代价高、样本数量和种类不足的问题。此外,当前目标检测模型主要依赖研究人员经验,手工设置检测模型初始边界框的形状和数量,然而,这种方法存在缺少客观依据、适应性差的问题。本文结合给定数据集的特点,首先改进k-means++聚类算法的距离计算方式,然后对训练样本中对象的形状进行聚类分析,得到模型边界框的先验知识,从而有效地提高了模型的检出率和收敛速率,最后,基于这些对象形状的先验分布和前面章节对神经网络所作的改进,提出自适应单网络目标检测模型。实验结果表明本文所提出的实时目标检测模型与其他模型相比,在PASCLE VOC和MS COCO目标检测基准数据集上,模型的准确率分别提高了约0.6和1.5个百分点。综上,本文针对图像识别技术存在的三个关键问题展开研究。在模型组件方面,提出了加权特征池化方法和自适应多点矩估计随机优化算法;在模型方面,提出了自适应单网络目标检测模型。基于公开数据集的实验结果表明,本文所提出的方法在图像识别任务中取得了良好效果,相关理论成果已经在人工智能领域的期刊发表。

其他文献

乙醇对大肠杆菌碱性磷酸酶活性与构象的影响

常用有机试剂乙醇作为效应物对大肠杆菌碱性磷酸酶（EAP）活性影响状态作用机制进行了研究．结果表明，EAP酶活性随着乙醇浓度增大而迅速下降，说明乙醇对EAP有明显的失活作用，IC50为13％．

期刊

大肠杆菌碱性磷酸酶乙醇酶促活性构象

让语文为创业教育增添色彩

对职业学生进行创业教育,培养具有创新、创业能力的高素质人才是全面推进素质教育的一个重大举措。作为文化课,尤其是语文课更要为学生创业增添色彩。 Carrying out entrepr

期刊

语文教育创业色彩

浅谈CAI课件在组织胚胎学上的应用

计算机辅助教学（CAI）课件是在计算机上运行的教学辅助软件，可实现问与答、分步骤演示、灵活查询和仿真教学、模拟实验等功能，具有很好的交互性，现已被广泛应用于现代教育教学领域

期刊

组织胚胎学CAI课件教学应用

医学多媒体课件制作及遵循原则探讨

计算机辅助教学（Computer Assisted Instruetion，CAt）是一门综合计算机科学、教育学、心理学、工程技术以及相关课程专业知识的边缘交叉科学。作为一种先进的现代教学手段，以其直

期刊

多媒体课件制作教学方法医学

丰富与匮乏——山东原创动画发展之悖论

本文以动画片受众调查为基础,对山东原创动画生产的收视环境、居民收看动机、风格样式、未来期待等几个方面展开调查。从调查得来的数据不难看出：一方面山东省作为中华文化发

期刊

原创动画受众题材

同位素吸水剖面测井资料采集影响因素分析

在长期注水开发过程中,长庆油田区域地层低渗透层与大孔道地层共存,吸水剖面测井资料有效采集及解释困难,难以确定分层吸水量。从注水井井筒压力系统出发,分析水流过程中各阶

期刊

吸水剖面测井低渗透层大孔道井筒压力注水层压差同位素粒径测井解释water injection profile logginglow permeab

腹部切口脂肪液化的原因和防治

近年来随着肥胖人群增加及高频电刀的广泛应用,切口脂肪液化的发生有增多的趋势,笔者分析了46例腹部手术后发生脂肪液化的原因,并提出预防和治疗的措施.

期刊

手术后并发症腹部脂肪液化

提高旱地土壤氮肥利用效率的途径和对策

土壤氮素匮缺是影响我国北方旱地农业生产的主要问题,但不尽合理地氮素投入又往往使氮肥利用率不高,不仅造成经济效益下降,也引起环境污染,生态环境条件恶化,提高氮肥利用效

会议

氮素旱地养分协调土壤供氮能力深施早施水分

战俘

序幕字幕：1953年4月，朝鲜战场。阵地的上空是浓密的烟雾，阵地上除了横七竖八的志愿军战士和美军士兵尸体，便是冒着烟的树木和焦土。志愿军战士有的嘴巴还在咬着敌人的耳朵，有的还

期刊

战俘朝鲜战场志愿军阵地战士敌人士兵美军

深度神经网络在图像识别中的研究与应用

其他学术论文