注意力机制在计算机视觉中的应用研究

来源 :南昌大学 | 被引量 : 0次 | 上传用户:iiiii119119
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
目前,随着人工智能的快速发展,基于人工智能的算法被广泛应用在生活中各个方面。其中基于计算机视觉的算法发展尤为迅速。分类与回归问题是计算机视觉中最为常见的两类问题。计算机视觉研究大多围绕这两类问题展开。随着深度学习的发展,越来越多的算法被提出来解决这些问题。其中注意力机制是最近比较热门的一个研究方向,被应用到计算机视觉问题中来解决各种相关问题。本文主要研究注意力机制在计算机视觉中分类和回归两类问题中的应用。针对分类问,我们以人脸表情识别为例进行研究,针对回归问题,我们以人群计数为例进行研究。本文主要内容如下:1,针对表情识别问题,本文设计了一个基于注意力机制并结合LBP特征的卷积神经网络模型。首先LBP特征对面部纹理和皱纹的细微变化能够很好的体现,这有利于帮助网络对细微表情变化的捕捉。我们融合LBP特征和卷积特征来增强关键特征的提取。然后,加入注意力机制,使网络关注表情图片空间内更有利于区分不同表情的关键特征,这可以避免无用特征和背景等无关因素的影响,以此来增加表情识别的准确性。我们为了验证网络的有效性,采集并标注了一个人脸表情数据集NCUFE。我们设计的方法在数据集NCUFE和4个代表性的表情数据集,即JAFFE、CK+、FER2013和Oulu-CASIA数据集上进行了测试。实验结果验证了该方法的可行性和有效性。2,针对人群计数问题,本文设计了一个基于双注意力机制的尺度聚合网络(DASANet)来解决人群图像背景杂乱和尺度变化的问题。为了将注意力集中在人群头部区域,防止复杂的背景干扰,该网络嵌入了两种注意机制,即通道注意机制和空间注意力机制。通道注意力机制主要使网络注意力集中在更有意义的特征所在通道上,空间注意力机制主要对特征空间的不同位置给予不同程度的注意力。为了解决尺度变化问题,我们设计了一个上采样聚合模块,该模块包含两个尺度聚合模块,来适应不同尺度的人头特征。在Shangitech(A、B部分)、UCF_CC_50、World Expo’10、UCSD和UCF_QNRF等6个具有代表性的人群统计数据集上的实验结果表明,与其他最先进的人群统计方法相比,DASANet具有更优越的性能。
其他文献
表面形貌是评价物体表面质量的重要因素,表面粗糙度是表现表面形貌的重要参数,表面粗糙度的检测广泛用于工业零部件的加工制造过程中。现有粗糙度测量方法主要有纳米表面粗糙度分析法、触针式测量法和白光干涉法等,但存在测量环境要求高或者易划伤物体表面等缺陷。共聚焦显微成像粗糙度测量法能够测量表面局部斜率较高的零件,且属于非接触式测量法,在高精度零件表面质量评价中有重要应用。本文研究了基于共聚焦成像的表面形貌测
互联网技术快速发展,网络环境日益复杂多变,网络安全问题愈发严重。而入侵检测作为网络安全防御的有效措施之一,如何提高入侵检测的检测效率成为了广大研究者的研究热点。近年来深度学习在各个领域大放异彩,将深度学习与入侵检测技术结合以提高入侵检测效率为传统入侵检测提供了一个新的思路。本文通过深入了解入侵检测和深度学习相关理论同时结合KDD CUP99数据集的特点,选择将深度信念网络和极限学习机作为本文研究对
随着微显示技术的高速发展,越来越多的厂商开始研发硅基OLED(Organic Light-Emitting Diode on silicon)微显示器。而国内的硅基OLED技术仍不成熟,所以为了提高产品的良品率、优化生产工艺和减少生产成本,在产品生产过程中引入缺陷检测技术。传统的检测技术是依靠人眼进行检测,因受到人的主观意识的影响,无法保证检测标准一致,存在效率低和检测精度低等缺点。而近些年来一门
图像恢复的目的是从退化的观测图像中尽可能恢复出干净的图像。图像恢复问题长期存在,并且是计算机视觉研究的基本问题。然而图像恢复问题的数学表达和图像恢复算法的普适性问题一直没有得到很好的解决,这些问题阻碍着图像恢复的进一步研究和发展。近期深度学习的深入研究和发展为解决图像恢复问题提供了一个很好的解决方案。事实证明,更为强大和全面的先验信息和具有普适性的无监督学习算法将显著提升算法的恢复能力。本文的研究
在这个追求速度的时代,人们的出行方式发生巨变,地铁因为便捷、舒适、平稳等优点,受到人们的热捧。受其影响,地铁热线系统也得到了迅速地发展。南昌地铁热线一期系统已经使用了超过五年,因其所使用的技术比较陈旧以及使用年限长等原因,南昌地铁热线一期出现了不稳定、部分电脑宕机等问题,本系统采用全新先进的开发技术,实现地铁热线系统中工单流转、通知公告发布、客服人员管理等功能。之前的系统使用的是SSM框架,采用的
孤独症谱系障碍(Autism Spectrum Disorder,ASD)是一种起病于发育早期的神经发展紊乱疾病。ASD的早期诊断在ASD的干预中起着至关重要的作用,尤其是对于ASD儿童。通常ASD儿童需要由经验丰富的医生结合各种检查评估进行诊断,但这种方式费时又费力且易受主观因素的影响。因此在本文中,我们探索了两种基于外在特征的孤独症辅助诊断方法。在第一阶段我们围绕采集孤独症儿童视频数据库(Ex
习近平总书记在参加十三届全国人大五次会议内蒙古代表团审议时强调,贯彻新发展理念是新时代我国发展壮大的必由路。2015年1月,习近平总书记考察云南时指出,要在推动产业优化升级上下功夫,在提高创新能力上下功夫,在加快基础设施建设上下功夫,在深化改革开放上下功夫,扎扎实实走出一条创新驱动发展的路子来。2020年1月,习近平总书记再次考察云南时指出,要加快建设现代化经济体系,把握供给侧结构性改革这条
期刊
多模态医学影像可以反映人体不同组织的不同视觉特征,已成为人工智能、生物医学、计算机科学等学科的主要研究对象。基于多模态医学影像的病灶分割可应用于疾病诊断、术前方案、智能医疗和医学大数据分析等研究领域。近年来,随着深度学习算法的快速发展,基于深度神经网络的多模态病灶分割已取得了较大进展。然而,受扫描时间、采集成本等因素的影响,临床上有效的多模态影像数据样本少,因此不利于以数据驱动的人工智能算法在该领
信息化时代互联网正在快速地发展,大多数人都会利用网络来传递信息,与此同时信息的安全问题也受到广泛的关注。数字图像是信息的重要载体,为了保证数字图像信息的安全,对图像进行加密是最有效的方法之一。本文提出了两种基于五维超混沌系统的彩色图像加密方案,具体内容如下:(1)设计了一种结合SHA-256函数和五维超混沌系统的彩色图像加密方案。引用SHA-256函数计算明文图像的哈希值来控制Arnold映射的系
虚拟手术仿真技术可用于低年资医师手术训练,避免在实际手术中出错。然而大多研究者都是针对传统的手术操作开发虚拟手术系统,少有人针对电切割这类新兴手术操作搭建虚拟手术平台。本文针对现有的虚拟手术仿真中存在的问题:(1)模型孔洞问题;(2)手术烟雾仿真计算负担较大;(3)涡粒子烟雾难以施加碰撞边界条件;(4)烟雾与虚拟手术系统结合难,开发了一套包括切割肺组织和电凝肿瘤组织的电切割虚拟手术系统,解决了虚拟