基于深度学习的行人检测与行为识别研究

来源 :中国科学技术大学 | 被引量 : 0次 | 上传用户:jieean
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
行人检测是计算机视觉领域中一个具有挑战性的问题,也是许多视觉应用的先决任务,例如自动驾驶、视觉监控和机器人技术等。在过去的十年中,行人检测引起了广泛的研究兴趣,并取得了长足的进步。特别是最近几年,得益于深度卷积神经网络的发展,通用目标检测领域取得了重大进步。受此驱动,行人检测也得到了迅速发展。基于深度卷积网络的通用目标检测模型被不断扩展应用到行人检测领域,并取得了良好的性能。对于行人检测任务,本文提出了一种基于特征感受野增强的网络模型结构。当前基于深度学习的行人检测模型大多采用分而治之的策略来解决行人检测中的尺度变化问题。在检测时,每一个特征层的感受野大小是固定的,无法适应实际情况中行人尺度的连续变化;而且这些检测模型大多采用图像分类中的骨干网络作为特征提取器,这些骨干网络仅仅具有方形的感受野,与行人的宽高比之间也存在着严重的不匹配;这些因素影响着行人检测模型的性能。针对上述问题,本文提出了一种基于特征感受野增强的网络模型作为解决方案。该方案利用感受野增强模块多样化从骨干网络中提取的特征的感受野,以提供合适的感受野与行人的尺度大小相匹配,并利用多层次聚合模块进一步聚合多尺度特征层,即融合不同尺度下的感受野,从而得到融合的特征金字塔来帮助后续的行人检测。通过上述模块的变换,模型提取的特征对行人的尺度变化具有更好的鲁棒性。为了验证本文所提出的方法的有效性,在CityPersons和Caltech等基准数据集上进行了一系列对比实验。实验结果表明,本文所提出的特征增强模块对行人检测的性能具有明显的提升作用,在不同的数据集上都取得了目前较好的检测效果。此外,在行人检测任务的基础上,为了对行人的运动信息进行更好地理解,本文还对人体行为识别问题进行了相关研究,设计并实现了基于双流结构的行为识别模型。该模型由二维卷积网络、三维卷积网络、特征通道融合和注意力机制以及解耦的检测器四个子模块组成。在行为识别模型中,通过基于二维卷积网络和三维卷积网络的双流网络结构,分别提取视频中的静态外观特征和时间上下文的运动信息。在检测器模块中,通过引入解耦分类和回归任务的思想,以保证分类和回归任务能够学到针对各自任务有用的特征信息。
其他文献
文章对某自动变速箱油泵异响现象进行了描述,并对油泵异响故障进行了原因分析,介绍了问题分析的过程和方法,找到了某自动变速箱油泵异响的根本原因,解决了该自动变速箱油泵异
现代农业的发展模式对农村金融创新以及农村产权制度革新都提出了新要求。近年来各地开展的农村产权融资实践以及2015年底全国人大授权国务院在我国部分地区开展的农村"两权"
针对弱势学科文献资源保障及其服务体系构建面临的挑战,在介绍纺织史基础上,以东华大学纺织学院和服装&艺术设计学院2004—2014年博士开题查新中纺织史研究为案例,分析了纺织
<正>世上唯一的新事,就是你所不知道的历史。——[美]哈里·S·杜鲁门引言进入"大数据"时代后,传统司法统计体系无论是在理论研究领域还是在法律实务领域都广遭诟病。本具有
会议
<正>新生儿红臀是新生儿臀部皮肤受到刺激伴随的一类肛周或者会阴部皮肤发红抑或皮肤糜烂的症状,该症状频发于病理性黄疸新生儿、喂养不耐受及尿布皮炎患儿。观察我院应用聚
购买诱因包括慈善购买诱因和金钱购买诱因,二者都作为重要的促销手段被广泛使用。随着消费者认知水平的增强和对企业社会责任要求的提高,比起传统的金钱购买诱因,慈善购买诱
随着社会经济的发展、人们保健意识的增强,定期体检的人群越来越多,医疗机构健康体检中心进入了承担越来越重要责任的新时期。如何尽快适应新形势、转换新角色,本文着眼于目
在企业进行综合财务评价的过程中,如何选取恰当的财务比率指标是评价活动的基础,也是关键问题之一.目前企业选取财务比率指标的过程中依然存在问题,为此,系统分析传统财务比
随着社会经济和建造水平的迅速发展,城市中的高层建筑群已经屡见不鲜。它们极大地缓解了土地资源压力,改善了工作生活环境,是现代化城市建设发展的中坚力量。实际上,建设高层建筑群并不仅仅是数量上的叠加,更要充分考虑建筑物的相互影响,尤其是对水平风压的影响。与单体建筑相比,群体建筑的风场环境更加复杂,表面风压的分布规律变化很大,因此需要对建筑群进行更深入的研究分析。本文基于FLUENT软件,对由四幢高层建筑
普达措国家公园是中国大陆第一个国家公园。以该国家公园二期规划区域为对象,在划分自然旅游资源类型的基础上,采用定性与定量相结合的评价方法对自然旅游资源的质量等级和特