【摘 要】
:
随着视频监控应用的普及和计算机科学与技术的快速发展,计算机视觉技术得到了广泛的应用。基于视觉的目标检测技术是计算机视觉领域中非常重要的一部分,许多更高层次的视觉处
论文部分内容阅读
随着视频监控应用的普及和计算机科学与技术的快速发展,计算机视觉技术得到了广泛的应用。基于视觉的目标检测技术是计算机视觉领域中非常重要的一部分,许多更高层次的视觉处理和分析任务也是以此为基础。目标检测技术被广泛应用于人脸识别、智能驾驶等领域。传统的目标检测算法基于人工提取特征,准确率容易受采集条件等因素影响,且效率低、泛化性弱。近年来基于深度学习的目标检测算法在检测准确率上远远领先传统目标检测算法,背靠大数据自动学习提取特征,效果远优于人工设计特征。虽然深度学习在许多方面都远超传统算法,但是其缺点也非常明显,需要大量的训练数据,模型参数量大,运算速度慢,对硬件要求极高。由于这些原因,深度学习算法很难做到实时,很难应用到嵌入式或小型设备中。本文研究在保证准确率的前提下,加快基于深度学习的目标检测算法的检测速度。本文具体工作内容如下:首先,详细介绍了主流CNN网络模型,分析对比了流行的基于深度学习的目标检测算法的模型结构及其它们的优劣势。然后,借鉴流行的one-stage方法,设计了直接对目标进行分类和位置回归的端到端网络模型。并使用Tensor Flow平台训练网络,使得网络的m AP达到0.713,检测速度在GTX 1080上达到32.4FPS。最后,在设计的卷积神经网络的基础上,用提取特征能力更强的Res Net网络替换VGG基网络,提升了模型检测准确率。使用K-means++方法对数据集目标框的长宽比进行聚类,然后对网络的锚框进行改进,提升了网络的检测速度。接着使用分离卷积对网络模型进行压缩,使用卷积分离的残差块重构基网络,使得网络的参数量和计算量下降到原来的1/8~1/9,网络的m AP达到0.727,检测速度达到47FPS。实验结果表明,本文对加快深度神经网络的计算速度,增强其实时性有一定的价值。
其他文献
随着计算机网络技术的普及和Web技术的广泛应用,“信息孤岛”问题日渐突出,如何集成交换来自不同部门、不同平台的数据成为目前信息交换中重要的研究课题之一。XML以其结构性、
人们用手势动作来表达思想,感知客观世界,完成各种操作。数据手套就是测量人手空间姿态的现实硬件,同时也是虚拟现实系统中的非常重要的设备,它可以跟踪手势动作,测量手指姿态信息
随着科学的迅猛发展,控制系统越来越复杂,控制精度的要求越来越高,需要尽可能建立控制系统更为精确的数学模型,所以研究非线性系统辨识意义深远。本论文的研究对象为哈尔滨工程大
被誉为第四代多媒体技术浪潮的三维信息技术,包括三维数字模型和三维场景技术,正在逐步成为影响人类生活、工作和娱乐的主流媒体技术。随着网络技术的广泛推广与运用以及三维建
随着人民收入的不断提高,长途的旅行成为假日里越来越流行的休闲活动。客运行业的服务也随之日益完善。目前,在很多的交通工具上都装备了多媒体设施,乘客可以在座位上收看主
随着计算机和Internet的推广应用,由数据处理、信息处理发展到知识处理,对语言文字处理要求的深度和广度越来越高。汉语句法分析是中文信息处理领域内的一个重要课题,它的发
感应加热电源以其高效、节能、环保、安全等特点广泛应用于工业中,感应加热电源控制系统的性能将直接影响工业生产的安全性与设备输出功率的大小。通过对感应加热电源控制技术的研究,研发具有良好控制性能的感应加热电源将会对工业生产起着积极的推动作用。首先,文章从理论上分析了感应加热的原理,通过对感应加热电源不同的拓扑结构与调功方式的分析对比,确立了感应加热电源采用串联负载拓扑结构与扫频调功方式。其次,通过在串
智能体可以理解为一种物理的或者虚拟的自我独立的单元,其内部封装了必要的应用知识并可以以一种智能的方式与它所处的环境和其它智能体进行信息交流;具有对外界环境做出响应及
小企业信用风险评估是商业银行业务经营的一个重要环节,是进行信贷决策的一个重要依据。在实际的信贷过程中,影响企业信用的因素很多,各种因素与信用之间的关联度不同,多为非线性
足球机器人涉及到多学科、多领域,为研究多智能体系统、人工智能等理论提供一个很好的研究平台,引起了越来越多的科研机构和大专院校的关注,也吸引了越来越多的科研人员和学