论文部分内容阅读
近年来,视频监控系统随着城市交通信息化的发展,使得车型识别在无人驾驶、社会治安、智能交通等方面具有广泛的应用前景。目前大部分监控视频图像的车型识别需要将海量视频数据上传本地服务器中心,而且仅对部分视频流图像进行了结构化车型识别,同时也造成服务器中心数据压力过大、计算任务重以及对服务器性能要求高等问题。因此,在系统前端实现频数据结构化处理对解决服务器中心压力具有关键性意义。
本文提出一种基于机器学习的Cortex-M视频结构化车型识别的方法。该识别方法首先利用PC训练机对自定义数据集采用改进的AlexNet模型进行训练,获取的权值矩阵采用便于系统前端调用的.h文件的形式进行保存;系统前端采用功耗低、稳定可靠的Cortex-M7系列的STM32F767IGT6开发板,首先提取视频的背景图像,通过背景差分的方法实现对运动目标的检测;接着前端采用内嵌的CMSIS-NN网络函数库搭建与PC训练机相同的模型结构,实现对监控视频结构化车型识别,并仅将识别结果信息上传,解决服务器中心压力同时,有助于交通管理部门对路况信息以及车流量信息的统计。主要研究工作如下:
(1)建立了适用于多种监控场景的交通卡口车辆图像实验数据集。基于BIT-Vehicle Dataset数据集基础上,再结合某市交通管理部门提供的车辆数据,从旋转、光照以及遮挡物等不同因素中挑选出合适的车辆图片来扩充数据,保证了数据多样性。通过对数据集训练可知,车型数据多样性以及真实性提高了车型权值矩阵的质量,为下一步的车型识别提供了重要的基础。
(2)搭建了一种改进的AlexNet模型训练获取车型权值矩阵。结合深度可分离卷积思想优化经典的AlexNet模型对建立的交通卡口车辆图像实验数据集进行训练获取车型权值矩阵。训练结果表明,相比于其他的模型,车型的识别精确度获得很大的提高,并且矩阵文件大小接近于经典模型的1/10,更适于移植到Cortex-M7微控制器上。
(3)基于Cortex-M7微控制器通过CMSIS-NN网络函数库搭建改进的模型结构实现了对监控视频结构化车型识别。前端STM32F767IGT6开发板采用设计封装的图像函数库对视频图像进行了结构化处理,同时通过搭建深度可分离卷积思想优化的AlexNet网络模型实现车型识别,并只将获取的车型信息上传,有效的解决了大量视频上传造成后台服务器压力过大的问题。实验数据证明,基于机器学习的Cortex-M视频结构化车型识别的研究方法是可行的。
本文提出一种基于机器学习的Cortex-M视频结构化车型识别的方法。该识别方法首先利用PC训练机对自定义数据集采用改进的AlexNet模型进行训练,获取的权值矩阵采用便于系统前端调用的.h文件的形式进行保存;系统前端采用功耗低、稳定可靠的Cortex-M7系列的STM32F767IGT6开发板,首先提取视频的背景图像,通过背景差分的方法实现对运动目标的检测;接着前端采用内嵌的CMSIS-NN网络函数库搭建与PC训练机相同的模型结构,实现对监控视频结构化车型识别,并仅将识别结果信息上传,解决服务器中心压力同时,有助于交通管理部门对路况信息以及车流量信息的统计。主要研究工作如下:
(1)建立了适用于多种监控场景的交通卡口车辆图像实验数据集。基于BIT-Vehicle Dataset数据集基础上,再结合某市交通管理部门提供的车辆数据,从旋转、光照以及遮挡物等不同因素中挑选出合适的车辆图片来扩充数据,保证了数据多样性。通过对数据集训练可知,车型数据多样性以及真实性提高了车型权值矩阵的质量,为下一步的车型识别提供了重要的基础。
(2)搭建了一种改进的AlexNet模型训练获取车型权值矩阵。结合深度可分离卷积思想优化经典的AlexNet模型对建立的交通卡口车辆图像实验数据集进行训练获取车型权值矩阵。训练结果表明,相比于其他的模型,车型的识别精确度获得很大的提高,并且矩阵文件大小接近于经典模型的1/10,更适于移植到Cortex-M7微控制器上。
(3)基于Cortex-M7微控制器通过CMSIS-NN网络函数库搭建改进的模型结构实现了对监控视频结构化车型识别。前端STM32F767IGT6开发板采用设计封装的图像函数库对视频图像进行了结构化处理,同时通过搭建深度可分离卷积思想优化的AlexNet网络模型实现车型识别,并只将获取的车型信息上传,有效的解决了大量视频上传造成后台服务器压力过大的问题。实验数据证明,基于机器学习的Cortex-M视频结构化车型识别的研究方法是可行的。