论文部分内容阅读
视频监控是社会治安、防恐维稳、安全生产和保障民生的一个重要应用技术领域。随着图像处理技术的日益发展,数字化、智能化的视频监控系统已经趋于成熟并广泛应用。通过对原始视频进行智能分析并提取关键信息的视频结构化处理技术,在视频监控领域取得了较好的实用效果。目前主流的视频结构化处理方案大多采用高性能GPU运行计算,但平台架设成本较高,特别是对于老旧视频监控系统的设备更新、性能提升,需要很大资金投入。鉴于此,在不更换原有视频监控设备的前提下,提出了一种低成本的嵌入式视频结构化处理系统,即通过视频传输接口与现有监控设备连接,对监控中的视频流在嵌入式芯片中进行结构化处理。本文针对这种嵌入式结构化处理系统的视频转换环节和视频识别环节,进行相关算法与技术研究。对于视频转换环节,本文研究监控显示器常用的VGA和HDMI接口到嵌入式视频输入协议BT.1120之间的转换。首先从VGA接口的颜色空间和信号时序同步两个方面研究并实现了VGA接口到BT.1120协议的视频转换。然后根据HDMI接口信号的组成结构,从HDMI数据周期角度,研究了HDMI接口信号到BT.1120传输协议间的转换。根据分辨率和功能需求,进行以TVP7002和ADV7610分别为VGA和HDMI转换核心的视频转换单元设计。对于视频识别环节,研究了传统目标检测算法和基于卷积神经网络的目标检测算法的成像原理,分析了传统算法的缺点,并根据主流卷积神经网络的算法对比和嵌入式平台计算资源局限的特点,选择了精度与实时性兼备的YOLOv3-Tiny算法为基础网络。针对VIDF数据集中的目标特点,提出了一种基于k-means聚类算法的初始化方案,计算出了适合此数据集中目标的预设候选框数量和尺寸。针对YOLOv3-Tiny算法在小目标特征提取上的缺陷,通过增加设计的卷积结构和提高上采样层数的方式,提高算法对目标细节特征的提取能力,同时增加NIN卷积层,以降低运算复杂度和网络架构加深导致的过拟合。实验结果表明,改进之后的算法可以在满足目标检测实时性的前提下,提高YOLOv3-Tiny算法的准确度。将视频转换环节与视频识别环节在Hi3519A嵌入式平台中实现。通过Hi3519A视频输入端口打印信息验证和实验设备检验的方式,验证视频转换单元的可行性实现过程。在视频识别方面,将YOLOv3-Tiny算法的Darknet框架转换为Caffe框架并移植到Hi3519A嵌入式平台中,通过实际推理结果验证了改进YOLOv3-Tiny算法在检测效果上的提升。