论文部分内容阅读
随着5G技术的逐渐成熟,以5G为基础的物联网时代已经到来,云计算与边缘计算将共同加速物联网与人工智能技术的融合发展。相应的信息社会、智慧城市的建设要求在发现社会安全隐患、打击非法犯罪等方面更加智能化、精准化、高效化。越来越多的安全监控设备产生了海量的图像和视频数据,如何能够通过人工智能技术高效、精准、智能地处理海量数据仍是一个充满挑战性的研究方向。本文针对密集人群场景下的人脸检测与人群计数任务,提出了适用于边缘计算设备的轻量级卷积神经网络算法,并通过实验证明了算法在保持高效性和低时延的同时,有着卓越的检测精度。针对边缘终端算力受限,难以部署复杂结构的人脸检测算法的问题,为减少资源消耗,并保证多尺度变化的人脸和人群特征、遮挡、模糊、光照等复杂场景下的检测精度,本文提出了多尺度感知的轻量化人脸检测算法(Scale-aware Dual Path Network,SDPN)。将改进的人脸残差神经网络Face-ResNet作为特征提取网络,并提出双分支浅层特征提取模块(Dual Path Shallow Feature Extractor,DPE),通过并行分支理解图像多尺度信息,进而由深浅特征融合模块将底层图像信息与高层语义特征融合,配合多尺度感知的训练策略监督多分支学习差异化特征。实验结果表明,所提算法可有效提取多样化的特征,在保持推理高效性和低时延的同时,有效提升了算法的精度和稳健性。更进一步,本文提出针对人群计数任务的算法SA-SDPN(Separable Attention Scale-aware Dual Path Network)。将密集场景下人脸检测网络的设计思想和核心理念与人群计数任务相结合,将人脸残差网络作为主干特征网络应用于人群计数任务中。以此为基础,在人群计数任务中引入空洞卷积使网络深层能够在保留丰富空间特征信息的同时获得更广范围的稀疏与稠密特征。引入空间维度和通道层可分离的注意力机制层,显式地优化了网络局部与全局的关联性特征表达。本章提出的人群计数网络在概率密度图生成、数据预处理、网络设计思路方面基于 MCNN(Multi-column Convolutional Neural Network)框架进行了改进。在本章的实验阶段进行了充分的子模块对比试验证明了改进的有效性,并与其他主流人群计数网络进行了对比试验,在Shanghai Tech数据集上证明了所提出算法相对其他算法的优越性。