论文部分内容阅读
随着公共交通和物流吞吐量的剧增,特别是在节假日期间人员流动量非常大,给人工安检带来了巨大的挑战。利用计算机视觉算法辅助人工安检可以提高安检效率,当前基于计算机视觉技术的违禁品检测算法主要是基于图像分类和目标检测的,无法获取违禁品的轮廓信息,并且还存在违禁品边缘模糊、重叠、以及尺度不一的问题。为了解决这些问题,本文提出了一种基于深度学习的X射线安检图像违禁品分割算法,可以得到违禁品的轮廓信息,从而更有效的辅助人工安检。本文的主要工作及创新点如下:(1)根据X射线安检图像的特性,提出了一种自适应图像拼接的数据增强方法。通过把多个图像拼接在一起,即将多张单件行李的图像生成含有多件行李的图像,以此来模拟不同的场景,以提升模型的泛化性。(2)设计了一种适用于违禁品分割任务的编码解码结构的网络。采用融合了通道注意力机制、分组卷积和残差结构的编码器网络,以充分提取对违禁品识别有用的特征。设计实现了一个全局多尺度上下文中心层模块,以丰富编码器网络提取的特征。设计实现了一种多层级融合的解码器模块,以获取更丰富的多尺度信息。(3)设计了一个适用于违禁品分割任务的多任务损失函数,通过引入了分割标注以外的最小外接矩形标注和边缘标注作为辅助监督,增强了网络对违禁品形状的学习,以解决违禁品周围背景复杂时边界模糊的问题。采用了带权重的二分类交叉熵损失和Dice损失作为损失函数,以解决X射线安检图像中违禁品所占前景和背景之间样本不均衡的问题。此外,本文进行了一系列对比实验和消融实验,实验结果表明该算法在违禁品分割数据集上取得了 71.06%mIoU的最优的性能,证明本文提出的X射线安检图像违禁品分割算法是有效的。最后,本文还设计并实现了一个基于此算法的网页原型系统。通过大规模的测试数据进行系统的实时性和稳定性评估,测试结果显示,我们设计的系统具有良好的实时性和稳定性。