【摘 要】
:
视频结构化是计算机视觉和安防领域研究的重点和热点之一,其能够从海量视频中快速提取目标信息,在实际任务中得到广泛应用。目前视频结构化技术在电力行业安全生产领域违章识别任务中初露锋芒,有效解决了变电站作业违章人工检测困难的问题,进一步加速推进电力行业走向智能化时代。因此,本文旨在利用基于视频结构化的目标识别方法基本理论,搭建快速、高效的识别网络,以实现对变电站场景下多发常规违章的高效识别,进而保证变电
论文部分内容阅读
视频结构化是计算机视觉和安防领域研究的重点和热点之一,其能够从海量视频中快速提取目标信息,在实际任务中得到广泛应用。目前视频结构化技术在电力行业安全生产领域违章识别任务中初露锋芒,有效解决了变电站作业违章人工检测困难的问题,进一步加速推进电力行业走向智能化时代。因此,本文旨在利用基于视频结构化的目标识别方法基本理论,搭建快速、高效的识别网络,以实现对变电站场景下多发常规违章的高效识别,进而保证变电站作业安全。由于变电站场景视野较广,待检测目标体积较小且尺度不均,同时根据其业务需求特点,要求检测系统具有一定的实时性。针对这些问题,本文基于轻量级目标检测模型,重点研究变电站场景较大视野范围下尺度分布不均的目标检测问题。在此基础上,进一步对所提出模型进行压缩,以满足实际业务中实时识别的需求。本文主要工作内容如下:(1)提出一种基于改进差分进化的自适应锚框优化方法,以解决由于数据尺度不均而导致锚框定位不准确,进而造成网络识别精度下降的问题。该方法为了更好地捕获目标物体比例和数量之间的关系,选择边界框的宽高比作为变量,计算Anchor与真实边界框的最近距离的总和作为适应性函数。另外,为了避免Anchor定向朝向具有某种真实框样本的类别,将权重值添加到距离计算中。通过损失函数和可视化散点图对比实验,证实了该方法的有效性。(2)提出一种基于多尺度注意力的目标检测方法,解决由于变电站场景视野范围过大或待检测目标本身尺寸过小造成的网络误检和漏检问题。原始网络为浅层网络结构,对小目标极为不友好。在网络中增加一层检测层,可以有效减小网络输出特征映射在输入图像上的面积,从而增强网络对于目标特征的提取能力,提高目标被检测到的概率。引入注意力机制以增强网络对于小目标的关注度,减少网络对于目标的误检,通过对比不同注意力模型及其在网络中不同位置对于网络整体性能的影响,选择效果最好的注意力模型添加至网络中。最后将两部分改进内容进行融合,利用归一化权重思想适度调整注意力模型相关参数,使整体网络达到了最优的识别效果。(3)利用结构化剪枝方法对内容二中提出的模型进行压缩,以满足变电站场景下实时检测的需求。通过深入研究模型压缩方法特点,使用结构化剪枝方法对复杂的网络模型进行结构化剪枝,以消除冗余通道,降低网络整体计算复杂度。在保证模型识别精度的同时,提高模型的运行速度,使模型具备实时检测的能力。综上所述,本文为实现变电站场景下多发违章的高效检测,提出一种自适应锚框优化方法以及基于多尺度注意力的目标检测方法。此外,为满足其业务需求,通过结构化剪枝,在保证网络识别精度的同时,使其具备了实时检测的能力。
其他文献
随着科技的进步,工业的自动化程度不断提高,其创造的价值也越来越高。但随着设备的大型化,复杂化,一旦发生事故,也会造成严重的财产损失和人身伤亡。因此,利用设备运行的海量数据,在故障发生的初始阶段进行大数据分析,建立高效的智能故障诊断系统,准确的对故障进行智能诊断是非常必要的。随着深度学习技术的飞速发展,因其拥有对数据的利用效率高,分类结果准确等优势,故被广泛的应用于各类设备的故障诊断中。其中,多头注
糖尿病视网膜病变(Diabetic Retinopathy,DR)是常见的糖尿病并发症之一,具有不可逆、致盲性高、进程隐蔽等特点。若不及时治疗,将严重影响患者的生活质量。为解决人工诊断主观性强、效率低等问题,业界提出使用深度学习技术进行DR诊断。调查发现,医学图像涉及隐私和伦理问题通常难以获取,易造成模型过拟合;另外,目前基于深度学习的DR诊断仍以卷积神经网络为主,无法有效提取眼底图像细节特征,诊
车间生产调度是智能制造领域中的重要问题,优化调度可以提高生产效率,减少资源浪费。在实际生产过程中,往往因不确定因素导致调度的不确定。同时,在当前全球合作化生产模式的背景下,对分布式流水车间调度问题的研究更具有现实意义。此类不确定环境下分布式流水车间调度问题的复杂度高,现有的智能算法难以求解出理想的调度方案。本文提出不同的混合策略来改进智能算法,设计混合智能算法来解决不确定环境下分布式流水车间调度问
随着大数据时代的到来,云平台备受青睐。然而,云平台在为海量数据提供强大的存储、计算等服务的同时,也面临着严重的数据安全和用户隐私问题。为保护云数据的安全,用户上传的通常是加密后的数据。因此,如何对密文数据进行高效检索成为了巨大挑战。可搜索公钥加密技术为解决云平台中的密文数据检索问题提供了有效的方法。目前,已有许多可搜索公钥加密方案被提出。然而,现有方案多数存在证书管理或密钥托管问题,同时在安全性或
广播式自动相关监视(Automatic Dependent Surveillance-Broadcast,ADS-B)技术是新一代航行系统中非常重要的通信和监视技术,有助于空中交通管制员和飞行机组实时共享空中交通运行态势,提升航空安全运行水平、空域容量与运行效率。然而由于外界不确定因素,易造成机场航班ADS-B信号丢失,严重影响航空飞行安全。针对这种现象,本文基于深度学习目标检测网络模型和图像目标
联邦学习是在不共享客户端数据前提下,通过所有客户端与服务器之间的多次交互建立联邦模型的机器学习方法。由于联邦学习支持客户端在不交换原始数据的条件下联合训练模型,因此成为图像分类领域的研究热点。本文主要针对现有集中式联邦学习存在的问题展开研究,主要研究内容如下:1、针对集中式联邦学习所存在的客户端模型精度低和通信成本高的问题,提出基于模型参数异步更新的个性化联邦学习方法。引入距离度量函数,建立共性个
基于单相机的近景工业摄影测量技术是一种非接触式测量方法,其利用单相机对空间中三维物体的多个位姿进行拍摄,进而通过数字图像处理和摄影测量技术,计算出待测物体表面关键特征点的三维坐标。本文从以下几个方面开展单目移动式三维测量技术的研究。由于工业场景中物体的特征点直接检测效果不佳,需要借助一种具有唯一身份信息的编码标记点,通过将标记点粘贴在待测三维物体关键特征点上,来实现物体关键特征点的匹配。针对此问题
随着我国制造业的飞速发展,对于工件所需复合功能非常突出,导致工件轮廓外形愈发复杂加工精度要求更高。在工件质量检测中,传统的工件轮廓测量方式效率低、成本高,而常规的基于图像的测量方法又存在测量精度低和稳定性差等问题,如何对工件轮廓进行快速、高精度测量就成为高质量加工的瓶颈问题。本文采用基于机器视觉的摄影几何尺寸测量技术对工件双轮廓外形线间距离和夹角的精密检测展开了研究,包括角点与边缘提取、亚像素定位
小麦,作为世界第二大粮食作物,不仅含有丰富的营养物质,且为人们赖以生存的基本物质和工业原料,其品质问题关乎国际民生。在小麦收购与市场流通环节,不完善粒是品质定级的限制指标,且是增扣量的依据。在各大粮库、加工厂及质检中心,不完善粒检测仍主要为人工检测,极易出现定级误差、串通舞弊、制约收购进度等问题。在计算机视觉方法中,通常依赖昂贵的图像采集、分离设备,且传统机器视觉方法识别率较低,无法满足品质的准确
软件缺陷修复是软件工程领域的关键问题,是软件测试与维护中耗费成本最高的活动。软件缺陷自动修复技术能够有效降低缺陷修复的成本,是近年来学术研究的热点问题。本文研究基于深度学习的软件缺陷自动修复技术,将基于深度学习的机器翻译技术即神经机器翻译技术应用于软件缺陷自动修复问题中,通过端到端补丁生成模型自动生成候选补丁。这类软件缺陷自动修复技术的研究工作少之又少,且普遍修复缺陷成功率和效率较低。针对上述问题