【摘 要】
:
目标检测算法作为计算机视觉领域的基本任务之一,近几十年来得到了广大学者的广泛研究,产生了一系列优秀的研究成果。图像目标检测任务在过去几年间取得了巨大的进展,检测性能得到明显提升。但在视频监控、车辆辅助驾驶等领域,基于视频的目标检测有着更为广泛的需求。由于视频中存在运动模糊,遮挡,形态变化多样性,光照变化多样性等问题,仅利用图像目标检测技术检测视频中的目标并不能得到很好的检测结果。如何利用视频中目标
论文部分内容阅读
目标检测算法作为计算机视觉领域的基本任务之一,近几十年来得到了广大学者的广泛研究,产生了一系列优秀的研究成果。图像目标检测任务在过去几年间取得了巨大的进展,检测性能得到明显提升。但在视频监控、车辆辅助驾驶等领域,基于视频的目标检测有着更为广泛的需求。由于视频中存在运动模糊,遮挡,形态变化多样性,光照变化多样性等问题,仅利用图像目标检测技术检测视频中的目标并不能得到很好的检测结果。如何利用视频中目标时序信息和上下文等信息成为提升视频目标检测性能的关键。现有视频目标检测技术通常存在运行缓慢、漏检率高、准确率低的问题。本论文将可分离卷积、残差与金字塔结构、注意力机制、进化算法、模型剪枝算法改进并应用于视频目标检测任务中,以提高视频目标检测模型的检测精度及运行速度,从而促进视频目标检测技术的发展。本文的研究内容如下:1.针对小目标检测困难、模型计算复杂度高的问题提出了一种基于多尺度融合与残差金字塔网络视频目标检测算法,称之为MRDS-FPN。本方法首先引入可分离卷积减少参数量和计算复杂度,利用堆叠可分离卷积残差结构以提取基本特征,设计特征金字塔的结构方式融合网络的多尺度特征,增强特征表达能力,利用特征提取子网络结合光流网络以提取图像信息和其运动信息,并与R-FCN检测子网结合来实现视频目标检测任务。本方法通过网络结构的设计有效地解决了视频目标检测技术中的两大难题。使用数据增强后的Image Net VID数据集进行实验,并与其他最新的视频目标检测算法进行对比。实验结果证明了本方法从网络结构的设计角度出发解决视频目标检测问题的有效性。目前该算法存在的问题是需要进一步改进网络结构的设计,在优化检测速度的同时进一步提高检测精度。2.针对视频目标检测数据集中存在大量的运动模糊,遮挡,形态变化多样性等问题,提出了一种基于注意力机制和加权残差金字塔网络的视频目标检测方法,称之为AWR-FPN,在降低模型计算量的同时提高网络的特征表达能力。该方法在多尺度融合残差金字塔网络MRDS-FPN的基础上,在特征提取阶段引入选择注意力机制。得益于残差结构和较深的网络层数,残差网络能较好地专注于目标类别所在的特征图区域,在此基础上,引入通道注意力模块对特征通道之间的相互关系进行建模,通道注意力的作用使得分类网络能更好地区分无关特征,抑制影响分类结果的其他信息。通过对特征图中不同通道赋予不同权值来进行通道选择,抑制背景信息,增强前景信息,达到精修特征的目的,进而提高整体检测精度。在检测算法中,选用分类特征更加精确的特征提取网络将有助于之后的分类及回归预测。最后使用数据增强后的Image Net VID数据集进行实验,并与其他最新的视频目标检测算法进行对比。实验结果证明了本方法从网络结构的设计角度出发解决视频目标检测问题的有效性。目前该算法需要精简网络结构,以提高模型的检测速度,提高实时性。3.针对视频目标检测算法运行缓慢的问题,提出了一种基于注意力机制和进化剪枝卷积网的视频目标检测方法。该方法提出一种全新的基于进化算法的剪枝方案,并将其应用于第三章构造的AWR-FPN网络,通过进化剪枝算法去除网络中冗余的滤波器,从而实现卷积神经网络加速。通过对训练后的注意力加权残差金字塔网络使用剪枝算法去除网络中存在的大量冗余的卷积滤波器,减少网络的过拟合风险,大幅精简网络结构,更少的参数量使其更易部署在嵌入式设备中,同时使得推理速度显著加快。使用进化算法优化剪枝方案,将待剪枝的滤波器进行联合编码,灵活性强,且充分利用滤波器之间的关联性,在加速网络的同时提高网络性能。最后在数据增强后的Image Net VID数据集上和对比方法进行详尽对比以验证方法的有效性,同时将本方法申请的国家发明专利。该算法还需解决的问题是如何优化网络的训练。
其他文献
随着社会的发展,化妆品已经成为人们的日常用品。然而,涉及化妆品质量的各类违法违规行为复杂隐蔽,对公民的生命健康安全形成了巨大的威胁。随着互联网经济的迅猛发展,这一问题愈加严重。因此,化妆品监管作为市场经济下现代政府的一项基本职能,亟待引起足够的重视和开展深入的研究。在公共管理情境中,政府对化妆品进行监管的主要目的之一就是为了对公众进行安全警示,引导其安全消费,从而保障公众的人身安全。行为公共管理学
对硝基苯酚是广泛存在于水体中的一种高毒性有机污染物,在水环境中微量的存在就会对生态系统和人体健康构成潜在威胁。目前,传统的对硝基苯酚检测方法存在诸多不足,难以满足快速、简便和高选择性的检测需求。分子印迹电化学传感器兼备了分子印迹聚合物与电化学传感器的优势,具有选择性强和操作简便等特点,是一种具有广阔发展前景的痕量有机污染物检测技术。针对检测对硝基苯酚的分子印迹电化学传感器制备过程繁琐、成本高、灵敏
图像在采集、压缩、传输和存储的过程中都可能会引入不同种类不同程度的失真,它们会对信息处理、分析和表达带来阻碍,也影响人们正确认识客观世界。因此,需要设计合理且可靠的图像质量评价算法来预测图像质量,从而更加方便地引导视觉信息处理系统的优化、改进和提高。图像质量评价已成为热点研究问题,在计算机视觉、模式识别和人工智能等领域具有广泛的应用。本文旨在针对自然场景的无参考图像质量评价任务中的场景复杂、可用数
世界正处于百年未有之大变局中,机遇与危机并存,以习近平同志为核心的党中央为了实现中国的可持续发展,在对中国与世界的关系进行了深入思考之后,在坚持马克思主义的指导下,提出了人类命运共同体思想。人类命运共同体思想是在马克思世界历史思想的基础上,结合人类社会发展规律和当代世界历史发展的新特点提出的。人类命运共同体思想的主旨是在追求本国利益的同时兼顾对其他国家的合理关切,在谋求本国可持续发展的同时促进世界
经济全球化及互联网技术的高速发展,使我们的生活发生了翻天覆地的变化,带来便利的同时也带来了环境污染、资源过度开发等问题。在今天,这些问题带来的不良影响日益凸显,并且已经对人们的日常生活造成了不可磨灭的影响。而企业作为微观经济的主体,其产品与服务的生产和交换都以不同的方式对环境产生了负外部效应,尤其重点排污企业,作为环境污染物的主要排放源,迫切需要调整资源结构,完善环保制度。而环境管理在赢得社会各界
鸭大肠杆菌感染是鸭只个体被致病性大肠杆菌部分或全身感染的疾病。鸭规模化饲养过程中,由大肠杆菌感染致死造成的损失较为常见,鸭大肠杆菌病的病理特征多样、临床症状复杂、
随着经济的快速发展,人们的生活节奏不断加快,因各种不良生活习惯所引发的疾病发病率也随之增高,然而由于实际医疗资源的有限性和疾病诊断过程的复杂性,现有的医疗条件难以满足日益增长的就诊需求;此外,医疗信息化技术的发展也使医疗机构积累了大量的医疗数据;因此,研究利用现有医疗数据服务于临床,对减轻医务工作者负担、提高工作效率具有重要意义。本文研究利用机器学习算法构建疾病诊断模型,为实际疾病诊断提供有力参考
当今世界能源局势主要面临能源短缺和环境污染的问题,而汽车行业作为重工业中的砥柱,对能源的消耗及环境的污染不可小觑,然而,电动车等新型能源汽车在短时间内不可能取代传统燃油汽车的使用,因此对目前燃油车的行业现状进行改善是迫在眉睫的。于是本文利用甲烷代表天然气、异辛烷代表汽油,使用Chemkin-Pro仿真软件,通过数值模拟研究,探究甲烷-异辛烷混合燃料的层流燃烧特性。本文将甲烷与异辛烷按照甲烷成分为0
营销实践范式从传统营销向关系营销转变,在以消费者为中心的理念下,注重与消费者互动、深入发掘消费者价值的品牌社群成为近年来营销界的热门现象。品牌社群是由企业与共同关注特定品牌的消费者聚集、参与、彼此互动而形成的关系集合体,在网络日渐渗入日常生活的现代社会,以线上社交媒体为平台建立的虚拟品牌社群更是蕴藏着巨大的发展潜力与营销价值。同时,理论界也开始重视对虚拟品牌社群的研究,以往文献着重于对虚拟品牌社群
目前世界上最先进的采煤工艺是综合机械化采煤,简称"综采"。其先进在于"破、装、运、支、处"等主要环节全部实现了机械化,中间环节大大减少了人力的参与。本文通过分析综采工