基于多层特征融合的目标检测

来源 :华南理工大学 | 被引量 : 0次 | 上传用户:laojiawolai
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
目标检测可能会用到图像处理、模式识别、机器学习等技术,能够对图像或者视频中的物体进行定位和识别,是计算机视觉领域的基础性支撑任务。很多传统的目标检测算法仅适用于简单场景,最新的基于深度卷积神经网络的目标检测算法能利用网络的强大特征提取和抽象表达能力获得更为优异的检测结果,从而满足复杂场景下的处理需求。本文在深入分析国内外目标检测算法的基础上对Faster R-CNN算法进行三个方面的改进,并在PASCAL VOC数据集上验证了算法的可行性,具体改进措施和实验结果如下:(1)优化特征融合方式。对Faster R-CNN算法中特征提取网络和候选区域生成网络的结构和性质进行系统地研究。根据网络结构和数据特点,采用多层特征融合方式提取候选区域。相较原始算法该改进能够将目标检测的准确率提升2.8%,从而验证该方法的有效性。(2)改进候选框筛选机制。通过一个混合的非极大抑制算法筛选和抑制候选区域,以改善Faster R-CNN算法中候选区域生成网络所输出的候选区域质量低、只采用分类分数而没有考虑定位置信度等问题。实验结果表明相比于非极大值抑制算法,采用混合非极大值抑制算法能够将算法准确率提高0.6%。(3)引入超分辨率分析技术,提高对小目标或模糊目标的检测能力。通过基于亚像素卷积的目标检测网络,对分类后的区域有选择地进行超分辨率优化,从而提高由于图像中目标尺寸过小或目标图像区域模糊而难以检测的目标的检测准确率。实验结果表明,改进后的算法达到了81.3%的准确率。
其他文献
引进SIEMENS的SIGMASYS技术 ,研制开发了适应中国市场需求的西格玛系统的中文显示系统。它主要包括 :(1)数据采集接口 ;(2 )绘图软件包 ;(3)实时处理和操作系统。数据接口实现与报警控制器及计算机的双重通讯 ,同时实现一些如筛选、应答等简单的功能 ;绘图软件主要是绘制楼层平面图消防设施的具体标识符号和各房间的门牌号码 ;实时处理和操作系统实现数据通讯 ,实时处理火灾报警 ,显示设
自2009年《食品安全法》颁布至今,我国农村地区的食品安全事件依旧频发,《食品安全法》在农村地区的实施效果远不如城市。造成这种状况的原因除长期以来存在的城乡二元结构和
描述了利用离子注入固体靶测量^15N(p,a)^12C核反应微分截面的实验过程和方法,给出了在163keV≤Ec≤360KeV能区90°方向上的微分截面测量结果和激发函数曲线,并对该反应的
地铁已经成为了城市人民出行的主要交通方式。但是由于其建设在城市地表以下,长期受到地表建筑物承压,土体扰动及列车运行中的振动的影响,从而容易诱发地铁事故,进而对人民的生命财产安全造成严重损失。因此对地铁隧道进行定期的健康监测具有重要意义。传统全站仪等方法如今已经很难满足地铁隧道所需要的高效率施工和高密度运营维护的要求。三维激光扫描技术因其能够自动的、高精度、高密度的获取被测物体表面三维坐标信息已经开
用同轴线方法测量加速器真空室元件的纵向和横向耦合阻抗是目前加速器实验室通常采用的标准方法,该方法的有效性问题是一直被关注的问题之一.不同于文献的讨论分析,本工作用
野外基线作为特殊的长度实物标准,可为全站仪等测距仪器提供长度基准,是实现室外大尺寸距离传递的重要标准装置。为减小地壳运动、地基沉降、地下水位变化等对基线标准长度的影响,野外基线需定期进行校准。目前,野外基线校准技术主要有三种:光干涉法、高精度光电测距法和24m因瓦尺法,光干涉法是校准野外基线精度最高的方法。我国境内当前没有一条采用光干涉法校准的基线可以使用,主要采用24m因瓦尺或高精度光电测距仪实
文章借词典释义元语言之概念及理论,对《说文解字》之单字为训进行分析,考察单字为训如何解决其因形式过简而易于误解之弊并成为最常用的释义方式,讨论了《说文解字》单字为训时
<广州话正音字典>作为有史以来第一部方言规范字典,具有不少优点.本文在充分肯定其贡献的同时,对其定位和体例方面存在的问题,也诚恳地提出商榷的意见.全文包括三部分:一、<
基于河南、山东、江苏、浙江、黑龙江等5个典型农业生产省份的100个行政村986个农户的微观面板数据。运用二元Logistic模型计量分析了影响农户安全生产行为的主要因素。研究
根据我国老龄化的现状以及老年人交通事故频发的基本情形,分析现有道路系统存在的各种不利于老年人出行的因素,如绿灯时间过短、道路人行条件差、交通标志标识不明显、老年人