多目标图像的分割与识别方法研究

来源 :齐鲁工业大学 | 被引量 : 0次 | 上传用户:wangj30
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
图像分割与识别作为机器学习领域的重要研究方向之一,主要工作是区分图像数据或者视频数据中的目标与非目标,如果存在目标,则需确定该目标的位置,并对其进行分类识别。本文使用改进的Faster R-CNN算法对VOC数据集、汽车数据集以及自制办公用品数据集进行图像分割与识别处理,分析比较原始算法与本文提出算法的优劣性,结合特征融合、AlexNet模型及VGG模型框架对算法提出改进。在本文中,基于不同的改进提出了三种多目标图像的分割与识别方法:针对经典Faster R-CNN方法对数据集中目标小、有遮挡或背景复杂图像分割与识别结果较差、效率低的问题,在网络框架中引入特征融合,在此基础上提出了基于特征融合改进的Faster R-CNN方法。主要思路是在卷积神经网络中将候选区域映射到不同卷积层生成的特征进行融合,在指定的维度对输入的特征图进行一个堆叠处理,能够得到大小为固定尺寸的特征向量,将其传送到全连接层用于进行分类识别与边界框回归。由实验结果可知,此方法对多目标图像分割与识别的结果相较于经典的Faster R-CNN方法有所提高。针对Faster R-CNN方法的网络框架中,卷积神经网络AlexNet模型因使用ReLU激活函数导致训练时无法适应较大的梯度输入,从而造成分割与识别精度低的问题,提出了基于AlexNet改进的Faster R-CNN方法。该方法使用了LeakyReLU激活函数,使静默神经元的出现减少,从而允许梯度学习。实验结果表明,改进后的AlexNet模型对负值数据进行加权优化,从而提高了多目标图像分割与识别的精度,大大提升了效率。针对卷积神经网络VGG模型的网络结构深,耗费资源较大,导致训练时存在梯度消失和梯度爆炸问题,因此提出基于VGG改进的Faster R-CNN方法,并在VGG16与VGG19两个网络模型中分别提出改进。通过改变VGG网络结构以及引入使用LeakyReLU激活函数来调整参数,从而解决梯度爆炸等问题。实验结果表明,改进后的VGG模型有更多的激活函数,更多的卷积核,使得决策函数更具有辨别能力,有效提升了分类识别效果,进一步提高了多目标图像分割与识别的精确度。
其他文献
结合新建厦门第二西通道主线隧道下穿既有疏港路高架桥及匝道桥桥墩的工程实例,利用FLAC3D数值模拟软件分析主线隧道矿山法开挖对既有桥梁桥墩近接施工时的变形和位移的影响,
<正>故障现象一辆2016款奥迪Q5车,搭载CUH发动机,累计行驶里程约为4万km。起动发动机,暖机后组合仪表上的红色机油压力报警灯点亮(图1),且中央信息显示屏提示"关闭发动机,机
吸附剂是影响柱色谱分离效果的重要因素,研究了几种常见的吸附剂如硅胶、碱性氧化铝、中性氧化铝、酸性氧化铝等对柱色谱法分离荧光黄和碱性湖蓝BB分离效果的影响,利用NH3-TP
不要刻意节食减肥,也能瘦身。世界卫生组织最近称,只要用低脂肪食品取代高脂肪食物,就能使体重减轻,虽然其效果无法与刻意减重所带来的效果相比,但长期下来,还是有助于体重的
目的:探讨低频(1Hz)重复经颅磁刺激(rTMS)干预脑卒中患者健侧大脑半球M1区对患侧屈肘肌痉挛的治疗效果。方法:40例脑卒中伴肘部痉挛患者随机分为rTMS组(n=20)和对照组(n=20)
企业想要持续不断地发展和壮大,大多选择了更快的外部成长方法——企业并购,其目的都是为了在激烈的市场竞争中存活下来。并购财务风险之所以产生,来源于企业并购的一系列行为,由于面临的具体操作执行不同,企业将面临不同的财务风险。无数的并购失败源于没有对并购的财务风险进行有效控制,如果能采取足够的措施对并购的财务风险进行控制,无疑可以减少并购的失败,使并购更加具有效益和效率。本文在先阐述了企业并购的相关基础
目的:探讨功能性子宫出血的中医病机及治疗方案。方法:选择2016年3月~2018年2月我院收治的94例功能性子宫出血患者,运用随机数表法分为对照组(n=47)与治疗组(n=47),对照组施
3月初以来,河南省许昌市数字城管中心持续开展绿化缺株补植专项采集工作,通过发现问题和上报,责成管理部门及时解决各类绿化问题,改善城区宜居环境。按照许昌市委市政府的部
教学质量是高职院校生存和发展的生命线,文章探讨了当前高职院校在会计专业培养目标、教学内容、教学方式等方面存在的问题,并在此基础上对高职院校会计专业教学改革提出了一些
空间电离辐射尤其是高能带电粒子辐射可造成生物机体的严重损伤,是载人航天飞行的关键性限制因素之一。研究表明,带电粒子的生物学效应与其性质、剂量以及不同生物学终点有关