基于改进Mask R-CNN的奶山羊图像实例分割方法研究

来源 :西北农林科技大学 | 被引量 : 0次 | 上传用户:djxhh
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
精准养殖是目前畜牧业发展的主流方向。为提高奶山羊图像分割精度,促进养殖产业精准化和智能化发展,本文以羊场环境下获取的奶山羊图像为研究对象,实现了基于改进Mask R-CNN算法的奶山羊图像实例分割。本文的主要研究内容和结论有:(1)奶山羊实例分割数据集的构建。针对缺少奶山羊实例分割公开数据集的问题,通过在奶山羊养殖场安装远程高清摄像机,获取室内外奶山羊监控视频。首先对视频进行关键帧提取,人工筛选出清晰度较高的奶山羊图像作为原始实例分割数据集。然后,利用几何变换、色彩增强和添加噪声的方法实现了数据集扩充。最后,使用Labelme软件进行图像标注,得到理想的自制奶山羊实例分割数据集。(2)基于特征加权的奶山羊图像实例分割。针对Mask R-CNN模型对特征信息利用不充分的问题,提出了一种基于特征加权的奶山羊图像实例分割模型FM-Mask RCNN。FM-Mask R-CNN在Mask R-CNN的基础上嵌入了挤压-激励网络(SENet)中的SE模块,通过特征加权的方式学习特征通道的重要程度,提升对奶山羊分割有效特征的学习权重,抑制其它不重要的特征,增强了模型的特征提取能力。实验结果表明,FM-Mask R-CNN拥有更高的实例分割性能,与原始的Mask R-CNN相比,在自制奶山羊数据集上的平均分割精度提升了2.83%。(3)基于Adaptive NMS和排斥损失的奶山羊图像实例分割。针对复杂场景下Mask R-CNN实例分割模型精度低、鲁棒性差的问题,提出了一种基于Adaptive NMS(自适应非极大值抑制)和排斥损失(Repulsion Loss)改进的Mask R-CNN算法。首先将原始的NMS算法替换为更适用于复杂场景的Adaptive NMS算法,根据场景的稠密程度来进行最优的阈值设定。再引入削弱遮挡影响的Repulsion Loss,进一步增强Mask RCNN算法对于遮挡实例目标的适应能力,有效减少了复杂场景中奶山羊相互遮挡导致的漏检和误检现象。最后在自制奶山羊数据集上进行了对比实验。实验结果表明,在奶山羊数据集上基于Adaptive NMS和排斥损失改进后的Mask R-CNN算法平均分割精度达到68.71%,比原始的Mask R-CNN提高了4.59%。本文的方法和其他实例分割算法的比较结果,也证明了改进的Mask R-CNN在解决复杂场景下的遮挡问题方面有明显优势,拥有较好的分割性能。
其他文献
遗传算法(GA)和BP神经网络是广泛应用的两种优化算法,但均存在着一定的不足,遗传算法的局部搜索能力有所欠缺,存在早熟收敛的风险;而BP神经网络内部结构单一,容易操作,但是收敛过程较慢,并且很容易在多层网络中陷入局部最优。遗传算法-反向传播神经网络(GA-BP)算法充分利用了遗传算法和BP神经网络的优点,克服两种算法的不足,已达到较好的优化效果,已经被广泛应用到实际问题中,但该算法同样具有收敛速度
近些年来在畜牧业养殖领域,利用深度学习方法完成目标检测、目标跟踪(例如奶山羊目标跟踪)进而实现智能化畜牧养殖管理逐渐成为一种潮流。但深度学习在训练网络时往往需要大量的训练图像,否则会出现网络泛化能力弱、鲁棒性差等问题。而针对现有的奶山羊训练图像数量不足的问题,本文以西北农林科技大学畜牧教学基地采集到的五类奶山羊图像为训练数据集,利用半监督式的对抗神经网络,通过在训练过程中引入训练标签,来生成指定类
农业化肥和食品添加剂过度使用导致的亚硝酸盐污染,对生态环境和公众健康造成了严重的危害。人体若摄入少量亚硝酸盐可能导致急性中毒,若接触过量可致癌甚至死亡。因此,准确、定量监测食品中亚硝酸盐浓度对保证食品质量安全以及维护人体健康有重要意义。与传统检测方法相比,亚硝酸盐电化学传感因其操作简单、灵敏度高、分析速度快,以及可以实现小型化现场分析等优势,受到人们广泛的关注。商业碳纤维纸(CFP)因其良好的导电
水利闸门在日常使用过程中不仅直接影响着防洪防涝的安全,而且与水力发电的发电效益有着极大的关系。在闸门使用过程中,如何获取以及使用水利相关信息,并且妥善解决各种矛盾冲突,合理进行闸门控制指挥决策有着重大意义。在确保没有洪涝灾害的前提下,进行水利枢纽的实时调度,获得最大的水利枢纽运行的综合效益,是目前水利枢纽闸门自动化系统迫切需要得到解决的重要问题之一。与此同时,闸门的安全运行更是保障这些任务能够稳固
非均匀沙推移质是河道中泥沙输移的重要组成部分,直接影响河流中的水流结构、泥沙输移、河床演变等基础问题,正确认识非均匀沙推移质的运动规律是合理开发和保护河流的前提,对于促进河流动力学的发展以及满足实际工程需求都具有十分重要的意义。本文应用高速摄影技术与数字图像处理技术相结合的方法研究了非均匀沙的运动特性。主要内容有以下几点:(1)提出了利用数字图像处理与运动目标检测技术相结合的获取泥沙颗粒运动参数的
近年来,随着计算机性能的不断提升,计算机视觉领域得到迅速发展,基于计算机视觉的三维重建成为一个重要的研究方向,在社会生产生活等领域的应用也越来越广泛,其中基于图像的三维重建方法由于操作简单且恢复效果较好,成为近年来的热点问题。从单幅图像恢复目标区域的三维形状,由于其本身存在的不适定性,是三维重建中具有挑战性的工作之一。本文对基于单幅图像的三维重建方法进行了研究,主要研究工作如下:(1)提出了一种改
近年来,我国高度重视农业信息化发展。我国葡萄种植面积大、产量高。葡萄病虫害的发生将直接影响葡萄的产量和品质。葡萄病虫害知识以书籍文献形式存在,葡萄种植人员无法快速获取到葡萄病虫害知识。为解决以上问题,帮助葡萄种植从业者高效准确地获取到有价值的信息,本研究利用知识图谱组织葡萄病虫害领域知识,利用深度学习模型理解自然语言问句语义信息,设计实现基于知识图谱的葡萄病虫害自动问答系统。因目前我国葡萄产业知识
电子商务的蓬勃发展为用户提供便利的同时也带来了信息过载的问题。推荐系统能够为用户筛选出少量其真正感兴趣的物品,缓解信息过载的问题。为同时兼顾效果和性能两个方面,一般会将整个推荐系统分为召回和排序两个阶段。其中召回阶段使用简单模型,在线性时间内将系统中与用户相关的物品尽可能多的找回,形成召回候选集;而排序阶段则可以使用复杂模型,对召回候选集进行点击率预测和排序,提高最终推荐效果。综上所述,本研究构建
对动物的目标跟踪是研究其健康状况和行为分析的基础。为了准确实时地获取动物的个体信息和行动状况,本文以西北农林科技大学畜牧教学试验基地的奶山羊养殖场视频为研究对象,基于Target-Aware Deep Tracking(TADT)算法,并结合注意力机制和模板更新方法,对奶山羊对象进行跟踪及精度评价,验证了改进后算法的有效性。本文主要的研究内容与结论如下:(1)数据集的构建及预处理。为获取数量充足的
在计算机视觉领域,视频动作识别近年来倍受关注。视频通常具有丰富的场景类型,比如街道监控视频、室内监控视频和某种体育项目的比赛视频等,而针对特定场景下的视频动作识别会更具有实际意义。对于体育视频中的羽毛球单打视频,为了能更好地辅助教练分析视频中球员的动作,以及使用户可欣赏到每种击球动作的视频集锦等多元化需求,本文基于羽毛球视频精彩片段展开对羽毛球动作识别的研究。论文主要的研究内容和结论如下:(1)羽