基于机器学习的羊骨架切割与多分体识别方法研究

来源 :华中农业大学 | 被引量 : 0次 | 上传用户:liangsfr
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
羊骨架切割和检测识别是羊屠宰加工过程中的最难实现自动化的环节,部分发达国家已经实现了自动化屠宰分割加工,而我国分割和分类加工环节都由人工借助半自动化机械完成。由于国内羊肉切割并不采取劈半处理,外国的羊肉切割设备及技术并不能完全适用于我国的国情。因此研究羊骨架自动切割及检测识别方法对提高羊骨架切割加工自动化水平和改善羊肉产品的食品安全具有重要意义。本研究根据国内企业羊骨架分割工艺中的实际需求,为了保证机器人系统能够准确获取羊骨架切割位置,利用机器视觉和机器学习方法对羊骨架切割位置进行预测,并对分割后的骨架多分体进行检测识别研究,主要研究内容和结论如下:(1)羊骨架图像处理和特征提取。针对羊骨架个体生物特征较为复杂的问题,研究羊骨架在图像中的形状和位置分布特征有利于实现羊骨架的分割。最小外接矩形的坐标参数是羊骨架躯干和胸腔部位形位特征的重要表现,可用于羊骨架的形状和位置描述。通过灰度化、二值化、形态学运算和轮廓识别等操作实现羊骨架的特征参数计算。针对腰椎和颈部难以识别的问题,提出一种基于机器视觉和Cart决策树的腰椎和颈部识别方法。颜色特征和空间位置特征是腰椎和颈部的重要特征,可以用于对腰椎、颈部的分割、识别和特征参数提取。根据腰椎和颈部在RGB、HSV和YCb Cr颜色空间的图像,采用绿色在HSV颜色空间的分布区间进行颜色提取,提取结果与YCb Cr图像进行并集预算得到腰椎、颈部和部分干扰因素;根据腰椎、颈部和干扰因素的中心坐标与连通域面积搭建Cart决策树分类方法对腰椎和颈部进行识别并提取特征参数。共提取1000组图像中羊骨架躯干、腰椎、颈部和胸腔4个部位共24组形位特征坐标参数作为特征集,为建立机器学习模型提供数据基础。(2)基于改进的Deep Lab V3+对羊骨架特征部位进行分割和特征提取。研究Deep Lab V3+的基础网络架构,对骨架网络Res Net进行调整,通过改变孔洞卷积扩张率和引入可变形卷积的方式对ASSP模块进行改进。共搭建9种Deep Labv3+的变形网络,其中改进网络6的m Io U、PA和F值分别为0.849、0.870和0.879,较原始的Deep Lab V3+分别提升1.6、2.2和0.7和百分点。该方法有效实现了羊骨架特征部位的分割,基于分割结构提取20组形位特征参数。(3)基于机器学习的羊骨架切割位置预测。针对羊骨架形态、尺寸变化的问题,研究基于机器学习的羊骨架切割位置预测方法有利于实现不同尺寸大小的羊骨架切割。本研究对羊骨架形位特征参数集进行相关性检验、异常值检测、特征构造、数据平移和归一化等预处理操作。分别设计开发了Lasso、Ridge、SVR和GBDT 4个预测模型,以拟合度R~2、均方误差MSE和残差绝对平均值3个指标对模型进行评价,其中Lasso、SVR模型预测效果最好,Ridge、GBDT模型预测效果次之。基于贝叶斯优化方法设计开发了集成学习方案,当Lasso、SVR和GBDT以0.30:0.25:0.45的比例进行集成时模型效果最优,拟合度R~2为0.947,均方误差MSE为8.26,残差绝对平均值为2.0像素点。(4)基于改进的Faster-RCNN的羊骨架多分体检测识别。针对分割羊肉的分类问题,研究分割羊肉检测识别技术有利于实现分割羊肉分类工序的自动化。本研究基于Res Net设计搭建了Res Net-30、38、44、56、89和113等6种分类网络,搭建具有注意力机制的Faster-RCNN。对比VGG-16、Res Net-34、50和101 4种分类网络,优选Res Net-38作为分割羊肉的特征提取和分类网络,top-1 error为0.253%。引入RPN网络层、ROI Pooling方法设计搭建了分羊骨架多分体的检测识别网络Sheep D-Net,对比基于YOLOv3、Faster-RCNN和Couple Net的检测效果,在检测精度方面明显提升,分别提升了7.0%、6.3%、0.9%,处理速度较Couple Net提升0.071s,有效实现了羊骨架多分体的快速准确识别。(5)羊骨架切割试验。搭建羊骨架且割试验平台,对集成学习的实际预测能力进行验证。完成了机械臂的选型、夹具系统的搭建、轨迹分析和优化算法的设计开发和可视化监测界面的开发。根据质量分布将样本分成3组进行试验,3组样本数量分别为2、4、2,平均偏移距离为3.45mm。
其他文献
随着新型大规模数据中心的建立和发展,如何根据这些数据中心网络的新特征提升传输性能成为了产业界和研究界的新热点。网络传输最主要的目标是提升网络吞吐量和减小传输延迟
目的:分析青少年儿童黄斑前膜手术前后最佳矫正视力改变情况,同时应用微视野计评价术后黄斑区注视特点,并将其与术后最佳矫正视力进行相关性分析。方法:回顾性研究。研究对象
近年来,人脸图像补全技术成为了计算机视觉领域的研究重点之一,其中基于深度学习,特别是基于生成式对抗网络的人脸图像补全技术更是重中之重。神经网络能通过数据集中学习人
现代社会互联网和物联网的发展已越来越迅速,涉及的行业也越来越广泛。同时,移动设备中的传感器种类和性能也大大提升,使其传感、计算、存储、通信能力逐渐增强。这些因素也
土石坝作为如今最实用的坝型,被水电行业广泛应用。由于其自身优、缺点显著导致其安全性需要高度重视,在世界各地,人们采取各种不同的方法来维护其安全,而对其安全预测成为了
车联网通过无线通信网络将人、车、道路等众多交通因素联系起来,能够增强安全驾驶、提高交通效率并改善驾乘感受。为了实现安全驾驶类的应用服务,车辆需要周期性地广播包含其
在大规模多输入输出(Massive Multiple-Input Multiple-Output)系统中,下行链路预编码可以有效的消除用户间干扰和信道噪声,从而提高系统的通信性能。传统的基于优化预编码算
互联网和物联网的高速发展使无线接口数量呈现指数级增长,为了使海量机器能进行高可靠通信,获得高速率、低延时的体验,基于5G通信候选技术之一的非正交多址接入(NOMA)技术得到了深入研究。与正交多址接入(OMA)相比,NOMA不仅有更高的频谱效率,还能满足海量接口的需求,因此研究协作NOMA系统的性能对系统参数设计具有重要意义。但无线通信的广播特性会使系统受到窃听和干扰的影响,为了提高物理层的安全性能
医学图像分割在医学研究、临床诊断、病理分析、手术计划、影像信息处理、计算机辅助技术等医学研究和实践领域有着广泛的应用和研究价值。目前,多数前沿的图像分割算法在特
移动4G技术的发展及智能手机的普及,世界各地的用户足不出户就可以在互联网上对电影、商品等进行评价。越来越多的研究者使用自然语言处理技术应对每秒都会增加数GB的文本信息,探究其内在的情感倾向并将其成功应用在社会舆情监督、股票投资等方面。以往的情感分析多是基于情感词典的方法和机器学习的方法,然而这些方法都是基于人工构建的规则和人工抽取的特征之上,人力成本高。另外基于one-hot词的向量表示上面临着“