基于LIBSVM的哈密瓜成熟度无损检测技术

来源 :江苏农业科学 | 被引量 : 0次 | 上传用户:gululukuaican
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
  摘要:以7成熟、9成熟和过熟3种不同成熟度的哈密瓜为研究对象,在Matlab 7.6环境下,先利用图像处理技术对哈密瓜果脐处进行背景图像分割,计算图像的最大值、最小值、平均值等7个特征值,然后运用模式识别与回归工具箱LibSVM建立基于支持向量机(support vector machine,SVM)的哈密瓜成熟度分类模型,并对分类准确率进行预测。结果表明,图像处理中的LibSVM工具箱可以很好地运用到哈密瓜成熟度的无损检测研究中,模型分类准确率可达到95.83%。
  关键词:哈密瓜;图像处理;成熟度;无损检测;LibSVM;模型;准确率
  中图分类号: TS207 文献标志码: A
  文章编号:1002-1302(2016)11-0396-03
  新疆素有“瓜果之乡”的美称,目前新疆水果種植总面积已达到991 719 hm2。2012年林果总产量超过650多万t,年产值近300亿元[1],2013年林果总产量达1 326.9万t[2],发展非常迅猛。林果业已经成为新疆农民脱贫致富的重要途径。
  随着科学技术的不断发展与进步,信息技术在农产品加工处理上的运用已经成为当今农业可持续发展的一项重要手段。近年来,国内外众多专家与学者采用图像、光谱、气味等无损性方法对水果品质检测进行了大量研究。应义斌等用颜色特性对柑橘成熟度进行了无损检测研究,在波长700 nm光谱处得到了高质量的柑橘图像,提出了一种利用协方差矩阵和样本属于橘黄色和绿色的概率来判断柑橘成熟度的判别分析法,并以实测固酸比值作为对照,对72个柑橘样本成熟度的判别准确率达到了91.67%[3]。马本学等采用漫反射高光谱成像技术对哈密瓜糖度进行了无损检测研究,对比了多元散射信号修正、标准正则变换校正方法,原始光谱、一阶微分、二阶微分光谱预处理方法对建模精度的影响;采用偏最小二乘法(partial least squares,PLS)、逐步多元线性回归(multiple linear stepwise regression,SMLR)和主成分回归方法对比了带皮哈密瓜和去皮哈密瓜糖度检测模型效果。结果表明,应用SMLR法检测去皮哈密瓜糖度效果最佳,校正集相关系数为0.928,预测均方差为0.458,预测集相关系数为0.818,校正均方差为0.727[4]。宋小青等利用电子鼻技术快速无损检测低温贮藏猕猴桃芳香气味的变化,分别采用偏最小二乘法、多元线性回归(multivariable linear regression,MLR)和反向传播算法(back propagation,BP)网络建立了评价猕猴桃可溶性固形物含量(soluble solid content,SSC)、硬度、pH值的数学模型,研究表明线性判别式分析(linear discriminant analysis,LDA)比主成分分析(principal component analysis,PCA)方法能更好地识别不同贮藏时间的猕猴桃,BP网络预测能力高于MLR方法,MLR方法的分析精度优于PLS。其中BP网络的测试集SSC、硬度、pH值的预测值和测试值的R2分别为0.93、0.90、0.90,相应的校正均方差分别为0.48、2.15、0.08[5]。Morrison等指出由于大多数水果成分复杂且不均匀,使超声波对水果品质检测很难成功,从而提出了一种新超声波方法,通过分析水果边界的反射情况来整体评估水果品质,发现超声波与脐橙的密度有高度相关性,可以无损预测相对含水率,同时不受水果大小、成熟度等物理特性的影响。通过9 d对1个脐橙的跟踪研究,发现超声波与坚实度高度相关[6]。虽然目前国内外学者对哈密瓜成熟度检测技术缺乏深入地研究,且绝大多数研究仍停留在实验室研究阶段。特别是作为新疆特产的哈密瓜,对它的成熟度检测尚属空白,但国内外水果成熟度检测技术对本研究具有一定的借鉴和移植性。
  图像处理大体上可分为图像的像质改善、分析、重建三大部分[7],本研究内容属于图像分析范畴。首先对哈密瓜特征进行提取说明,然后对特征数据进行归一化预处理,并以哈密瓜果脐处图像为研究对象,通过文中处理方法达到识别分类的目的。
  1 哈密瓜特征的提取
  特征提取前要对图像进行背景分割[8]处理,剔除影响特征参数的背景因素。图像的描述性统计量有平均值、标准差、最大值、最小值、极差、中位数、众数、变异系数、偏度、峰度和熵[9],其中变异系数是衡量资料中各观测值变异程度的一个统计量,计算公式为变异系数=(标准偏差/平均值)×100%。由于变异系数进行的是2个或多个资料(如价格和转速等单位不一)变异程度的比较,单位相同时用标准差比较,所以不考虑变异系数。背景分割前、后的图像如图1、图2所示,峰度和熵的分布如图3、图4所示。
  3 试验设计与结果分析
  3.1 试验设计
  首先,将采购来的哈密瓜分为7成熟、9成熟和过熟3类,然后用奥林巴斯数码照相机获取哈密瓜7成熟、9成熟和过熟果脐处图像各28张,图片分辨率为3648×2736。从所得图像中分别选取20张,共计60个作为训练样本,其余的24个作为测试样本。令训练样本中与7成熟、9成熟和过熟相对应的标签分别为1、2、3。通过模式识别与回归工具箱LibSVM建立基于SVM[11-14]的哈密瓜成熟度分类模型,利用该模型处理分析测试样本集,得到样本测试标签。将实际标签与测试标签进行对比,得出分类的准确率。
  本试验采用3种不同的处理方法对训练集样本特征数据进行预处理,即对数据进行[-1,1]、[0,1]的归一化预处理以及不进行归一化预处理,最后对测试集样本的预测分类结果的准确率进行对比分析,得出结论。
  3.2 结果分析
  对哈密瓜训练集样本的特征数据进行3种不同的预处理,即进行[-1,1]、[0,1]的归一化预处理以及不进行归一化预处理,其中Svmtrain的参数选项都采用“惩罚因子c=2、RBF核函数中的Gamma值g=0.07”,所得的Matlab图像如图5至图7所示。   從图5至图7中可以看出,对哈密瓜训练集样本的特征数据进行的3种不同预处理方法,都可以将哈密瓜7成熟、9成熟和过熟3类不同成熟度区分,但它们的分类准确率有所不同,具体如表1所示。
  从表1可以看出,对训练集样本特征数据进行[0,1]的归一化预处理的分类准确率最高, 不进行归一化预处理的分类准确率次之,[-1,1]的归一化预处理的分类准确率最低。
  4 结论
  本研究分析了在哈密瓜成熟度识别分类中Matlab图像处理技术的运用,对提取的特征数据进行不同的预处理,得到不同的分类准确率。其中,未进行归一化预处理的分类准确率并不是最低的,可见并不是任何问题都必须事先把原数据进行归一化。针对哈密瓜成熟度分类问题,[0,1]的归一化预处理方法达到了很好的分类效果。可见,基于模式识别与回归工具箱LibSVM建立的哈密瓜成熟度分类模型对哈密瓜进行分类的无损检测技术是可行的,并对大型水果上应用无损检测技术提供借鉴和参考。
  参考文献:
  [1]新疆维吾尔自治区统计局. 新疆统计年鉴[M]. 北京:中国统计出版社,2013.
  [2]新疆维吾尔自治区统计局. 新疆统计年鉴[M]. 北京:中国统计出版社,2014.
  [3]应义斌,饶秀勤,马俊福. 柑橘成熟度机器视觉无损检测方法研究[J]. 农业工程学报,2004,20(2):144-147.
  [4]马本学,肖文东,祁想想,等. 基于漫反射高光谱成像技术的哈密瓜糖度无损检测研究[J]. 光谱学与光谱分析,2012,32(11):3093-3097.
  [5]宋小青,任亚梅,张艳宜,等. 电子鼻对低温贮藏猕猴桃品质的预测[J]. 食品科学,2014,35(20):230-235.
  [6]Morrison D S,Abeyratne U R. Ultrasonic technique for non-destructive quality evaluation of oranges[J]. Journal of Food Engineering,2014,141:107-112.
  [7]杨 杰. 数字图像处理及MATLAB实现[M]. 北京:电子工业出版社,2010.
  [8]王红君,陈 伟,赵 辉,等. 复杂背景下植物叶片的彩色图像分割[J]. 中国农机化学报,2013,34(2):207-211.
  [9]谢中华. MATLAB统计分析与应用:40个案例分析[M]. 北京:北京航空航天大学出版社,2010.
  [10]史 峰,王小川,郁 磊,等. MATLAB神经网络30个案例分析[M]. 北京:北京航空航天大学出版社,2010.
  [11]Chang C C,Lin C J. LIBSVM:a library for support vector machines[J]. ACM Transactions on Intelligent Systems and Technology,2011,2(3):27.
  [12]Hsu C W,Lin C J. A comparison of methods for multi-class support vector machines[J]. IEEE Transactions on Neural Network,2002,13(2):415-425.
  [13]Horvath D,Brown J B,Marcou G,et al. An evolutionary optimizer of libsvm models[J]. Challenges,2014,5(2):450-472.
  [14]Pouladzadeh P,Shirmohammadi S,Bakirov A,et al. Cloud-based SVM for food categorization[J]. Multimedia Tools and Applications,2015,74(14):5243-5260.
其他文献
摘要:综合分析艾比湖流域胡杨冠下土壤有机碳(SOC)、全氮(TN)、全磷(TP)分布及生态化学计量特征,对土壤SOC、TN、TP含量及C/N、N/P、C/P的水平和垂直变化进行单因素方差分析,用最小显著性差(LSD)对数据进行多重比较。结果表明,从肥岛外至冠幅中央,随着距离的增加肥岛效应不断增强,SOC、TN含量显著增加(P<0.05),0~5、5~10、10~15 cm这3个土层深度下SOC和T
摘要:为构建基于高光谱参数的设施黄瓜霜霉病发生级别预测模型,使用手持光谱仪ASD FieldSpec HandHeld检测不同黄瓜霜霉病为害下黄瓜叶片高光谱反射率,并分析400~900 nm波段内的光谱反射率参数与黄瓜霜霉病发生级别的相关关系和回归关系。结果表明,在400~718 nm波段范围内,随着霜霉病级别的增加,黄瓜光谱反射率均有明显上升,并在568~687 nm波段范围内达到极显著相关水平
摘要:结晶紫是一类难以降解且对许多生物都具有致癌致畸性的三苯甲烷类染料,筛选能够高效脱色结晶紫的菌株对修复受污染水体具有重要意义。从浙江温州分离筛选到1株结晶紫高效降解菌株CV-b,系统地研究了各操作因素对该菌株脱色结晶紫的影响。经16S rRNA基因序列分析表明,该菌株属于肠杆菌属(Enterabacter sp.)。当pH值在3.0~10.0之间时,培养24 h以后,该菌株对50 mg/L结晶
逗哏先生,本姓赵,年方18,喜欢种花。因搞笑技能满级得此雅称。  本人,本姓未知,亦18,喜欢吃瓜。因常吐槽逗哏先生,人称“捧哏先生”。  以上是出场人物介绍,以下是逗哏先生部分“光荣事迹”简述,希望你看完后不会大呼:“这是碳基生物能干出来的事儿吗?”一、胡辣汤  逗哏先生家拥有得天独厚的地理位置,出门右拐是学校,出门左拐小吃街。我就没那么好的运气,坐公交上学都得花半个多小时,来不及吃早饭是常事。
摘要:以高山石斛(Dendrobium infundibulum Lindl.)成熟种子为外植体,MS为基本培养基,研究植物生长调节素对高山石斛组织培养过程中继代增殖和生根的影响。结果表明,高山石斛最佳的启动培养基为MS 6-BA 0.2 mg/L NAA 1.0 mg/L;继代增殖中,6-BA、NAA、KT等激素的配合使用具有较好的效果,利于继代增殖的培养基为MS 6-BA 3.0 mg/L N
有两名年轻的杂技演员即将获得人生第一次参加演出的机会,两人知道机会来之不易,于是更加刻苦地训练。  到了演出这天,两名杂技演员表演了他们的绝活——“抖杠”。只见男演员轻身一跃,便跃上了细长的竹竿。他的同伴——一位身材娇小的女演员,随即也像燕子一样跃上了竹竿。他们开始在细细的竹竿上做各种惊险的动作。最后,男女演员跃下竹竿时,全场掌声雷动。下台后,大家本以为两位演员会是神情兴奋,然而他们平静如水。有人
摘要:通过对广东省广州市8个区26个村农户的调查,基于宅基地功能演变视角,采用描述性分析和Logistic回归模型分析农户流转宅基地的行为及其与宅基地功能之间的关系。结果显示,农户宅基地“一户多宅”现象依然很严重,超30%农户拥有1处以上的宅基地,同时一半农户支持宅基地流转;文化程度、居住现状满意度、家庭宅基地数量对农户宅基地流转意愿影响较大,其中文化程度越高、居住现状满意度越低、家庭宅基地数量越
摘要:分析土地整治與区域经济发展的耦合关系,探讨影响二者耦合程度的因素,对喀斯特山区有序开展土地整治和促进区域经济发展具有重要的理论和现实意义。以贵州省为例,利用贵州省2011—2017年土地整治和经济发展相关数据,基于耦合协调度模型,分析土地整治与经济发展的耦合协调态势。结果表明,研究区土地整治与经济发展水平耦合协调程度逐年升高,但仍然未达到高水平的耦合及优质协调阶段,耦合协调发展趋势迅速,但耦
摘要:抗菌肽是构成昆虫体液免疫的主要方式,BmMoricin是家蚕免疫系统中1种重要的抗菌肽,具有极强的抑菌活性。以家蚕中肠组织总RNA为模板,设计1对特异性引物,通过RT-PCR技术扩增BmMoricin,构建pET32a-BmMoricin原核表达载体,采用自诱导表达系统表达BmMoricin重组蛋白。结果表明,BmMoricin基因片段的大小为201 bp,编码66个氨基酸,自诱导表达的Bm
摘要:采用近红外漫反射光谱技术结合簇类独立软模式方法(SIMCA)建立了预测模型,并对5个产地的铁皮石斛进行了快速鉴别研究。光谱数据经过Savitzky-Golay(S-G)平滑、1阶Savitzky-Golay(S-G)求导和均值中心化组合光谱预处理和波段选择优化后,所建的SIMCA模型为最佳模型。所建模型的识别率和拒绝率均为100%,而且5个产地铁皮石斛的模型也能拒绝其他3种石斛金钗石斛、紫皮