论文部分内容阅读
我国是苹果生产主要国家,苹果总种植面积,总生产量,出口量等都列世界第一位置,已然为苹果种植及消费之最大国。苹果等水果的总产值在我国农业生产中仅次于粮食、蔬菜而居第三位。稳重有序的推进水果业的发展,对于农业经济发展,农村发展,农民盈利都有优势,并且对调整农业经济结构、和社会主义农业经济建设有深远影响。无损检测技术也渐渐壮大起来,由于高光谱具有图像、光谱双重特性,也使得高光谱检测极其重要,可以利用高光谱对水果品质进行无损检测。本文以“黄金帅”品种苹果为检测对象,其样本数量共300个(250个训练集样本,50个预测集样本),以糖度、硬度和含水率为品质检测值,综合运用计量学、数理统计学、机器学习理论和计算机科学对“黄金帅”苹果品质高光谱无损检测过程中的特征波长选择、相关性分析建模进行较为深入地研究。研究内容和结论如下:1)首先利用单一特征选择算法(连续投影算法、无信息变量消除算法、正自性加权平均算法、遗传算法)优选出“黄金帅”苹果糖度、硬度和含水率的相关高光谱特征波长。然后根据波长融合提出融合多算法,综合考虑各个算法波长选择结果。最终确定“黄金帅”苹果的糖度的最优波长(39个波长),和全波段相比,预测结果决定系数R2P由0.7889提高到0.8752,预测均方根误差RMSEP由0.2656降到0.1687;硬度的最优波长(27个波长),和全波段相比,预测结果R2P由0.7094提高到0.8463,RMSEP由0.46066降到0.3059;含水率的最优波长(140个波长),和全波段相比,预测结果R2P由0.6828提高到0.7835,RMSEP由1.1%降到0.48%;含水率品质下,为了达到更高精度,所选波长较多,表明450-967nm光谱范围内相关水分的特征波长较少:糖度与硬度品质下,相比单一波长选择算法,融合后精度更高,最终选择波长数量也更小,表明融合法对高光谱特征波长优选更优秀。2)首先建立了“黄金帅”苹果糖度、硬度、含水率的偏最小二乘回归模型、误差反向传导神经网络模型、主成分回归模型、多元线性回归模型、支持向量回归模型。并得到糖度下最优模型为偏最小二乘回归模型;硬度下最优模型为误差反向传导神经网络模型;含水率下最优模型为偏最小二乘回归模型;然后根据集成学习,运用Bagging集成框架,确定了“黄金帅”苹果含水率、糖度、硬度的多算法集成预测模型。糖度多算法集成模型下R2P为0.8752,RMSEP为0.1697,预测精度接近最优偏最小二乘回归模型,优于剩下其他算法模型;硬度多算法集成模型下R2P为0.8463,RMSEP为0.3045,预测精度接近最优误差反向传导神经网络模型,优于剩下其他算法模型;含水率多算法集成模型下R2P为0.7857,RMSEP为0.48%,预测精度接近最优的偏最小二乘回归模型,优于剩下其他算法模型;表明集成学习下多算法集成模型对苹果品质的高光谱检测可行。在一定精度条件下,多算法集成模型简化手动调节参数步骤,对不同品质检测目标能够有良好的自适应,确保稳定性,最终确定为“黄金帅”苹果品质高光谱检测模型。