论文部分内容阅读
近红外光谱(NIRS)分析技术具有无损、高效等优点,在药品鉴别、疾病诊断等领域应用极为广泛。针对NIRS分析技术在柑橘黄龙病鉴别方面的应用,虽然传统机器学习算法可以实现柑橘黄龙病的鉴别,但其鉴别的准确率较低、稳定性较差。其次柑橘叶片的近红外光谱数据存在维度较高、谱带较宽且重叠等问题,制约了模型的鉴别能力。深度学习算法具有较好的深层特征提取能力,文中将深度学习算法应用于解决NIRS柑橘黄龙病鉴别及近红外光谱分析模型通用性较差的问题,具体研究内容如下:(1)提出了堆栈降噪自编码结合随机森林(SDAE-RF)的柑橘黄龙病鉴别方法。针对SDAE网络鉴别准确率较低且时间复杂度较高的问题,文中采用RF代替SDAE顶层的Softmax分类和反向微调阶段,达到缩短运行时间提高鉴别准确率的目的。文中以柑橘叶片近红外光谱数据为实例,以SDAE、RF、SVM、ELM、SWELM和BP作为对比方法验证SDAE-RF在不同规模训练集下的性能。结果表明,SDAE-RF方法在不同规模训练集下均表现出了较高的鉴别准确率和较强的稳定性。(2)提出了压缩自编码结合极限学习机(CAE-ELM)的柑橘黄龙病鉴别方法。该模型采用引入雅克比矩阵的CAE网络实现样品光谱特征提取。然而其在参数微调阶段仍采用反向优化策略,这会增加算法的时间复杂度。文中采用ELM代替CAE网络的Softmax分类和反向微调阶段,从而降低了CAE网络时间复杂度、提高了预测准确率。文中以不同比例的柑橘叶片光谱数据作为训练集,并与SVM、SDAE、BP、SWELM、ELM及CAE进行对比,验证CAE-ELM方法的性能。结果表明,CAE-ELM方法在不同规模训练集下较其他模型均表现出了较高的稳定性和较强的鉴别准确率,同时在训练时间方面较CAE网络也有缩减。(3)针对近红外光谱分析模型通用性较差的问题,提出了最小角回归结合一元线性直接校正法(LAR-SLRDS)的模型传递方法。首先利用LAR算法实现样品全谱区特征波长点的筛选,然后利用SLRDS对筛选出来的特征波长点进行校正,从而达到提高模型通用性的目的。采用药品和汽油光谱数据进行定量分析实验、柑橘叶片光谱数据进行定性分析并与PDS、DS、SLRDS进行对比,从定量和定性分析两个方面评估LAR-SLRDS模型的性能。结果表明,LAR-SLRDS具有所求参数少、模型传递效果好等优点,能够实现药品、汽油和柑橘叶片样品分析模型的传递。