【摘 要】
:
近红外光谱定量分析技术作为一种高效的测量分析技术,在农业中被广泛应用。但近红外光谱数据是一种高维数据,其维度一般在几百维到上千维,若直接建模,会因为高维数据存在的多重共线性问题严重影响模型精度。因此,近年来特征波长选择算法便成为近红外光谱分析中的研究热点。本研究以解决高维近红外光谱数据各波长变量间的共线性为目标,提出一种新型的波长选择算法。在分析了三种常用波长选择算法,包括连续投影算法(succe
论文部分内容阅读
近红外光谱定量分析技术作为一种高效的测量分析技术,在农业中被广泛应用。但近红外光谱数据是一种高维数据,其维度一般在几百维到上千维,若直接建模,会因为高维数据存在的多重共线性问题严重影响模型精度。因此,近年来特征波长选择算法便成为近红外光谱分析中的研究热点。本研究以解决高维近红外光谱数据各波长变量间的共线性为目标,提出一种新型的波长选择算法。在分析了三种常用波长选择算法,包括连续投影算法(successive projections algorithm,SPA)、相关系数法(correlation coefficients,CC)、竞争自适应重加权采样法(competitive adaptive reweighted sampling,CARS)的优势和不足之后,发现SPA可以消除变量间的共线性,但是SPA只考虑向量间的投影,而投影距离大的变量并不一定是有效变量;CC考虑的是自变量与因变量间的相关性问题,但未考虑自变量间的共线性问题;CARS算法的不足之处在于稳定性较差,运行过程中通过蒙特卡洛采样对样本进行随机抽取,具有随机性。针对上述算法的优势及不足之处,提出一种以自变量之间以及自变量与因变量之间的相关性为选择标准的近红外光谱波长选择方法,称之为最小相关系数法(Minimal Correlation Coefficient,MCC)。该方法从光谱数据的相关系数矩阵出发,挑选出相关系数矩阵中平均值和标准差均较小的列向量对应的波长组成候选建模波长集合,使得集合内的波长之间线性相关性最小,最大限度地消除模型变量之间的共线性。同时考虑自变量对因变量影响的最大化,通过标准回归系数优选对因变量影响较大的波长,之后利用向前选择法建立线性回归模型,通过模型的均方根误差获得最优预测模型,最优模型下对应的波长即为特征波长。为了验证所提算法的有效性,基于两组公开的高维的近红外光谱数据集(土壤数据集、柴油数据集)进行MCC波长选择后建立多元线性回归(multiple linear regression,MLR)模型,并与全谱的偏最小二乘回归模型(full spectrum partial least squares regression,FULL-PLSR)及三种常用波长选择算法的回归模型(SPA-MLR、CARS-PLSR、CC-MLR)的建模结果进行比较。结果表明,两类数据集下MCC波长选择算法均表现了良好的预测性能。基于土壤数据集的预测结果中,MCC-MLR模型的预测集决定系数(Rp2)为0.9265,预测集均方根误差(RMSEP)为1.0323;而其余三种波长选择算法中预测效果最优的为CARS算法,CARS-PLSR模型的Rp2为0.9088,RMSEP为1.3682。基于柴油数据集的预测结果中,MCC-MLR模型的Rp2为0.9560,RMSEP为2.7792;而其余三种波长选择算法中预测效果最优的为SPA算法,SPA-MLR模型的Rp2为0.9539,RMSEP为2.8449。结论表明本研究所提出的最小相关系数法MCC可以实现高效降维,提高模型的预测性能,是一种有效的波长选择算法。为了方便用户使用最小相关系数法,本研究通过MATLAB开发基于最小相关系数波长选择的近红外光谱建模方法软件系统,可实现数据导入、光谱数据预处理、样本集划分、波长选择及建立多元线性回归模型等功能,为用户提供一个简明快捷的人机交互窗口,实现样本理化性质的快速准确测定。
其他文献
马铃薯黑痣病是由立枯丝核菌(Rhizoctonia solani)引起的一种土传真菌病害,对马铃薯的产量和品质都造成了严重的影响,很大程度制约了我国马铃薯产业的发展。随着绿色农业发展,生物防治日益受重视,对土传病害有较好的防控效果。本研究旨在筛选出对马铃薯黑痣病菌抑制效果好的木霉菌株,通过盆栽及田间试验,探索木霉菌对马铃薯黑痣病的生防效果及机制,为木霉菌剂的研发和马铃薯黑痣病的生物防治提供理论依据
为探究外源褪黑素浸种对干旱胁迫下大豆苗期抗旱性的调节效应,明确褪黑素浸种缓解干旱胁迫对大豆苗期调控的生理机制,本研究于2019-2020年在黑龙江八一农垦大学国家杂粮工程技术研究中心进行,以大豆品种绥农26和黑农48为试验材料,分别设置正常供水处理(CK)、干旱胁迫处理(D)和干旱胁迫+褪黑素浸种处理(D+M),研究了外源褪黑素对干旱胁迫下大豆形态特征、生理特性、光合特性和产量的影响。试验结果表明
基于作物养分信息变量施肥技术是未来农业的重要方向之一,其技术根据作物营养信息弥补前期施肥不足与不均等问题。以往变量施肥信息处理多采用处方图的形式,缺乏信息实时处理与应用,由于这一原因导致传感器变量施肥实时性无法保障,因此结合玉米中耕变量施肥农艺要求和技术指导,针对变量施肥的施肥位置准确性与实时性问题,开发快速变量施肥调控系统,并对系统调控效果进行试验验证。(1)分析变量调控系统的设计目标要求,根据
随着我国人口的快速增长,粮食和蔬菜消耗量逐年增高,作物秸秆难以降解、尾菜堆积造成环境污染,制约了农业的发展。本研究以水稻秸秆和白菜尾菜为原料进行堆肥处理,以木质纤维素快速分解复合菌系作为接菌剂,探究接种微生物强化效果。水稻秸秆和白菜尾菜以质量比7:3进行混合发酵,通过在原料中接种5%(V/V)的木质纤维素快速分解复合菌系进行微生物强化,混合堆肥试验共持续42 d,堆肥体积为1.52m3,定时取样并
马铃薯是我国继水稻、玉米、小麦后的第四大主要粮食作物,我国马铃薯种植总面积及总产量均位居世界首位,在国家粮食生产体系中占据重要位置。马铃薯中耕主要是进行土壤疏松、除去垄田杂草及薯垄培土作业。薯垄培土作业效果、伤苗及除草效果是中耕作业的主要指标。耕作效果能直接影响马铃薯生长状况,提高马铃薯机械中耕作业效果有重要意义。针对目前普遍采用的锄铲式在马铃薯生长前中期其培土量过大,为了解决马铃薯中耕机作业时伤
随着我国轨道交通事业飞速发展,大量铁路轨道穿过农田区域,当轨道交通路线与农田水利设施距离较近时,农田水利设施受轨道交通的影响难以避免,而目前现有设计规范中未考虑这一影响。水工结构中的农田水闸与其他建筑物相比,体积较小、结构单薄、对振动更为敏感,但针对水闸结构振动响应的相关研究较少。列车运行引起的水闸结构振动响应规律及其对结构安全性与耐久性的影响值得深入研究。为了寻求列车运行引起的水闸结构振动响应规
为进一步弥补水田整地方面存在缺陷,提高水稻收割后遗留在水田稻杆利用率,论文针对旋耕类刀具的研究现状,以提高稻杆埋茬率、降低拖拉机油耗以及提高耕后地表平整度作为设计目标,利用静力学分析原理、ANSYS有限元仿真软件、EDEM离散元仿真软件与田间试验方法,对水田搅浆埋茬平地机的主要工作部件打浆刀进行了理论探索与设计。通过查阅旋耕类刀具的现有刀型,根据静力学分析原理,对刀具进行受力与运动分析,建立功耗数
近年来,我国食品安全治理框架日趋完善,但食品真实性问题依然备受关注,食品真实性溯源技术急需发展,技术问题有待突破,目前食品真实性溯源技术方法还都没有形成标准。提高近红外光谱产地溯源技术和矿物元素产地溯源技术产地判别率是目前国内外研究的重点,尤其对于小范围来源样本。本实验以吉林省白城市、山东省泗水县、黑龙江省泰来县和杜蒙县2018年和2019年的120份绿豆为研究对象。采用傅里叶漫反射近红外光谱仪对
肝癌是一种常见的恶性肿瘤,具有恶性程度强、死亡率高、侵袭和转移性强等特点。常见的化疗药物主要有顺铂、洛铂和5-氟尿嘧啶(5-FU)等,存在副作用大、价格昂贵等问题。因此,寻找和开发一种经济、安全、低毒的潜在天然抗肝癌辅助活性成分或功能因子已成为当前研究热点。10-羟基癸烯酸(10-HDA),是蜂王浆中特有的活性成分,具有抗菌消炎、提高免疫力、抗肿瘤、抗辐射等多种生物活性。在细胞及分子水平探究10-
绿豆(Vigna radiata L.)是重要的粮食经济作物,不仅营养丰富,而且还具有药用功效,广受世界人民青睐。在世界热带、亚热带地区广泛栽培,中国是绿豆的主产国,播种面积和产量居世界前列,黑龙江省是我国绿豆主产区之一。为了解黑龙江省主产区绿豆中铅(Pb)、镉(Cd)、铬(Cr)、砷(As)四种重金属的分布情况,2019年,采集黑龙江省绿豆四个主产区分枝期、花荚期和成熟期三个时期绿豆植株样品及其