论文部分内容阅读
近红外光谱分析技术是一种快捷高效、对样品不造成破坏、间接测量分析技术,已经广泛用于是石油化工、食品医药等行业。光谱分析的关键在于利用测量的样本光谱信息与样本目标含量的标准测量值或者类别建立一个合适的数学模型,用来对未知样本进行分析预测。化学计量学是光谱分析的主要数学工具,其中包括了校正集验证集选择、数据预处理、定量定性模型建立以及模型传递等主要的方法。本文在以上的化学计量学的方法基础上,分别对校正集验证集选择与定性模型建立法进行了研究,并取得一定的研究成果。校正集和验证集样本的选择对光谱多元分析校正至关重要。然而由于实际因素的限制,很多时候收集到的样本在性质区间内分布并不均匀,本课题探究了不均匀样本对于建模结果的影响,并且在现有的方法上提出了一种新的方法,即Rank-KS方法。该方法能够在光谱空间和性质空间综合考虑,使选择参与建模的样本尽量分布均匀。通过计算实验表明,对于中间局部样本多和两端局部样本少,或者中间局部样本少,或者局部区域没有样本的样本集,使用Rank-KS方法可以大幅度提高校正集和验证集分布的均匀性,无论使用多元线性回归(MLR)还是偏最小二乘(PLS),均能明显改善其模型的预测能力。定性分析技术是近红外光谱技术的一个重要领域,在很多情况下只需要对未知样本进行类别的判断,并不需要知道含量或者组分信息,即对近红外光谱进行模式识别,而其中最重要的就是对原始光谱数据进行特征提取。本研究分析了目前在近红外光谱分析领域中进行特征提取的最常用方法---Principal Component Analysis(PCA)的不足,并且介绍了一种新的定性模型建立方法----基于监督模式识别KL变换的光谱定性分析方法,其充分利用样本分类信息提取特征,包括在类平均向量中和类中心化特征向量中分类信息的提取。对竹、棉、麻浆三种纤维样本,利用基于PCA特征提取的SIMCA和LS-SVM进行定性模型建立,并与本文提出的算法进行比较,实验结果表明,本文方法最优,其验证集样本全部正确分类。所以在近红外光谱定性模型建立中,基于监督模式识别KL变换定性分析是一种简单有效的定性模型建立方法。