论文部分内容阅读
偏最小二乘回归(Partial Least Squares Regression,简记为PLSR)是一种先进的多元统计分析方法,主要用来解决多元回归分析中变量之间存在的多重相关性问题。由于它集多元线性回归分析,主成份分析和典型相关分析的基本功能为一体,因此在国外被誉为第二代多元统计分析方法,被广泛应用于工业设计、计量化学、计量经济学等诸多领域。
偏最小二乘回归分单因变量偏最小二乘回归和多因变量偏最小二乘回归两种情况。本文针对单因变量偏最小二乘回归的理论与方法进行了以下的探讨与研究:
在已有文献的基础上,对偏最小二乘回归的基本理论、性质进行了整理、扩充;对偏最小二乘回归及普通最小二乘回归(Ordinary Least Squares Regression简记为OLSR)、主成分回归(Principal Component Regression简记为PCR)方法进行了系统的比较:对偏最小二乘回归理论做了进一步探讨:从理论与实例两方面分析了哪类数据不适合直接用偏最小二乘回归处理的原因,提出一种改进方法,并给予实例验证:针对偏虽小二乘回归模型中仍包含所有原始自变量的情况,探讨了筛选偏最小二乘回归模型中原始自变量的问题。
本文的特色主要体现在以下三个方面:
(1)通过实例说明了偏最小二乘回归能够有效地对多变量系统中的信息进行辨识和筛选,并对偏最小二乘回归及普通最小二乘回归、主成分回归方法从理论及实际建模两方面做了系统的比较分析;
(2)对不适合用偏最小二乘回归直接处理的数据,提出先尽量剔除其中与响应变量无关的信息,然后利用剩余信息进行偏最小二乘回归建模,并辅以实例说明该方法的可行性。
(3)本文提出一种基于拟合误差筛选偏最小二乘回归模型中原始自变量的方法,给出了筛选原理及准则。应用该方法建立预测某地区火灾发生频数的模型,结果表明,该方法不仅能简化模型、提高模型的预测精度,还能选出对火灾频数影响较大的因素,具有实用价值。