论文部分内容阅读
在实际问题中,经常会碰到海量数据或者样本点较少,自变量较多的数据。对此可以利用递阶偏最小二乘回归来建立线性模型。但是一个直接的问题是如何对自变量进行分组。由此提出了基于聚类分析的递阶偏最小二乘回归方法,在对解释变量分组时引入聚类分析。通过对长江宜昌段水沙观测数据作实证分析后发现,基于聚类分析的递阶偏最小二乘回归方法是有效可行的,而且用该方法建立的回归模型比一般的偏最小二乘回归模型拟合能力更强。