论文部分内容阅读
本文的主要研究方向是当使用以偏最小二乘回归模型和逐步回归为代表的传统回归方法建立数学模型的过程中,因为数据量无法达到过大数量且所含信息复杂,传统方法受困于其算法的局限性,导致预测结果的准确性会因为建模过程中自变量之间的多重相关性而受到影响,依此提出一种新型的多元数据分析统计方式——偏最小二乘回归(partial least-squares regression,下文中简称PLSR),经过验证该方法能够明显解决由于实验样本数量少,样本数据参数数据复杂所带来的模型预测准确性问题。本文在第一章首先介绍以最小二乘回归为例的数据模型在操作数据量小且参数过多问题时遇到的困难。第二章主要介绍传统的偏最小二乘回归模型的建模方式以及相应的公式推导,同时解释其他算法所遇到的多重相关性问题,以及主要的多重相关性检查方法,依此作为选用偏最小二乘回归模型的重要因素。第三章提出应用传统PLSR方法建模时可能存在的问题,并且提出自己的改进策略,对参数以正交投影的方式进行处理,通过这种方法可以在建模初期有效的处理相关参数以去除之中的冗余信息,从而有效的提升模型的准确性。第四章基于在工业环境下,BOXA型X荧光品味分析仪在预测矿浆中元素含量存在一定误差的背景下,提出应用改进的PLSR方法,用matlab对实验模型进行程序设计,同时依据图谱分析仪获取对应锌精矿浆中Pb元素的波段图,以及对应的实验室真实值,建立了对应Pb含量预测的数学模型,并且同时将数据代入其他对比模型,主要评估和对比模型对应的绝对误差和相对误差,依此论证改进的PLSR在此问题的应用过程中确实起到了减小误差的作用。第五章结合总结自身的改进算法同时针对算法提出相应的发展展望。本文的主要创新点有两个:1.提出了应用正交投影的方式处理建模过程中需要用到的参数数据,以减少其因为相互影响而造成的冗余信息。2.将提出的方法应用于实际生产环境,以起到提高生产效率,节省相应的人工成本额经济开销。