论文部分内容阅读
集成学习算法通过训练多个弱学习算法并将其结论进行合成,可以显著地提高学习系统的泛化能力。Boosting算法作为集成学习算法的主要代表算法,得到了广泛的研究和应用,但其研究成果大部分都集中的分类问题上。 本文主要研究了Boosting回归算法。首先对以损失函数梯度下降为原理的样本无权值算法进行了阐述,并给出了一个实际问题的仿真结果。其次对按概率取样本的有权值算法进行了大量实验,实验结果显示出按概率选择样本权值算法比无权值算法的总体性能更为优秀,但其个体算法的不稳定性以及为了获得稳定结果所需要的巨大计算时间使其不可能成为一种能广泛应用的算法。针对以上两种方法的缺陷,本文提出了一种新的按概率取样本的改进算法。仿真结果显示,改进算法比前两种算法的性能都要优秀。算法的计算时间和算法的精度相关,因此在实际应用中可以通过平衡算法性能和计算时间来获得需要的结果。最后,对改进算法所表现出来的不足,本文提出了一种结合无权值算法的方法,虽然这个算法的最终计算结果相比改进算法在性能上没有太大的提高,但是它能在开始的迭代中加快改进算法的收敛速度。 本文阐述了环境检测的重要性和软测量水质分析仪的必要性。介绍了一个以紫外光谱分析为原理多参数水质分析仪。详细说明了系统的测量原理、硬件结构、软件功能与所采用的智能计算方法。并将前面提出的改进算法应用到它的智能分析模型中。通过对一批水质COD数据进行的实验仿真,并将其结果和一些常用的回归方法作了比较,证明了集成学习Boosting回归算法对各种实际问题的有效性和适应性。