论文部分内容阅读
学习方法的泛化能力、学习效率和易用性是机器学习及其应用过程中所面临三个关键性问题。神经网络集成学习通过训练多个神经网络并将其结果进行合成,显著地提高了系统的泛化能力,成为近年来机器学习领域一个重要研究方向。本文在众多的方法中选取了粒子群算法和BP神经网络算法以及神经网络集成算法进行研究。粒子群算法具有参数少,计算简便等优点,因此它在优化BP神经网络领域拥有巨大的应用前景。本文通过对现有算法的深入分析和研究,结合数据的特点,提出了相应的改进算法,并采用冠心病数据与UCI数据进行测试,取得了较好的效果。本文的主要工作分为以下几个方面:(1)提出了一种确定BP网络隐层结点数目的有效方法。BP网络的隐层结点数目一直是研究BP神经网络的一个难题,到目前为止仍然没有一个明确的公式能将其计算出来。本文通过特殊的编码方式,利用具有全局搜索能力的粒子群算法来对BP网络的隐层结点数目及网络的权值和阈值同时进行优化。实验证明,这种网络的训练方式,不仅能在权值和阈值的调整过程中确定隐层结点的数目,还能进一步提高网络的学习能力。(2)首次利用带有优化隐层结点数目的粒子群神经网络作神经网络集成学习。神经网络集成的一个重要条件就是构成集成的个体网络之间要有足够的差异性。由于带有优化隐层结点数目的粒子群神经网络可以在网络的训练过程中动态的寻找到隐层结点数目与网络权值和阈值的最佳组合,不同初始状态下的权值和阈值将对应不同的隐层结点个数,这就使得个体网络之间更具多样性。对带有优化隐层结点数目的粒子群神经网络进行集成,将进一步提高网络的泛化能力。(3)分析了冠心病诊疗的现有方法,并将集成的带有优化隐层结点数目的粒子群神经网络应用于冠心病的诊疗过程中。通过对北京西苑医院等四家医疗机构的临床采集数据的分析与挖掘,证明带有优化隐层结点数目的粒子群神经网络集成可以应用于冠心病的诊疗中。