基于差异性的神经网络集成及其应用研究

来源 :北京交通大学 | 被引量 : 0次 | 上传用户:hzfeng163
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
集成学习已经成为机器学习的重要研究方向之一,它可以显著地提高学习系统的泛化性能,特别是对于不稳定的学习算法效果更加明显,例如神经网络与决策树。通常,使用泛化误差来度量一个学习算法的泛化性能,泛化误差越小,学习算法的性能越好。为了进一步提高集成学习的泛化性能,Krogh与Hansen提出,当集成中的神经网络彼此不同(差异性)且具有较高的正确率,集成学习的泛化性能将会得到提高。然而,构造满足这些条件的神经网络并不是一件易事,因此很多学者投入到了这个问题的研究之中并提出了许多集成学习方法。 本文针对神经网络集成中存在的问题,在对当前集成学习方法进行深入细致的分析,并对它们各自的特点及优缺点有了充分认识的基础上,对神经网络集成中的一些关键问题进行了研究,主要研究内容有: (1)提出了一种基于聚类技术的回归型神经网络集成算法。针对回归问题,使用神经网络训练方法生成许多神经网络模型;对于这些模型,通过定义模型间的距离,并采用聚类技术研究了这些模型的相关性,应用这种方法不仅可以去除一些相关的神经网络模型,而且在一定程度上还可以确定神经网络集成的规模。另外,我们也研究了不同集成方法的性能、集成的正确率与集成规模间的关系。实验结果表明,这种集成方法优于传统的集成算法。 (2)提出了一种用于提高神经网络分类器集成差异性的学习方法。在许多集成方法中,例如Bagging与Boosting,当训练集规模较小时,神经网络模型间的差异会逐渐减小,因此集成学习的效果很不明显,甚至还低于单个模型的学习。针对这种情况,本文从提高神经网络差异性的角度出发,研究了小样本数据集上的神经网络集成,提出了一种用于提高神经网络集成差异性的学习方法。实验结果表明,这种方法的泛化性能在小规模数据集优于bagging与boosting技术,而且在大规模数据集上也与这两种技术相媲美。 (3)提出了基于复突触神经网络的模糊聚类算法与聚类集成算法。在分析了Wei提出的聚类算法并指出这种方法存在的缺陷后,提出了一种改进的基于复突触神经网络的模糊聚类算法,实验研究了算法的性能问题;为了减少神经网络学习算法陷入局部最优的可能,进一步提高复突触神经网络聚类解的鲁棒性及稳定性,我们也研究了集成技术用于无监督聚类并提出了聚类集成的一般算法。实验结果表明,通过聚类集成可以获得更稳定的聚类解。 (4)研究了基于神经网络集成的入侵检测。入侵检测是指对入侵行为的发现,通过在计算机网络或计算机系统中的若干关键点收集信息并对收集到的信息进行分析,从而判断网络或系统中是否有违反安全策略的行为和被攻击的迹象。在文中,通过对网络连接数据的深入分析和研究,提出了基于神经网络集成的入侵检测方法,实验研究了不同的神经网络集成技术在入侵检测系统上的性能。
其他文献
现代计算机应用系统中,软件的地位日益重要和突出。在计算机应用领域的不断拓展和深入的过程中,对软件产品的数量、种类、功能、性能的需求在不断攀升。如何满足日益增长的软件
计算流体力学(Computational Fluid Dynamics,CFD)作为一种强有力的计算分析工具,已经广泛应用到航空、航天、气象、船舶、武器装备等领域。随着其向高精度、大规模、高时效
很多资料显示,现在的网站存在许多严重的可用性问题,通过进行收集网站的可用性问题对网站的改进具有非常重要的意义。由于网站往往非常庞大,而且网站的用户数量又非常多,进行
农业信息服务对我国农业现代化建设至关重要。论文在分析现有农业信息服务现状的基础上,提出农业信息服务是一个系统工程,应站在信息技术的前沿,充分利用现有信息技术,利用网
  本文介绍了网上评教及联机分析系统的设计和实现,通过在系统中的具体应用和实践,对联机分析处理技术(OLAP)进行了深入的研究和探索,实现了基于Web的联机分析系统,并对OLAM技
企业员工、在校学生利用Internet在工作、学习时间进行大量与工作和学习无关的行为已经成为影响企业生产、学校教学不容忽视的负面问题。政府、企业、学校等单位都提出了对用
随着家用纺织品(以下简称家纺)行业信息化的深入和电子商务的广泛应用,人们从单纯关注交易本身转向关注商务全过程,这将涉及整个供应链上各方业务之间的协作,面向家用纺织品
  本文对网络对抗领域中网络主动攻击技术进行深入研究,首先分析了相关课题的研究背景,并针对当前该领域国内外研究的现状和发展趋势进行了分析。  论文接着从网络攻击层次
随着数字设备的普及和网络的飞速发展,当今世界已经成为数据的世界,数据存储系统面临着极大的挑战。当前应用不仅需要更大的存储容量,在延迟、带宽、可靠性、能耗等方面也对
在公安刑侦及法庭判案领域中,数字图像作为重要的证据,其真实性和完整性 直接影响到执法结果。随着数字图像处理技术的快速发展,对数字图像进行处理 修改变得越来越容易,处