平均分布集成策略:一种新的分类器融合方法

来源 :天津工业大学 | 被引量 : 0次 | 上传用户:b188413920
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
机器学习的核心目标之一是让机器具有像智能生物一样的自主学习的能力。时至今日,机器学习已经成为人工智能领域的核心研究内容,其应用遍及人工智能的各研究方向,包括专家系统、自动推理、自然语言处理、模式识别、计算机视觉等。在机器学习的各分支中,集成学习一直是一个主流的研究方向,在过去二十年中有了显著的发展。集成学习通过学习若干个有差异的基分类器,并将它们的分类预测结果进行融合作为最终的结果。与单个分类器相比,集成学习在大多数情况下可以显著提高分类系统的泛化能力,并且具有更强的健壮性和稳定性。分类器融合是集成学习中的一个核心问题,研究者已提出多种不同的分类器融合方法。本文对集成学习进行了较为深入的研究,介绍了集成学习的概念、构成、作用以及最新研究成果。在此基础上,本文提出了分类器平均分布的概念,即通过调整基分类器的权重,使它们在不同样本上的表现尽可能的平均。这种策略为那些只被少数分类器正确预测的样本提供了机会。此外,本文提出了分类器等价系数的概念,即如何衡量两个准确率不同的分类器在集成学习中的权重。通过严格的十折叠交叉检验,在12个UCI数据集上的实验表明,平均分布集成算法优于简单多数投票策略、LP-Adaboost算法和LP1算法。因此,我们认为平均分布集成策略是一种有效的分类器融合方法。
其他文献
无线传感器网络常常被布置在极端恶劣的环境中,敌对者很容易能够捕获其中的一个或多个传感器节点。一旦传感器节点被捕获,攻击者可以通过逆向技术来重编译这些节点并且复制出
随着计算机网络的快速发展和安全性分析方法研究的深入,基于安全评估模型的评估方法被不断提出。网络攻击图是分析网络安全性的一个重要手段。对网络安全策略的制定具有重要
随着网络带宽的增长和图像技术的发展,Web上图像资源变得越来越丰富,形成一个海量的图像资源库。Web图像检索致力于解决从这个海量的图像资源库中,帮助用户快速地、准确地检
目前我国各高校普遍采用学分制或带有过渡性质的学年学分制管理。选课制作为学分制的灵魂,需要有与之相适应的选课管理系统加以辅助。教学管理同样也需要根据学校的资源情况、
随着多媒体技术和网络技术的飞速发展和广泛应用,对图像、音频、视频等内容的知识产权保护成为迫切需要解决的问题。加密和拷贝保护机制不能完全解决这一问题:加密只在传输过
在计算机信息网络技术的促进下,集散控制系统DCS的全范围仿真正在向所谓“虚拟”技术方向发展。在火力发电仿真平台的设计开发中,虚拟DCS技术以接近激励DCS的逼真度、接近仿
随着计算机科学的发展,人脸识别技术受到越来越多的重视。今年来,在本领域中出现了一些新的方法和工具,其中最具有实用价值的就是Intel提出的AdaBoost算法。本文对此算法进行
近年来网络技术和通信技术得到了快速发展,同时家电设备的网络化和智能化的需求越来越大。传统家电设备只能通过设备上的控制面板进行控制,这种控制方式在空间上有很大的限制;而
随着Internet高速发展,信息量呈现爆炸式增长,大量多媒体被应用到我们的经济、社会、教育、通信、医疗、咨询服务和日常生活中。但是,面对信息量的迅速增长,传统的多媒体管理
近几年来,虚拟现实技术的应用与研究得到了迅速的发展,在许多领域都具有广泛的应用前景,虚拟现实技术日渐成为计算机应用技术发展的主要研究方向之一。通常传统的工业钢结构