基于集成学习模式的Boost-SVM算法研究

被引量 : 0次 | 上传用户:bird2000
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
集成学习是一种新的机器学习范式,它使用多个学习器来解决同一个问题,能够显著地提高学习系统的泛化能力,因此从20世纪90年代开始,集成学习逐渐成为了机器学习领域的一个新的热点。在实际分类问题中,为了减少损失和失误的概率,往往会对分类方法提出更高的要求,使其达到尽可能高的分类精确率,例如,行星探测、地震波分析、Web信息过滤、生物特征识别、计算机辅助医疗诊断等一些需要精确分类的实际项目。集成学习方法目前还不能满足这样的高精度要求。基于此类现实问题的考虑,本文提出了一种新的集成学习方法,为其注入了新鲜血液,将具备强学习能力的支持向量机方法运用于集成学习模式当中,称之为Boost-SVM算法,以期得到更高的分类精确率。选用支持向量机(Support Vector Machines,简称SVM)作为分量学习机,作为基于统计学习理论发展起来的分类方法,它解决了模型选择与过学习、非线性和维数灾难问题、局部极小点等问题。Boost-SVM算法实质上是通过重点训练容易被分类器错误分类的样本来减少错误分类率。影响学习机分类效果的正是这部分被错误分类的样本,Boost-SVM重点标记错误分类的样本权值,并且在反复迭代中多次学习该类样本,以减少被错误分类的样本个数,从而达到降低错误分类率的目的。本文在LIBSVM平台上通过改造实现了Boost-SVM算法并在UCI分类数据集上进行了验证。实验结果表明Boost-SVM可以有效地提高分类精确率,并且相对于SVM结果上有了较大的提高。该方法具有可理解性强、算法易于实现等优点,并可以用来解决多类别分类问题,在解决分类问题上颇具竞争力。
其他文献
为了改善非道路用涡轮增压直喷395E柴油机的排放性能,试验研究了供油提前角、喷油器喷孔直径和启喷压力、喷油器安装倾角等喷油系统参数及燃烧室几何形状对发动机NOx和PM排放
倦怠研究一直是心理健康领域的热点问题,文章在文献资料基础上提出了我国中学生学习倦怠的概念结构,通过分析学习倦怠的内涵、特征及影响因素,提出了中学生学习倦怠的应对策
本文分析了USB通讯设备类(CDC)协议的机制与流程,着重讨论了CDC协议中的以太网控制模型(ECM)与以太网仿真模型(EEM)的框架与接口。在此基础上实现了USB虚拟以太网接口,并讨论
介绍了湿式球磨机在调试及运行过程中发生的故障和处理方法以及在操作过程中应注意的问题。
在语文课活动课的组织实施中,应始终把学生的自主性摆在第一位,让学习自主地、积极地参与,动口动脑,培养内在的动机,激发智慧的潜力,发展个性特长,推进个体的主动、和谐、全
矿产资源是一种具有准公共物品性质的产品。矿产资源开发过程中存在着两种截然相反的外部性。经济的正外部性使矿产资源开发成为一种必然和需要;其负外部性主要表现在矿产资
商业地产在我国起步虽然较晚,但发展速度相当惊人,已取得了蓬勃的发展。然而面对如此之高的发展速度,应保持清醒的头脑,不应盲目的跟进。购物中心投资巨大、投资回收慢,很容
银行卡产业发展对减少现金流通、降低交易成本、促进消费、扩大税收、促进相关产业发展等方面具有重要意义。在银行卡产业中,利益相关方主要包括支付系统、发卡行、收单行、
儿童作为一个特殊而且庞大的消费群体,在众多的家庭中占据这家庭的主要的开支。相对其他消费而言,儿童的购买食品的心理和对食品外在包装的感知能力与成人有一定的区别。因为
胶囊内窥镜是应IC(Integrated Circuit,集成电路)技术、无线通信技术、MEMS(Micro Electro-Mechanical System,微机电系统)技术的发展而在近年发展起来的微型、无创消化道检