具有Fisher一致性的代价敏感Boosting算法

来源 :软件学报 | 被引量 : 0次 | 上传用户:hsmk888
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
AdaBoost是一种重要的集成学习元算法,算法最核心的特性"Boosting"也是解决代价敏感学习问题的有效方法.然而,各种代价敏感Boosting算法,如AdaCost、AdaC系列算法、CSB系列算法等采用启发式策略,向AdaBoost算法的加权投票因子计算公式或权值调整策略中加入代价参数,迫使算法聚焦于高代价样本.然而,这些启发式策略没有经过理论分析的验证,对原算法的调整破坏了AdaBoost算法最重要的Boosting特性。AdaBoost算法收敛于贝叶斯决策,与之相比,这些代价敏感Boosting并不能收敛到代价敏感的贝叶斯决策.针对这一问题,研究严格遵循Boosting理论框架的代价敏感Boosting算法.首先,对分类间隔的指数损失函数以及Logit损失函数进行代价敏感改造,可以证明新的损失函数具有代价意义下的Fisher一致性,在理想情况下,优化这些损失函数最终收敛到代价敏感贝叶斯决策;其次,在Boosting框架下使用函数空间梯度下降方法优化新的损失函数得到算法AsyB以及AsyBL.二维高斯人工数据上的实验结果表明,与现有代价敏感Boosting算法相比,AsyB和AsyBL算法能够有效逼近代价敏感贝叶斯决策;UCI数据集上的测试结果也进一步验证了AsyB以及AsyBL算法能够生成有更低错分类代价的代价敏感分类器,并且错分类代价随迭代呈指数下降.
其他文献
在火器性颅脑盲管伤中,部分伤员因金属异物停留在脑深部或功能区[1,2],给手术取除带来困难.我们在临床实践中设计了一套徒手逐步定位法,对颅内异物多方灵活定位,配合磁性导针
颅内动静脉畸形(AVM)的栓塞治疗是现代微侵袭神经外科对该病综合治疗的重要手段之一.我院近期对10例AVM病人实施了栓塞治疗,总结如下:
顺义区现有3个街道办事处、19个镇,426个行政村,常住人口71.8万人,户籍人口56.2万人,农业人口33.87万人。2006年,全区实现地区生产总值293.8亿元,人均GDP5216.7美元,属地财税收入92.
目的 总结22例电解可脱性弹簧圈(Guglielmi detachable coil,GDC)超早期栓塞颅内破裂囊性动脉瘤的经验。方法 女14例,男8例,年龄40 ̄85岁,平均62岁。均以自发性蛛网膜下腔出血急诊入院手术,按HESS-HUNT分级Ⅲ级9例,Ⅳ级13例。基底动脉
期刊
改革开放以来,随着浦江县经济的发展,吸引了大量的非户籍人口(在浦江县居住,但户籍不在浦江县的人口)。非户籍人群成为在各城镇和农村广泛存在并且不断扩大的一个群体,但是与本地
关于税负转嫁理论研究的几个误区周国良税负转嫁理论是由西方经济学家创立的,我国关于税负转嫁问题的引进和理论研究是改革开放以后的事情,期间在全国系统介绍西方税负转嫁理论
服务发现是面向服务的网络软件开发过程的关键阶段,同时也是影响服务组合效率的关键因素。针对当前服务发现自动化程度低下、准确性不高的现状,从两个方面提高服务组合效率:首先