多核集成学习方法的研究

来源 :电子科技大学 | 被引量 : 3次 | 上传用户:itolbaxk
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近年来,多核学习(Multiple Kernel Learning,MKL)在机器学习领域受到广泛关注,是一种很有前景的数据挖掘方法。它主要利用多个核函数的线性组合去解决数据异构或不规则、样本不平坦分布等具有挑战性的问题。传统多核学习方法通常把求解多个核函数的线性组合看作优化问题,再重点研究优化算法,以达到更好的效率及精度,但计算量大、不容易收敛仍然是传统多核学习方法的主要缺点。Hao Xia与Steven Hoi创造性地提出了多核集成学习框架(Multiple Kernel Boosting,MKBoost),将AdaBoost的思想运用到多核学习中,巧妙地避开了复杂的优化问题,从而大大提高了算法效率,但由于AdaBoost算法对噪声数据敏感,所以MKBoost算法不能有效地处理被噪声污染的数据集,鲁棒性较差。为了克服MKBoost算法在含有噪声的数据集中出现过拟合的难题,本文提出了两种新的多核集成学习算法,即基于噪声探测函数(noise-based MKBoost,NDMKB)与基于噪声概率(noise-probability MKBoost,NP-MKB)的多核学习方法,新算法主要有两方面具体内容:第一:噪声的识别。首先根据样本邻域信息,使用k最近邻法进行噪声初步探测,越多邻域样本被错误分类,该样本是噪声的概率越大,反之该样本是正常样本的概率越大。ND-MKB算法将k最近邻法的探测结果二值化处理,即{-1,+1},NP-MKB算法利用logistic回归模型函数将初步探测结果映射到[0,1]区间,得到样本是噪声的概率。第二:新的多核集成学习方法的提出。AdaBoost算法中,无论是其损失函数还是样本权值的更新,均只关注分类正确与否,要提高AdaBoost的抗噪性,就有必要区别对待噪声样本与正常样本。本文分别基于噪声探测函数与噪声概率函数提出了两种新的损失函数,并利用前向分布算法进行算法推导。ND-MKB与NPMKB算法都充分考虑了样本的噪声性质对算法的影响,所以抗噪性和鲁棒性比传统多核集成学习算法更好。
其他文献
凝固血液于无菌条件下发生自发性溶解的現象称为纤維蛋白溶解(fibrinolysis以下簡称纤溶)。这名称是1893年Dastre氏提出的。近年来Roseman、MacFarlane氏等証明这种現象是血
恶性网状细胞增多症(简称“恶网”)一般治疗无明显效果,预后恶劣。我院应用江西省杀癌七号法,加激素及小剂量环磷酰胺,使二例恶性网状细胞增多症获得缓解。特 Malignant re
随着外资在我国啤酒业并购规模的日益扩大、市场份额的不断增加,其在行业竞争中的作用日益凸现,这是否会造成我国啤酒业市场垄断引起了学术界的高度重视,并且研究外资并购对我国
旨在推进因特网安全的非营利组织Wired Safety公布的调查结果显示:“在美国,通过因特网进行盯梢的 在线盯梢者正不断增加。” 首次由Wired Safety实施的调查表明,受害者大多为女性,但同时女性盯梢者也越来越多。另外,由儿童盯梢其他儿
期刊
自从La Porta,Andrei Shleifer等人(1998)在研究捷克企业控股股东侵占小股东利益时提出隧道行为以来,很多学者从不同的角度对这一命题进行了研究。近年的分析指出控股股东的隧
为探讨不同断层走向下隧道在地震作用时的响应规律及破坏机理,开展了振动台模型试验及数值分析,研究了隧道的加速度反应、动应变及围岩动土压力的变化规律和隧道的动态破坏形
糯米饭团1108  在中國,3岁的小朋友还在享受太子节的生活,而他的父母却在为他将来能不能进“國子监”而担心,正在积极给他报名各类亲子早教班。蔡艾明  我现在想的是怎么能让我家“小饭团”远离那些有毒食品,以后则要考虑培养他不被骗子忽悠、不被流氓欺辱的能力——这算是有中國特色的生存训练方式。    JqIala  在中國,孩子3岁也可以上幼儿园。他们会学英语,准备高考;会学舞蹈,准备上艺校;会学深奥
准确的血压值,对診断具有重要的意义。然而,如何正确地进行血压測量和对所測之值作出正确的判断,却并非易事。因为每次所测之血压值受各种因素影响波动較大,下面就个人的体
泰科电子是业界著名的无源器件供应商,是无线、有源光纤及完整的电源系统尖端科技方面的技术领先者。在第三届2004慕尼黑上海电子展上,泰科电子总裁Jürgen Gromer表示,中国
随着中国“走出去”战略的推进,近年来中国对外直接投资保持了持续快速增长的态势,2010年中国对外直接投资净额已经由2003年的28.5亿美元迅速增长到了688.1亿美元,截至2010年底,