协同学习算法的研究及应用

来源 :西安电子科技大学 | 被引量 : 0次 | 上传用户:zqzhang_1011
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在机器学习领域,人们能以低成本获取海量的未标记样本,但获取已标记样本却较为困难,甚至需要专业的人员与设备对样本进行标记。半监督学习可在少量已标记样本的指导下,充分利用未标记样本来获得性能良好的分类器,已逐渐成为国内外研究的一个热点问题。协同学习作为半监督学习的重要分支之一,已取得了诸多的研究成果。对于协同学习算法,通常使用少量的已标记样本训练出两个或多个基分类器,在迭代学习过程中,每个分类器可利用其他的分类器对未标记样本的预测结果扩展训练样本集,从而使分类器性能不断提高。但是,当已标记样本较少时,基分类器的初始性能往往较弱,预测时容易对未标记样本赋予错误的标记,进而影响算法的最终精度。针对上述问题,本文以提高基分类器初始性能与改进未标记样本的选择策略为切入点,对协同学习算法进行改进,并应用于侧信道攻击领域,取得了良好效果。本文的主要成果包括:1.针对协同学习算法基分类器初始性能较弱的问题,本文结合局部与全局一致性(LLGC)算法,提出了基于LLGC的协同学习算法,并根据基分类器的不同,算法可分为Co-LLSVM算法和Co-LLRF算法。该算法充分发挥了LLGC算法利用少量已标记样本精确预测未标记样本类别的特点,为基分类器的训练提供了大量带有标记的样本,提高了分类器的初始分类精度,从而通过迭代使分类器性能不断提高。算法利用公共的数据集7-sectors进行实验,结果表明在已标记样本数较少时Co-LLSVM、Co-LLRF相比于标准协同学习算法具有更好的性能,并且Co-LLRF在处理噪声样本问题时比Co-LLSVM具有更好的效果。2.为了提高协同学习算法选择未标记样本的能力,本文对Co-training算法选择未标记样本的策略进行改进,并将改进的算法应用到侧信道攻击领域。该算法在使用阈值处理置信度的同时,结合Tri-training投票判定置信度的方法共同完成未标记样本的选取,增强了所选样本的可信度,从而使分类器性能得以提高。通过对数据集DPA contest V4进行攻击实验,结果表明该算法比标准协同学习算法和单纯的监督学习算法的正确率更高。
其他文献
大众化教育时代,由于学业困难的学生与日俱增,大学生学业预警机制现已成为高校教学管理的重要组成部分,它符合国家、学校、学生本人的发展需要。文章从构建大学生学业机制的
目的探究人性化护理在宫颈炎护理中的应用。方法选取宫颈炎患者100例,随机分为实验组以及对照组,实验组50例宫颈炎给予人性化护理,对照组50例宫颈炎患者实施常规护理。对两组
民俗既影响作家的创作,又构成创作的内容本身。胶东新时期以来的乡土题材小说造就出的文学"胶东"中,民俗书写构成了小说的审美风格和美学价值。特定的民俗形式、特定的民生内
本实验采集的屠宰绵羊卵母细胞分两批。一批分别以10-15℃。20-25℃,30-35℃运输;另一批分别采用16-18h,20-22h,24-26h,28-30h的体外成熟时间进行实验。卵母细胞由长距离运输运回
略论《艰难时世》的感情观点尹德翔众所周知,《艰难时世》是狄更斯的一部“工业小说”,它猛烈批判了在英国流行一时的功利主义和政治经济学。但是这种批判只是《艰难时世》的出
现代语言学之父索绪尔(Ferdinand de Saussure,1916)指出语言学是符号学的一部分,语言是一个特殊的符号系统。通过语言学的角度,运用他提出的能指与所指、横组合与纵聚合二元
中国农村金融在供需层面上,一直存在着不协调不匹配的现象,究其原因为内生金融不足导致。随着"互联网+价值链"金融模式的兴起,必然会扭转这种不匹配状况。由于其形成于竞争环
胡锦涛同志作的党的十八大报告提出的八个要求,将"坚持人民主体地位"放在首位,突出了以人为本的主题,它从政治、经济、文化等方面阐释了"坚持人民主体地位"的丰富内涵,始终坚
自明性作为一个重要的现象学概念,同样也为我们提供了一个研究哲学史的全新视野。通过从宏观层面对康德哲学思想进行考察,可以清晰地看到康德将自明的确定性寓于人的主体行为
目的观察治咳川贝枇杷滴丸对社区获得性肺炎的辅助治疗效果。方法 60例社区获得性肺炎患者,均经临床及影像确诊,随机分为对照组和治疗组,每组均30例。两组患者基线水平无统计