【摘 要】
:
半监督学习是近年来提出的一种新的学习方法,根据学习目的的不同大致可以分为半监督分类和半监督聚类。其主要思想是在已标记训练数据集较少的情况下,如何结合大量的未标记数
论文部分内容阅读
半监督学习是近年来提出的一种新的学习方法,根据学习目的的不同大致可以分为半监督分类和半监督聚类。其主要思想是在已标记训练数据集较少的情况下,如何结合大量的未标记数据来改善学习性能。本文探讨的是半监督分类。主要针对半监督分类算法中典型的自训练分类算法进行了大量的研究与分析。针对自训练分类模型在初始阶段已标记训练集较少的情况,训练得到的分类器性能不高的事实,进行了适当的改进。即在自训练分类模型中引入了基于最近邻规则的数据剪辑技术,试图辨别出在训练过程和分类过程中引入的误标记数据从而起到净化训练集的目的。在训练的迭代过程中使用该技术,辨别和清除噪音,净化训练集,提高分类准确率。本文的实验数据集采用UCI机器学习库中随机抽取的数据集。实验结果表明,引入该数据剪辑技术后的分类模型相对于原模型在分类准确率上有不同程度的提高,经过对实验数据进行分析总结,平均分类准确率提高了6.705%。本文还针对Tri-Training分类模型分类能力的局限性,进行了适当的改进。使用了一种基于不同分类器之间相互合作,利用投票选举的方式对未标记数据进行标记的模型。该模型针对传统的由Zhou等人提出的Tri-Training分类模型利用相同分类器之间相互合作,投票选举的方式给出了改进模型。在基于不同分类器相互合作的同时,如同自训练分类模型的改进,同样引用了基于最近邻规则的数据剪辑技术,该技术旨在减少噪音数据净化训练集。实验数据集同样来自UCI机器学习库中随机抽取的数据集。通过实验表明,改进后的模型相对原模型在分类精度上有不同程度的改进,经过对实验数据进行分析总结,分类准确率有不同程度的提高。
其他文献
随着移动技术和无线网络的快速发展以及3G时代的来临,移动商务应用形式开始显示其多样化并更好地贴近人们的生活,越来越多的消费者开始接触并进行移动商务活动。在经过一系列
老师们都知道,文体教学在现代语文教学中处于非常重要的位置,很长一段时间内,语文教材就是根“据记叙文“”、议论文”“、说明文”“和应用文”来编排的,称之为“文体结构”
《物理课程标准》要求,物理课程应改变过分强调知识传承的倾向,让学生经历科学探究过程,学习科学探究方法,培养学生的探索精神、实践能力以及创新意识。目前,初中物理教学中
针对新时期企业职工思想政治教育中出现的新问题,应借鉴心理疏导的方法对企业职工思想政治教育的方法进行创新。心理疏导与企业职工思想政治教育都关注人,运用心理疏导创新企
法始终是关注行为的规范体系。在“无行为就无犯罪”的格言意义上,实行行为是构成一切犯罪的基底,刑法评价功能都是围绕着实行行为而展开。作为犯罪构成理论视野中的行为,在
原始时期的灵石崇拜信仰到秦汉时期发展为"灵石镇宅"习俗,在史游的《急就章》里面对灵石镇宅习俗的总结使得"石敢当"这一术语被广为接受使用。随着泰山在官方祭祀系统中地位
由于师范生是教师队伍主力后备军,所以针对师范生的教学工作一直以来都是教育工作者关注的重点。而泛在学习作为一种新型学习模式,对于师范生教育技术能力培养有着非常显著的
复合材料相对均质材料具有高比强度、高比模量,良好的抗疲劳性,优异的减震性,独特的各向异性,方便的可设计性使得它越来越多的应用于航天航空工业、汽车制造业、军事工业等各
一系列关于泰山石敢当的传说既是对泰山石敢当信仰的诠释,又是民众心理的自然流露。对其传说进行解读,把握泰山石敢当信仰时间上的流传与空间上的扩布,这将更有助于探究泰山
由心理学理论到理论心理学的转变,既是心理科学的发展历程,也是学科不断完善的标志。理论心理学的兴起不仅表明了心理学理论更迭时代的结束,更预示着学科统一的到来。要想科学地