基于图模型的半监督SVM分类算法研究与应用

被引量 : 0次 | 上传用户:gaoyueeryubing
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
支持向量机算法是在结构风险最小化基础上发展起来的,它避免了以往神经网络学习过程中出现的过拟合、易陷入局部极值和维数灾难等诸多问题,目前在许多领域得到了很好的运用。经典的支持向量机算法是分类算法中发展较早的一个,但是它对标识样本的数量有较强的依赖性,然而在实际工作中,由于标识样本的代价较大,因此只有少数样本是被标识的,大多数是未标识的。现如今,一种新颖的半监督学习算法,因其能够将已标识和未标识样本提供的聚类信息有机结合起来,与已往的监督分类算法相比,对标识样本的数量要求不高,而且在实际运用中获得了更好的效果,因为这个优势,这种半监督学习方法吸引了越来越多研究者的眼球。当前对半监督支持向量机算法的改进主要集中在利用一些约束函数将未标识样本的信息加入到优化过程中,但这种模拟在不同程度上都存在对噪声过于敏感和本身算法的优化难题。从处理这些问题的角度出发,本文提出一种基于两阶段学习的半监督支持向量机分类算法,利用图模型给未标识样本赋予伪标识,接着为了削弱噪声样本的影响,采用k近邻图去除噪声样本,然后将标识样本和伪标识样本作为整个训练样本集,运用SVM算法进行训练学习,使得SVM算法在训练时能充分利用未标识样本带来的结构信息,提高分类器的分类精度。同时本文从构建图模型的角度出发,还提出了一种基于高斯混合模型核的半监督支持向量机分类算法。通过构造高斯混合模型核向SVM分类器提供未标识样本信息,使得SVM算法在学习标识样本信息的同时,兼顾着整个训练样本集合的聚类假设。结果证明本文提出的两种算法在拥有较少标标识样本训练的情况下分类性能也有所提高且具有较高的可靠性。本课题首先在理论上对本文提出的两阶段学习模型和高斯混合模型的可行性进行论证,然后利用人工合成样本集和UCI样本集分别对两种算法的分类性能进行测试,并与已有的半监督支持向量机算法进行实验比较,验证了本文所提模型的优势。本课题还利用两阶段学习模型算法对轴承故障样本集进行检测性能测试,实验结果表明该模型的检测性能较其他几种算法好,并测试算法中重要参数对算法性能的影响。
其他文献
科技的进步,互联网的普及,给我们的和活带来了便利。但同时,互联网普及也带给了我们不利的一面。面对着网络中出现的这些问题,我们都做了哪方面的研究?本文首先回顾了关于网
目的:观察足三里穴位注射治疗顽固性呃逆患者的临床效果。方法:回顾性分析我科近几年来收治的病人中,伴有顽固性呃逆症状的临床资料,共63例,采用盐酸氯丙嗪穴位注射(治疗组)3
目的:通过社会失败应激(social defeat stress)建立抑郁动物模型,对应激小鼠进行抑郁行为的评估,并通过社会逃避实验筛选出社会失败应激易感小鼠。一方面,探讨社会失败应激小
随着电信企业的不断发展,电信网络和计算机终端规模的不断加大,枣庄移动公司对网络和终端管理要求的越来越高。相对于企业对于终端严格的管理制度,员工对计算机的功能又有各
高职院校导游服务职业技能大赛考查了学生基本理论、表达、应变、讲解、才艺等方面的知识技能,是提高学生职业素质的途径之一。将导游服务技能大赛的赛项要求与日常教育教学
研究背景:抑郁症是一种发病机制未明严重损害人类健康的精神疾病,其患病率有不断上升趋势。青少年抑郁症的患病率较高,给家庭和社会带来了严重的负担。随着脑功能成像技术迅
陕西省内在校大学生校园非正常死亡事件逐年上升,直接影响着平安校园的创建,给国家、社会、学校、家庭造成极大的损害,大学生的心理健康教育亟待解决。本文仅从大学生心理健
背景:额叶是情绪调节的重要脑区,既往研究认为抑郁症患者额叶密度降低、体积减小、对情绪刺激反应异常,但是这些改变是否具有遗传特异性,目前该方面研究较少。额叶富含五羟色
在计算声学领域,求解无界域声场计算效率问题在过去三十多年中一直以来是一个艰巨的挑战,期间在该领域产生了众多的方法,如边界元法,近似边界条件法及无限元法。特别由于声学无限
<正>豆制品机械化生产大势所趋,豆制品历史久远,是我们日常生活中随处可见的食品,被广泛所接受和认可,被现代人视为"小人参"。手工豆制品味道好,豆香味醇厚,可是传统工艺产量