半监督学习若干问题的研究

被引量 : 0次 | 上传用户:Konca
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
半监督学习(Semi-supervised Learning)是模式识别和机器学习中的重要研究领域,一直为国际机器学习界所广泛关注,近几年来随着机器学习在数据分析和数据挖掘中的广泛应用,半监督学习的理论研究成果已经部分应用于实际问题的解决。本文首先对于半监督学习领域的国内外研究现状进行回顾,介绍了半监督学习方法的几个思路,给出了半监督学习的理论研究和实际应用中的一些问题。接着本文详细介绍了我们在半监督学习研究领域开展的三方面的工作:1. 我们提出了基于有限混合模型的多视图(Multi-View)EM算法,将存在多个视图的样本进行半监督学习的问题纳入EM框架。如何利用特征集存在天然分割的半监督样本集进行学习是半监督学习领域的一个重要问题,Co-training算法和Co-EM算法是处理该问题的两个著名算法,Multi-View EM算法与它们相比有如下优势:既能够应用于半监督学习也能够应用于非监督学习;能够对于不同的视图采用不同的分类器和不同的优化准则;其收敛性能得到理论保证。合成数据,USPS标准数据集,标准彩色图像和WebKB数据集上面的大量的实验证明了Multi-View EM算法的有效性。2. 我们提出了联合CEM和SVM进行主动学习的一种算法,该算法将主动学习过程分为两个步骤:第一步利用CEM算法发掘和查询置信区域;第二步利用SVM主动学习调整分类器决策面位置。实验证明该算法与仅利用SVM主动学习相比有如下优势:能够使得分类器更快寻找到合适的分类决策面;学习过程中,分类器性能更稳定,学习曲线不会出现大的震荡。3. 我们提出了基于主动学习的分类器融合算法,将度量层输出的分类器融合问题看作二级分类器的设计问题,将SVM主动学习引入二级分类器设计。该算法在有效减少标注代价的同时获得了较高的分类性能。实验证明该算法在分类性能和标注代价两方面都优于传统分类器融合方法。
其他文献
高校建筑中自习使用状态下的公共教学空间(A空间)及公共交通空间(C空间)可统称为公共自习空间。公共自习空间在其使用过程中所引发的日常的、大量的、必要的学生行为心理是怎
以某矿5301工作面40 m宽遗留煤柱为背景,通过理论计算和数值模拟得到遗留煤柱的垂直应力分布特征,并基于此研究了诱发冲击地压的机理:遗留煤柱未受工作面回采影响之前,所受阻
在分析了大沽河干流青岛段水质现状的基础上,指出该研究区域的主要污染物为COD、NH3-N。根据其水域功能类别的水质标准,并且根据大沽河在枯水期没有流量的具体情况,在此时段
ABS仿真系统是ABS产品研发过程中一个重要的开发手段,它可以有效地模拟汽车在各种路面条件下制动时的运动状况,从而在实验室条件下检验ABS的工作性能。因此,仿真系统可以替代
阐述了在中学化学实验教学中应用手持技术测定微量钙的意义,研究了以酸性铬蓝K为显色剂,用手持技术测定葡萄糖酸钙片中钙含量的方法,测定Ca2+质量浓度的线性范围是0~2.0mg/L,
介绍了汽车用天然气脱水的要求 ,论述了CNG汽车加气站压缩天然气的脱水工艺以及在工艺流程中脱水装置的设置
水资源是事关国计民生的基础性自然资源和战略性经济资源,水资源开发利用程度及潜力反映了一个流域或区域的水利基础设施建设情况及经济发展后劲。环北部湾经济区是我国未来经
分析了我国高校教育成本核算现状,根据工业企业会计成本核算理论提出了高校教育成本核算的建议,引入了先进制造企业广泛适用的成本核算方法——作业成本法,结合高校教育成本
医学生物化学是医学专业的基础必修课,也是联系基础理论与临床实践的桥梁课程.然而,医学生物化学理论内容繁多,学习难度很大.该文分析了此门课程的教学实际情况,拟定了教学改
钢管结构构造简洁,造型优美,常用于大跨度钢结构体系中。节点采用管件直接焊接,存在较为严重的应力集中。钢管节点承载力研究一直是国内外的热点。本文介绍了管节点承载力的
学位