利用未标记数据提高SVM分类器性能的研究

来源 :计算机工程与应用 | 被引量 : 0次 | 上传用户:teer197841
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
监督学习算法的一个主要困难在于需要大量标记过的训练集数据,采用人工的方法不够现实.文章提出了SVM分类器在少量标记训练样本情况下,采用Rocchio法和KNN方法从大量的未标记数据中,挑选相似度较高、区别度较大的数据加入到训练集中,弥补训练样本的不足.实验表明该算法有效地利用了丰富的未标记数据,减少了人工标记量,较好地提高了SVM分类器的性能.
其他文献
文章提出了综合多重评价因素的Web用户聚类算法;首先从评价因素的数学特征出发,提出了Web资源偏爱度与Web资源关联度的概念,然后运用Kruskal算法的基本原理在由Web资源和Web访问
8月中旬以来,砀山县晚熟黄桃19、黄金蜜等品种陆续成熟上市,但上市量明显少于往年,价格持续攀升。单果重250g以上的晚熟黄桃3.20元/kg,同比价格上涨36.50%;150g以上的2.60元/kg,同比价格
一项新研究发现,每天吃特定果蔬,如蓝莓、羽衣甘蓝和菠菜等,能帮助皮肤建立天然屏障,免受皮肤晒伤。
论文分析了嵌入式环境对GUI系统的需求,综合比较了现有嵌入式GUI的优缺点,设计了一种针对嵌入式环境的高性能可配置GUI系统——SMART GUI.
在组织工程培养细胞图像检测中,需要得到较完整的清晰轮廓线以获取生长信息。为了适应这种需求,提出了一种边缘检测综合算法。首先应用小波尺度独立边缘检测方法,可以得到简洁的边缘;然后采用图像融合的方法结合Canny和动态聚类方法得到最终的细胞分割图。实验结果证明了该算法的可行性和有效性。
提出了一个深度优先搜索最大流问题的分布式新算法,算法脱离了增广路径框架,具有一定的创新性,而且通俗易懂、形式规范,无论用于教学还是解决实际问题,都有较大的实用价值。
下一代网络是一个支持话音、数据和视频的多媒体网络。随着网络的发展,如何保障下一代网络多媒体流QoS是一个重要的研究课题。为保证多媒体流QoS,系统必须分配足够的CPU、I/O、
提出了基于混合反射模型的由明暗恢复物体三维形状的有限元算法.用正方形面元逼近光滑曲面,把曲面表示为所有节点基函数的线性组合;基于既含有漫反射成分又有镜面反射成分的
支持向量机仅仅由支持向量所决定,因此预先抽取支持向量参与训练是非常重要的。提出了一个基于同心超球面分割的支持向量预抽取方法,并在此基础上给出了HD—SVM训练算法。首先
在贵州省罗甸引种黄果酸浆,采用地膜覆盖露地栽培方式进行试验,结果表明:其生育期为156d,着果率26.23%,平均单果重5.6g,产量929.68kg/667m^2果实含可溶性同形物11.05%。试验认为黄果酸