多项式核支持向量机文本分类器泛化性能分析

来源 :计算机研究与发展 | 被引量 : 0次 | 上传用户:xuxinhuiaishu
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
VC维理论和结构风险最小化准则是统计学习理论中的重要内容 ,基于这一理论的支持向量机算法由于具有好的泛化性能受到重视 ,并被研究用于文本分类问题 基于多项式核的研究工作认为SVM的泛化能力不受多项式阶数的影响 ,并且能够处理很高维的分类问题 ,用于文本分类无需进行特征选择 研究发现 ,随着多项式核阶数的升高 ,SVM文本分类器会出现过学习现象 ,并且特征数越多越明显 ,特征选择是必需的 通过估计函数集的VC维 ,基于结构风险最小化理论对此问题进行分析 ,得出的结论跟实验结果相符 VC dimension theory and structural risk minimization criterion are the important contents of statistical learning theory. Support Vector Machine (SVM) algorithm based on this theory has been paid attention due to its good generalization performance and has been studied for polynomial kernel based text categorization The work holds that the generalization ability of SVM is not affected by polynomial order, and it can deal with very high-dimensional classification problems without using feature selection for text classification. As the polynomial kernel order increases, SVM text classifier There will be a learning phenomenon, and the more the number of features more obvious, the feature selection is necessary. By estimating the VC dimension of the function set, based on the structural risk minimization theory to analyze this problem, the conclusion is consistent with the experimental results
其他文献
期刊
期刊
期刊
目的:观察益气养阴、清热活血方治疗室性期前收缩的临床疗效及对心脏LVEF及Tei的影响。  方法:搜集我院2012年6月至2013年5月份门诊及住院的56例患有室性期前收缩的确诊病
电视是声画结合的艺术,丢掉了声音,电视的优势就丢了一半,这已成为电视工作者和广大观众的共识。如何亮出或藏起手中的采访话筒,也成了摆在电视工作者面前的一个既熟悉又陌生的课
本文以反思性教学和反思性教育理论为背景,结合体育教学实际工作,从反思性教学实践对体育教师素质的提高作用及基本流程、基本类型和基本方法等方面进行了探讨,旨在推动和促进反
油菜的群体是由个体的器官根、叶、茎、枝、荚所组成。高产油菜的群体结构要求适当较高的群体器官数量和质量,而数量越大其间的矛盾越大,不足或过度均难以高产。为此,有必要
期刊