基于SVM新闻文本分类的研究

来源 :电子技术 | 被引量 : 0次 | 上传用户:wxgaihxx
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
网络新闻自动分类已经成为当下的热点问题,SVM分类算法是文本分类中应用较为成熟的一种方法。文章针对SVM文本分类中特征选择和核函数选择的两个重要问题,在新闻文本实验环境下进行了探讨,结果表明使用互信息特征选择法且特征数在4000左右,使用SIGMOID核函数的情况下准确率与召回率均可达到97%的分类效果。
其他文献
射频功放作为通信系统的最末级,因大功率而极易损害。由于功率放大器是一种相对比较昂贵,且为比较脆弱的器件,因此在设计功率放大器时,应重点关注如何保护功率放大器,以避免
目的:研究甲状腺自身抗体(TA)与复发性自然流产(RSA)之间关系,为临床治疗提供依据。方法:选取2014年2月至2015年3月医院诊治的100例有RSA史的非孕期患者资料进行分析,将其设为实验
Multisim软件以其强大的仿真功能,在电路设计中已经广泛应用。文章基于NI公司的推出的新版本Multisim 10设计了函数发生器,并对设计进行仿真和理论分析,缩短了电路开发的周期
蓝田生物群位于安徽省休宁县蓝田镇,保存在埃迪卡拉纪早期蓝田组的黑色页岩中,是已知最古老的复杂宏体生物群,既包含了扇状、丛状生长的海藻,也有具触手和类似肠道特征、形态
据悉,新疆实施棉花目标价格改革三年来,市场定价机制基本建立,有效调减新疆棉花种植面积51万m2,引导次宜棉区和风险棉区全部退出棉花种植。2014年,新疆实施棉花目标价格改革。三年
称谓词作为汉语词汇系统地一部分,存在鲜明的民族特色和时代特色。从“白”字头和构词理据两个方面对汉语“白”字头称谓词进行考察,试探究该部分称谓词中所蕴含的文化意蕴。
<正> 沿江村坐落在大兴安岭东麓,紧靠黑龙江畔,是革命老区呼玛县三卡乡一个边远、闭塞的小山村。现有125户人家、530口人,耕地面积1.8万亩。几年前,这个村还很落后,经济薄弱,
采用3因素5水平二次正交旋转回归试验方法,研究甘蔗产量与氮、磷、钾施用量的关系,获得施肥量与产量二次回归数学模型。通过分析表明:施用氮、磷、钾肥均对云蔗06-407产量的
提出了一种利用灰度形态变换快速提取汽车牌照区域的方法。利用灰度形态变换对输入的图像进行滤波,根据牌照的大致尺寸和滤波图像的模板卷积得到几个牌照的候选区域,最后分析
糖尿病视网膜病变(diabetic retinopathy,DR)是一种危及视力的糖尿病慢性血管并发症,不论是胰岛素依赖型还是非胰岛素依赖型患者,DR最终影响几乎所有糖尿病患者。DR的特点表现为逐