基于SVM和词向量的Web新闻倾向性分析

来源 :现代计算机(专业版) | 被引量 : 0次 | 上传用户:glc12123
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
提出一种通过提取词向量,并利用机器学习对新闻文本进行分类的方法。首先,通过对预先收集好的新闻语料进行分析,获取到词的向量表示形式;然后通过新闻中的一些关键词提取出新闻的关键句;最后把词向量和关键句当中的关键词词性作为组合特征,采用SVM算法进行分类,得到新闻的倾向性类别。实验表明,基于组合特征的SVM文本分类方法具有较高的F值。
其他文献
建立了同时测定大豆低聚糖中棉籽糖和水苏糖含量的高效液相色谱分析方法(HPLC)。采用示差折光检测器(RID),色谱柱为Agilent Zorbax carbohydrate柱(4.6mm×150mm,5μm),流动
采用正交试验法对环氧陶瓷涂料配方进行研究,结果表明:固化温度和固化剂加入量与环氧树脂固化时间成反比;促进剂的加入能够明显提高固化速度;并优选了三个配方进行涂层性能研
<正>一条长约三百多米的街道两旁,鳞次栉比地矗立着66栋建筑:荣春华茶庄、邵万生号、水明昌木器号、九和绸缎洋货局、国泰戏院、新华日报馆、陪都照相馆……这些原本只是出现
随着我国经济的快速发展,社会主义市场经济的不断完善,尤其是在加入世贸组织以后,经济全球化速度不断加快,企业之间的竞争越来越激烈。因此,企业要想在未来发展过程中占有一
以城市绿地土壤综合性状调查为基础,针对目前城市园林绿地中所遇到的实际问题,笔者提出了通过调查园林绿地土壤综合性状,可以对城市园林绿地土壤进行快速诊断,为城市园林苗木
长尾理论是网络时代兴起的一种新理论,指那些原来销量小,种类多的产品或服务由于总量巨大,累积起来的总收益超过主流产品的现象。将长尾理论引入网络教育,可以解决教育中人才
利用响应面法优化超声强化提取知母多糖工艺条件。在单因素试验基础上,采用Box-Benhnken中心组合试验,以提取时间、液料比、超声功率和提取次数为影响因素,以知母多糖得率为
<正>相传,清同治年间一场大水曾经将嘉陵江畔的一座小镇彻底淹没,水退之后,重见天日的小镇有了新的名字:澄江,即取自"沉江"的发音。如今,百年古镇澄江依然坚挺地伫立在嘉陵江
随着全球竞争进入白热化的状态,各类营销方案成为企业竞争的核心。但由于国内相关立法欠完善,致使创作者和企业等主体对营销方案知识产权一直处于"弱保护"状态,破坏企业在市
智能电网是国际上较为新颖的概念,是通过信息技术对传统电网进行改造,将多种电力能源形势统一于一个管理平台,以分布式管理的方式实现能源的合理调配。当前智能电网建设中还