【摘 要】
:
网络高度发达的今天,越来越多的社交网络和电商平台渗透到了生活的方方面面。人们不仅仅是网络信息的接受者,也是信息的生产者,众多用户发表的网络评论蕴藏着巨大价值。对网络评论进行情感分析,政府部门可以及时获悉群众对某个重大事件的舆论趋势,用户可以了解某产品的特性,商家也可以获知用户的需求,了解产品的不足,及时调整营销策略。现有情感分类方法主要有情感词典方法和机器学习方法。情感词典方法过于依赖词典中的情感
论文部分内容阅读
网络高度发达的今天,越来越多的社交网络和电商平台渗透到了生活的方方面面。人们不仅仅是网络信息的接受者,也是信息的生产者,众多用户发表的网络评论蕴藏着巨大价值。对网络评论进行情感分析,政府部门可以及时获悉群众对某个重大事件的舆论趋势,用户可以了解某产品的特性,商家也可以获知用户的需求,了解产品的不足,及时调整营销策略。现有情感分类方法主要有情感词典方法和机器学习方法。情感词典方法过于依赖词典中的情感词,情感词典越完备,网络评论情感倾向越显著,分类效果越好,而对情感倾向不易区分的评论分类效果欠佳。机器学习方法是一种有监督的方法,其分类效果依赖于大量事先标注过的语料,目前语料标注是通过人工完成,工作量极大。针对上述问题,综合情感词典和机器学习两种方法的特点构建了一个网络评论情感分类模型,利用相关领域网络评论对情感词典进行扩充,基于情感词典方法的分类结果,通过自监督学习训练一个分类器,进而提高情感倾向模糊文本的分类正确率。主要研究内容如下:(1)基于情感词典方法研究。在已有情感词典的基础上扩充情感词典,依靠词典和规则计算情感值,根据情感值进行分类。实验发现,词典越完备,情感值绝对值越高,正确率也越高,而且对消极评论的情感分类效果较好。(2)基于机器学习方法研究。对网络评论使用word2vec进行向量化表达,再使用PCA算法降维,作为机器学习分类算法的输入。实验表明,机器学习分类方法中支持向量机分类效果较好,同时还发现机器学习方法对积极评论的判定正确率比消极评论的判定正确率要高。(3)融合情感词典和机器学习的分类模型。使用情感词典计算网络评论的情感值,根据情感值得到情感明显的确定集和情感模糊的不确定集,确定集作为机器学习训练语料,不确定集作为待分类语料,确定集的分类结果以词典分类结果为准,不确定集的分类结果结合两种方法进行修正。经实验验证,与传统的情感词典和机器学习方法相比,该模型的正确率在三个数据集上都是最高的。
其他文献
建构主义的数学学习观,对教师在数学教学中的作用需要作出新的认识:教师是学生数学学习活动的促进者;教师要为学生的数学学习活动创造一个良好的学习环境;教师要了解学生的需
目的:通过了解肝移植术后患儿家属的照护需求和体验,旨在探索以家庭为中心的护理模式下儿童肝移植术后患儿及家属的具体延续护理内容。方法:选取2018年12月-2020年1月期间,在吉林大学第一医院行儿童肝移植手术的患儿家属为研究对象,运用目的抽样法选取符合条件的家属,利用半结构访谈的方法进行深入访谈。通过分析访谈结果,与以家庭为中心的护理模式相结合,形成肝移植患儿以家庭为中心的护理内容的初步函询问卷。
针对可变结构拥塞控制协议(VCP)存在粗粒度的拥塞反馈信息和收敛速度慢等问题,采用动态拥塞窗口控制和收敛控制器2种机制,提出了一种扩展的可变结构拥塞控制协议(EVCP).EVCP通过复用
针对H.264采用多模式运动估计和模式决策等一系列新算法而引入的高计算复杂度问题,提出了一种基于预测的H.264编码快速模式决策算法.使用一种基于自适应阈值的提早退出检测算
目的:探讨超声造影(CEUS)、血清癌抗原125(CA125)、血清人附睾蛋白4(HE4)诊断卵巢肿瘤的价值,并比较以上单项检查与联合检查诊断卵巢恶性肿瘤的诊断效能,找出其中诊断卵巢肿
语言表达能力是作文教学的重要目标之一,而好的语言表达能力是指精确、细致、到位的语言表述。因为语言与思维互为表里关系,所以可以通过有效的思维训练促进语言表达能力的提
针对在交通、波浪等动荷载下土体所受应力状态具有主应力轴循环旋转的特征,对杭州地区典型原状软黏土开展不排水模拟试验.主应力轴双幅循环旋转的试验结果表明,试样扭剪、轴向应
摘 要:在改革开放30周年之际,广州市确立了建立现代产业体系和建设宜居城市的“首善之区”的新定位。 创建“首善之区”,需要有“首善”的教育,即全民的、终身的、现代化的、公平的教育。以现代教育信息技术和互联网为基础的开放、互动、普及率高的数字化社区教育是构建“首善之区”终身教育体系、建设学习型社会的主要公共教育服务平台,也是促进社会和谐的有效途径。本文在解读广东“首善之区”内涵与功能的基础上,提出发