基于情感分析的在线评论文本分类研究

来源 :江南大学 | 被引量 : 0次 | 上传用户:liuhaoyingying
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
互联网的普及和网民规模的不断壮大,支撑了我国电子商务的巨大发展,在线购物深受消费者喜爱。随着社交媒体的发展,电子商务也逐渐形成了社会商务的新发展模式,用户在线评论也促进了电子商务发展。海量的评论文本中蕴含了丰富的信息,这些信息为消费者决策、商家改进产品、选择营销策略和升级用户体验提供帮助,充分挖掘在线评论信息有助于产生巨大的经济价值,也为企业品牌的管理者提供决策支持和管理启示。面对海量的在线评论文本,单纯依靠人力对其进行处理和分析,任务量大且效率不高。因此,通过文本挖掘技术对评论数据进行爬取、处理、实验,提取有价值的信息,成为电子商务网站研究的重点。在自然语言处理领域中,运用机器学习方法进行情感分析和文本分类是重要的研究课题,其中仍存在问题需要深入探究,自动文本分类算法的也有改进的空间。文章从情感分析和文本分类两个角度,提出一种基于产品特征的情感分析方法,并在此基础上,构建基于情感分析改进的在线评论分类模型,对在线评论文本进行分析。情感分析方法使用Word2vec模型对文本进行向量化转换,结合人工提取和Word2vec建立产品特征词库和情感词库,完成“特征—观点”对的识别,标注情感极性,计算情感分数。以此为基础,文章将灰色关联分析和朴素贝叶斯算法相结合,考虑在线评论中的用户情感倾向,使用灰色关联分析方法计算评论文本的情感关联度,并将灰色关联分析结果作为一项特征属性嵌入朴素贝叶斯文本分类模型中,对传统的朴素贝叶斯分类模型加以改进,以提高文本分类模型的分类性能。文章以京东商城Dyson V10 Fluffy Extra手持无线吸尘器为研究对象,进行真实的在线评论挖掘,以检验提出的情感分析方法和文本分类模型的有效性。从产品特征的角度对正、负面的在线评论文本进行用户的情感倾向研究,并将模型的文本分类结果与传统的朴素贝叶斯文本分类模型的结果进行比较,结果显示,精确率、召回率等评价指标均有明显提升。文章提出的模型具有显著优势,可用于在线评论的实际应用中,为商家和平台的管理者提供建议和管理启示。
其他文献
与其他电视剧类型相比,古装剧建构了具有特定历史指向的文化场域。这种时空异质性虽然区别于现实空间,但是大多数作品都巧用现实主义的方式,呈现了一种平行空间。以《梦华录》与《知否知否应是绿肥红瘦》为例,两者都从极具宋韵的人文空间入手,在物理、心理、社会三个维度上全方位呈现了颇具市井烟火气的社会图景。两部剧所蕴含的近世的诸多特征是俘获大批观众的关键,也是构建虚拟时空与现代社会的对话桥梁,为古装剧的革新发展
运用文献资料、实地考察等方法,对华东地区滑雪服务市场的现实情况和发展困境进行探究,并提出对策。华东地区滑雪服务市场现实情况:市场供给日益多元化、市场需求日渐明晰、市场竞争力逐渐增强。面临的发展困境:市场政策引导性不强、服务供需内容脱节、企业运营能力较弱、大众消费潜力不足。对策:以政府顶层设计为引领,强化各区域政策落地转化的引导性;以雪场有效供给为核心,提升滑雪服务供给的精准度;以江浙革新优势为动力
学位
格林巴利综合征属中医“痿证”范畴,肺脾肾亏虚、渐及五脏是发病之本,热、湿、痰、瘀、毒为致病之标。马云枝教授临证根据疾病不同阶段分期论治,主张早期治疗应清补兼得,邪正兼顾,重在清肺中燥热之邪,多以清燥救肺汤或清燥汤为主方加减;中期顾护脾胃,标本兼治,常选用补中益气汤或参苓白术散为主方加减;晚期重在滋补肝肾,辨证施药,随症化裁,调护五脏,以肝肾亏虚为主者,方选独活寄生汤加减;阴阳两虚、元气衰败者,方选
目的:建立糖尿病-糖尿病肾病患者数据集,基于机器学习算法,建立糖尿病肾病风险预测模型,从2型糖尿病患者中筛选出糖尿病肾病患者,辅助进行糖尿病肾病诊断。方法:收集医院内分泌科2型糖尿病患者和糖尿病肾病患者数据,建立糖尿病-糖尿病肾病患者数据集;基于Logistic回归方法进行特征筛选,选取疾病影响因素;使用K近邻、逻辑回归、决策树等8种算法建立风险预测模型,并对预测模型进行评价比较。结果:筛选出糖尿
报纸
创业生态系统正成为创业前沿理论框架,然而现有研究更多停留在系统宏中观层面,系统不同层面之间的交叉融合研究匮乏,这容易造成新创企业的行为与系统发展方向之间的相互背离。处于不同系统生态位的新创企业只有融入周围所属创业生态系统,才能使自身与系统成为一个整体,从而获得系统福利,这也符合共同利益原则。但是,从企业与系统相互融合视角展开的研究却较为少见。于是,本研究强调新创企业需要采取与系统“互融、同构”的战
茶在我国种植面积广,并且是重要的创汇作物。茶树害虫是危害茶园生产的主要因素之一,每年给我国的茶园等相关产业链造成相当严重的损失,为了确保提升茶叶生产的质量,及时监测茶树害虫并采取正确的处理方式十分重要。由于茶树害虫在生长周期中形态变化较大,且茶园管理者缺乏茶树害虫识别、防治措施等相关的经验,从而导致不能准确的把握时机对症下药,防治害虫效果不理想、过量使用农药等现象,直接降低了茶园生产茶叶的卫生标准
目的 了解我国近10年冠心病患者便秘护理的研究现状及热点。方法 分别在中国知网、维普、万方、中国生物医学网数据库中检索冠心病患者便秘护理相关文章,检索日期设置为2013年1月1日至2022年7月1日。采用书目共现分析系统(BICOMB 2.02)生成词篇矩阵,SPSS 26.0软件生成树状图,g-CLUTO软件生成可视化山丘图。结果 共纳入249篇文献,获得40个高频关键词,归纳出4个研究热点,包
目的开发基于机器学习算法的中老年门诊2型糖尿病患者低血糖风险预测模型并验证其预测效果,同时与传统Logistic回归方法建模进行性能差异比较确定最优模型,以帮助临床医护人员早期识别低血糖高危人群并制定针对性干预措施。方法选取2020年7月—2022年2月在上海市某综合医院门诊随访的中老年2型糖尿病患者867例,将其分为为建模组(578例)、验证组(289例)。应用3种机器学习算法与传统Logist