基于电商网站商品评论数据的用户情感分析

来源 :北京交通大学 | 被引量 : 38次 | 上传用户:wangsong1008
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着互联网的快速发展,越来越多的用户开始网上购物,更多的商品评论数据由此产生,反过来这些数据也为用户提供了参考价值。但是评论数据往往数量庞大,用户很难从中抽取出有用的信息,因此如何高效的对商品评论数据进行分析和情感提取是关键的问题。该论文提出了基于电商网站商品评论数据的情感分析模型,可以准确的识别出用户对商品的褒贬评价,为用户提供参考信息,也为商家提供反馈信息,同时也是电商网站在利用推荐算法进行个性化推荐的参考指标。该论文首先介绍了该课题的研究背景、国内外研究现状、研究意义和相关的技术。然后提出了一种无监督的情感分析新模型,该模型在原有主题模型基础上引入情感因子变量,并结合层次聚类对结果进行二次聚类,该模型利用电商网站评论数据对应的情感-主题-词的分布情况以及在不同情感下对应不同主题的词的权重值。该论文主要完成了下面的几项工作:(1)数据去重和清洗,通过对评论数据进行去重去噪声处理,获取比较纯净的文本。(2)建立词向量模型,然后通过词向量模型获取评论数据中的词的同义或近义词,然后对其进行扩展匹配,解决评论数据稀疏的问题。(3)建模和模型训练,利用本文提出的一种情感分析模型对评论数据进行建模,并且利用Gibbs采样算法对模型进行求解,得到评论-情感-主题-词的分布情况,然后利用层次聚类算法合并相同或者相似的主题。(4)情感极性值计算和情感倾向判断,基于该模型的结果,通过情感词典提取评论中的情感词,并结合四种规则对情感词的极性和极性值进行确定和计算,然后综合评论数据中的情感词对其情感极性进行计算,情感极性为正则为加,否则为减,得到每一条评论的情感分数,根据情感分数的正负进行评论的正负划分,然后根据每一条评论的结果对商品本身的情感分数进行计算,获取商品的情感倾向值。(5)实验验证和结果分析,通过设计实验以及对比实验,利用已有的数据集进行测试,对实验结果进行比较和分析,结果表明该模型可以准确的判断用户评论的情感倾向和商品的情感倾向。
其他文献
本文旨在从互文性视角探索泰戈尔的《飞鸟集》对冰心创作的影响。从互文性的角度来分析《飞鸟集》与《繁星》《春水》,阐释泰戈尔的《飞鸟集》对《繁星》《春水》的影射,从而
<正>小学语文教学中,我们要教给学生学习的方法、思维的方式、解决实际问题的能力。如果在其中适当拓宽视野,围绕中心延伸知识,那可能就会收到更好的教学效果,这便是课堂教学
该研究旨在评价抗菌肽S-thanatin对革兰阴性临床耐药菌大肠埃希菌和肺炎克雷伯菌的体外抗菌活性以及和7种抗生素的协同作用。采用肉汤微量稀释法考察S-thanatin对革兰阴性临
目的:探讨慢性活动性乙型肝炎(CAH)、乙肝后肝硬化(LC)患者的骨代谢状况。方法:测定CAH、LC患者各32例血清骨钙素、甲状旁腺激素及维生素D3的变化。结果CAH、LC患者组的血清钙、
:供应链金融是商业银行站在全局的角度,为协调供应链资金流,降低供应链整体财务成本而提供的系统性融资方案。汽车供应链金融是指从汽车零部件生产到消费者消费的整个供应链体
CTCS-3级列车控制系统(以下简称CTCS-3级列控系统)是保障高速列车安全运行、提高运输效率的核心安全装备。安全评估的目标是通过识别、分析安全风险,确定系统是否符合相关安
绩效考评是医疗机构人力资源管理和战略实现的重要工具和手段。绩效考评与伦理存在密切的关系。对于医疗机构绩效考评,理论上和实践中存在的许多问题都需要进行伦理学方面的反
研究针状铁素体等中温转变组织的相变规律及其力学性能,有助于实现对低碳微合金钢中各类组织的优化配比,合理制定微合金钢的生产工艺,开发具有优良塑性、韧性的高强度多相组织微
二十一世纪以来,革命历史题材电视剧进入了新的发展阶段,抗战历史题材电视剧也进入繁盛阶段,尤其是以传奇叙事作为叙事手段,以浪漫化为审美特征的抗战传奇剧异彩纷呈。由于抗