基于深度学习的电商平台评论情感分析系统研究

来源 :北方工业大学 | 被引量 : 0次 | 上传用户:yanyuhan66
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着信息技术的飞速发展带动网络购物的迅速普及,各大电商收集了大量包含消费者主观意见的评论信息,这些信息蕴含着巨大的商业和社会价值。要从海量的评论数据中获得辅助决策的有效信息,采用人工智能技术挖掘评论情感信息的方案相较于人力浏览总结具有显著的优势。综观几大电商平台所获取的商品评论数据,发现存在如下典型问题:由于评论数据中差评数量相对稀少导致的严重数据种类不均衡和评论数据总量大导致的数据标注难度高。在业界对评论数据的重视程度已经达成共识的今天,针对上述问题,电商平台评论作为决策的辅助依据,如何使用深度学习技术对之进行更有效的情感信息挖掘,具有重大的研究意义。本文提出一种从语义理解角度针对电商平台用户评论文本的情感分析方法,将情感倾向分析问题转换为语义主题的分类问题。由于BERT预训练语言模型在各类情感分析任务中都表现出了不错的效果,本文以BERT语言模型为最基本的网络框架,在模型基础上根据评论数据特性进行一系列改进研究,论文主要工作如下:(1)针对海量评论数据导致数据标注难度高的问题:本文使用用户在电商平台对本次购物的星级评价作为初始标注。考虑到这种标注存在覆盖率不足以及用户评价随意等问题,本文采用聚类方法,结合开源情感字典和电商平台评论数据,生成适用于电商评论领域的情感词典,随后使用该词典对评论数据进行初步的情感分析,再将评论的情感分析结果与评论标签进行对比匹配,从而筛选出高质量标签数据。(2)针对差评数量稀少导致的情感分析训练数据类别不均衡的问题:本文引入图像领域数据增强方法Mix Match与NLP传统数据增强回译方法,对负例样本进行数据增强,增加其样本个数。由于Mix Match方法只适用于连续变量,故本文采用BERT的前10层将离散的文本向量变换成高维稠密向量,并结合筛选出的低质量标签进行Mixup操作,得到增强数据。同时,本文进一步引入目标识别领域的Focal_Loss算法,结合Mix Match与BERT的损失函数,引入权值与调质因子,通过惩罚大规模数据与易识别数据对总Loss的贡献,达到抵抗数据不平衡的目的。本文经过对电商平台评论的情感分析实验,检验本文提出的情感分析方法有效性,实验结果表明,本文提出的模型效果良好,相较于普通BERT模型与传统数据增强方法都有明显的提升。
其他文献
目的:探讨输卵管炎性不孕及输卵管阻塞黏连程度与影响因素的相关性,研究输卵管炎性不孕的中医证型分布特征及相关影响因素。方法:第一部分为病例对照研究,观察组选择2020年2月至2020年12月期间,在山西省中医院妇科住院部行宫腹腔镜手术治疗,符合纳入标准的输卵管炎性不孕病例共48例;对照组选择同期入住妇科病房,因子宫内膜息肉或(和)多囊卵巢综合征导致的不孕行宫腹腔镜手术治疗,术中见输卵管外观正常者共4
目的:初步探究幽门螺杆菌脂多糖对胃癌细胞株SGC7901多药耐药性的作用;探讨生脉注射液对幽门螺杆菌脂多糖所诱导的SGC7901细胞多药耐药性的逆转作用。研究方法:1.培养幽门螺杆菌,经尿素酶试验、过氧化酶试验鉴定后,提取脂多糖。2.CCK-8法测定5-氟尿嘧啶(5-Fu)、顺铂、阿霉素的IC50值,进行下一步实验。3.CCK-8法测定不同时间点幽门螺杆菌脂多糖与SGC7901细胞共培养的OD45
目的:通过门诊病历信息数据挖掘分析得出王晞星教授临床治疗宫颈癌的辨证、治法及遣方用药规律,总结出王晞星教授辨治宫颈癌的临床经验,为进一步指导临床辨治及开展临床研究提供客观依据。方法:根据病历纳入、排除标准筛选2017年12月至2020年12月期间王晞星教授门诊接诊的宫颈癌患者完整病历,参考相关标准完成病历数据统一规范。采用频数分析方法,总结本研究病历数据中的患者一般情况信息、高频症状信息及高频药物
目的:本研究旨在通过观察温阳清肠方治疗轻、中度活动期溃疡性结肠炎(脾肾阳虚型)的临床效应及不良反应,客观评价此治疗方案的有效性及安全性,为探索中西医治疗溃疡性结肠炎提供临床依据和方法。方法:本研究按照随机数字表分配原则将符合标准的60例脾肾阳虚型溃疡性结肠炎患者,随机分为治疗组与对照组各30例。治疗组行口服温阳清肠方联合美沙拉秦肠溶片,温阳清肠方每日1剂,水冲服200ml,分早晚二次空腹温服。美沙
紫杉烷类药物是治疗实体肿瘤的常用药物,临床常基于体表面积(body surface area, BSA)给药,但其无法降低个体间代谢差异以及化疗产生的毒副反应,已不再是最适宜的剂量算法,有必要对紫杉烷类药物采用剂量个体化给药。因此,现就紫杉烷类药物的代谢酶活性测定和治疗药物监测(TDM)的研究进展进行归纳和总结,以期为紫杉烷类药物剂量个体化的理论研究及临床应用提供参考。
科技创新一直是中纺院的立足之本,建院64年,其数次引领了纤维新材料的风潮此次举办的2020 yarnexpo大湾区国际纺织纱线博览会展示了产业链资源完整的纺织矩阵。作为纺织行业的国家队,通用技术集团中国纺织科学研究院有限公司(以下简称"中纺院")携旗下10家单位的超过15种产品参展,从纤维到终端产品再到服务,产品一应俱全,以便参展观众一站式采购。
期刊
中药材显微鉴定作为保障药材品质的重要手段,有着重要的科研和实用价值。常用显微图像识别算法大多存在鉴别种类少、鲁棒性差的问题。而深度学习作为主流的图像处理算法,有着优异的自学习能力,能满足复杂的计算需求。因此将深度学习与中药材粉末显微特征图像相结合,实现一种易推广、低成本、专业性强的显微特征鉴别算法具有研究意义。论文主要工作和创新性如下:(1)完成药学和图像学交叉下对中药材粉末显微特征图像归纳,实现
静脉输液在临床上的应用时间较长,如今静脉输液在临床上广泛用于抢救和治疗患者,具有快速达到药物疗效浓度、刺激较小等优点,通过静脉给药治疗能够起到有效的治疗效果,提高了患者的疾病治愈率和生活质量。静脉输液虽操作简单但讲究技巧,护理人员需要具备熟练的操作技术和扎实的专业知识;因为静脉输液一旦操作不当,患者易产生疼痛感、局部肿胀、坏死、溃疡等,甚至导致患者意外死亡。近年来,随着人们生活水平的提高,患者在就
目的 探讨自体单采富血小板血浆凝胶(autologous platelet-rich gel, APG)修复慢性难治性创面的临床疗效。方法 自2018年1月至2021年12月,贵州医科大学附属医院烧伤整形科收治60例慢性难治性创面患者。其中30例采用血细胞分离机一次性自体单采富血小板血浆(platelet-rich plasma, PRP)冻存,定期解冻后加入凝血酶和钙激活制备成凝胶填塞或覆盖创面
我国东南沿海地区台风频发,每当台风过境,在福建、广东、浙江、台湾等地区经常发生高压输电塔因台风引发的倒塔事故。输电塔倒塔,供电能量顿时减少,直接影响经济生产活动,影响人民群众生活的便利,社会影响极大,给国民经济造成损失。因此,本文针对输电塔在强台风作用下的响应和破坏过程进行研究,试图摸清台风作用下输电塔的倒塔规律,并进行针对性的加固技术研究。首先,本文对近年来强台风在我国造成的输电塔破坏灾害、输电