基于自然语言处理的评论分析算法研究

来源 :电子科技大学 | 被引量 : 0次 | 上传用户:lishimuyi
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着电子信息产业的发展,人们的生活已经越来越离不开电子设备和互联网。各种各样的APP为了收集用户反馈,纷纷设置了评论业务。这些评论文本中包含了大量有价值的信息,利用这些信息,商家一方面可以更加了解用户的爱好,为用户做出推荐,另一方面可以更加了解自身的不足和缺点,对自身的服务进行改进。但是,面对海量的评论信息,商家或平台往往没有足够的人力去阅读它们,因此,基于深度学习和机器学习的自然语言处理技术就派上了用场。本文以基于自然语言处理的评论分析算法为研究课题,重点研究了如何利用细粒度情感分析技术深入挖掘评论信息和利用评论信息赋能推荐算法。细粒度情感分析旨在挖掘文本信息中具体实体或类别的情感极性。传统的情感分析往往只关注完整句子的情感极性,但是很多评论中,不同的实体拥有不同的情感极性,如果能抓住每个实体各自的情感极性,可以为商家或平台提供更准确更详细的反馈,从而指导他们更有针对性地改进自身服务。现存方法的一个公共缺点是模型容易将标签与评论文本或实体类别中的某一方过度关联,而忽略了另一方,本文受启发于控制变量法,提出了一种配对预训练方法,帮助模型更均衡地分配其在句子和实体上的注意力,使模型同时注意到两部分输入数据的关系,不过度关注一方而忽略另一方。除此之外,本论文还使用了PGD对抗训练和扩展辅助句子的方法来提升训练效果。推荐算法可以帮助人们找到他们可能感兴趣的物品,推荐算法使用的数据多是用户的行为反馈,但这些隐式反馈包含的信息较为模糊,限制了推荐系统的性能。评论信息中包含的大量显式反馈可以很好地解决这个问题,用户在评论中往往会显式地指出喜欢或者不喜欢的地方,NLP技术可以通过这些评论学习每个用户的兴趣和每个物品的属性,因此,基于NLP的推荐算法应运而生。针对现存方法在训练和验证阶段存在的数据偏差,本文设计的注意力分布指导的信息传输网络模型通过一种导师学生架构,以两组注意力分布为导师信号,将辅助模块的信息传递给主模块,既可以避免数据泄露,又可以最大程度地利用有效数据,还可以实现用户物品对在导师信号层面的解耦合。实验结果表明,本文提出的两个算法模型的效果均优于各自方向现有的主流算法模型。
其他文献
Drinfeld-sok010v方程簇是Drinfeld和sok010v在上世纪八十年代初提出的一类重要的可积系统,它们对孤子理论的发展及其在数学物理中的应用有着极为重要的意义本文研究的是Drird’eld-sok010v方程簇的tau函数及某些机关问题Tau函数是联系可积系统与量子场论、矩阵模型、表示论、代数儿何等数学物理分支中相关问题的重要桥梁.Drinfeld-sok010v方程簇的tadu
图像配准与融合技术作为数字图像处理领域的重要分支,在卫星遥感、农林监控及战场军事等领域得到了广泛应用。成像平台不稳定等因素会影响光学传感器成像过程,导致图像存在几何空间不匹配的问题。SAR虽然可以弥补光学成像的不足,但是图像的分辨率与信噪比较低。因此,配准与融合技术可以在弥补单一传感器自身局限性的同时,达到信息互补、发挥两者优势的作用,提高融合结果图的信息量与可读性。本文围绕SAR图像与可见光图像
毫米波辐射计作为一种接收并检测物体热辐射的被动式接收机,凭借毫米波的频带宽、波长短、穿透力强等优势和辐射计本身具有的灵敏度高、隐蔽性好、全天时全天候工作等特点,被广泛应用于资源探测、气象观测、环境监测、军事侦察和安检成像等领域。而且近年来辐射计系统对阵列化和小型化提出了很高的要求,因此本文对多通道宽带毫米波辐射计的研究具有重要的工程应用价值。为了研制出工作频带更宽、温度灵敏度更高的辐射计,本文首先
本论文以热等离子体纳米材料合成及固体有害废弃物(如医疗垃圾)处理为研究背景,采用数值模拟和实验研究的方法,对直流电弧热等离子体发生器(反应器)内的传热与流动特性进行了二维数值模拟研究和初步的实验研究,得到了一些新的研究结果。本文采用二维数值模拟和实验测量手段研究了有反向载气注入条件下的热等离子体反应器内的传热与流动特性。数值模拟结果表明,等离子体发生器的输入功率、工作气体流量、反向载气流量及温度、
超快电子衍射(uED)利用超短电子束团探测物质的超快结构变化过程,在物理、化学、生命科学、材料科学等领域内诸多基础问题的研究中有重要作用。在传统的基于直流高压加速技术的keV uED中,较低的电子动能及由此引起的较强的空间电荷效应限制了可研究样品的范围和时间分辨能力。近年来提出的基于光阴极微波电子枪的MeV UED能够克服以上限制从而显著提高uED性能。本论文围绕MeV uED中诸多物理和技术上的
随着世界范围内物联网技术在生活中的广泛应用,智能设备在智慧城市、自动驾驶和工业互联网等场景中发挥着重要作用。由于智能设备产生的数据量呈指数增长,具有低时延、高存储和复杂计算需求的任务越来越多,从而造成智能网络设备与云计算中心之间的通信效率低下,且通信成本非常高昂。边缘计算(Edge Computing,EC)技术的出现旨在将云计算功能扩展到靠近用户终端的网络边缘,为用户带来近距离的计算能力和存储能
随着无线技术与物联网技术的进步,智能汽车快速发展,也带来了车载应用需求的大幅度增长。一些新兴的、具有计算密集和延迟敏感特征的车联网业务的出现,对车联网(Internet of Vehicle,IoV)的计算与任务调度提出了新的挑战。车辆边缘计算(Vehicular edge computing,VEC)将是一个有效的解决方案,通过将云服务下沉至移动网络边缘,既满足车辆计算资源的扩展需求,也能够在任
近年来,5G、云计算、物联网(Internet of Things,Io T)迅猛发展,软硬件紧耦合的传统网络设备在扩展性和灵活性上先天不足,已无法满足新时代下复杂多样的业务。而网络功能虚拟化(Network Function Virtualization,NFV)能将网络功能与专用硬件分离,让其以应用软件的形式运行在通用计算设备上,这样不仅缩减了运维成本还能灵活快速地提供服务。但随着NFV的深入
原子碰撞过程是一个古老而又年轻的,基础又有着广泛应用的一个研究方向,在可控核聚变,武器物理,天体物理中都有着广泛的应用。长久以来,由于实验条件的限制,实验研究常常限定于基态的原子。冷原子技术的诞生使得产生一个稳定的激发态的原子靶,乃至里德堡态的原子靶成为可能。而超冷等离子体技术的诞生使得实验研究等离子体环境中的原子过程成为了可能。针对我们小组正在进行的超冷等离子体环境中的原子碰撞实验,本论文从理论
重构核质点法(Reproducing Kernel Particle Method,简称 RKPM)是一种有广泛发展前景的无网格方法,具有优良特性。它可以避免大变形分析中由网格畸变引起的计算困难,避免移动不连续问题中耗时的网格重构。由于采用光滑连续的核函数,得到的解及其各阶导数都是连续的,具有较高的精度。此外,它的前处理过程更为简单,在很大程度上减少了人工工作量。针对 RKPM 是一种伽辽金型的无