基于深度学习的评论文本情感分析方法研究

来源 :湖南大学 | 被引量 : 0次 | 上传用户:funwoods
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近年来,随着移动互联网的大范围普及以及各类App的火热推广,人们开始使用各类电商平台和社交平台进行日常的消费和社交活动,并在平台上发布评论。用户评论以文字形式为主,并且往往包含了用户的情感倾向和主观意向,分析这些评论中包含的情感倾向,对改进平台服务质量有着积极的作用。与其他模型相比,基于神经网络的深度学习方法极大地提升了文本情感分析的准确率和鲁棒性,成为了当前的研究热点。然而,许多基于CNN的情感分析研究还存在着以下问题:CNN容易忽略词语的上下文依赖关系、CNN池化时容易丢失特征信息。本文提出了两种情感分析模型解决该问题,主要研究内容如下:(1)提出了一种基于注意力机制的ATT-C-LSTM情感分析模型。为了解决中文词向量提取特征不充分的问题,该模型使用cw2vec和word2vec两种不同方法提取中文词语的特征信息作为两个通道的输入。一个通道使用多个不同大小的卷积窗口进行词语的情感特征提取,从而提取到更丰富的文本情感信息;另一个通道使用LSTM网络学习评论文本的上下文信息以及保持词语间的序列关系;使得CNN和LSTM能够优势互补,能更加充分地提取出文本的特征信息,并且在两个通道上都引入了注意力机制,使得模型能够更多地关注到评论中重要的词语,从而使模型能准确地识别出评论文本情感极性,提升模型在情感分析任务中的效果。实验证明,ATT-C-LSTM在数据集上分类的准确率为92%,有效地解决了现有模型存在的中文特征信息利用不充分问题。(2)提出了一种基于多卷积核的MCNN-Caps Net-LSTM情感分析模型。该模型一方面考虑到卷积神经网络在语义特征提取上的优点,用多个卷积核提取评论文本的n-gram特征,增强模型的特征提取能力;另一方面借鉴了在图像识别领域热门的胶囊网络独特的特征提取优势,使用胶囊网络来解决卷积神经网络池化层容易丢失特征的问题;使得卷积神经网络和胶囊网络优势互补,能提取到更多类型的特征信息,最后加入长短时记忆神经网络,使得模型既能提取到局部特征,又能关注到评论文本的上下文信息,提升模型在情感分类分析任务中的效果。实验证明,胶囊网络的动态路由可以更好地提取特征,MCNN-Caps Net-LSTM在情感分类任务中有着比其他模型更好的性能。
其他文献
校园女子足球是整个校园足球活动中的一个重要发展内容,通过开展校园女子足球可以促进足球运动在我国的传播,增加我国的足球人口,因为校园女足在女足运动发展体系中属于最基层部分,因此通过开展校园女子足球能够为我国储备青少年女足人才。多年以来云南省的足球发展重点都偏向于男足队伍,女足的发展一直比较滞后,现今从国家层面制定校园足球策略,明确提出让青少年女子足球拥有一定的规模,面对这样的发展机会,云南省已经开始
纳米多孔金属材料是一种由连续金属韧带与纳米尺寸孔道构成的材料,因其具有高比表面积、低密度、高导电性和高导热性等优点,在催化与电催化、过滤与分离、热交换、传感和驱动等方面具有广阔的应用前景。金属间化合物因有序原子排列、原子间协同等特性,在催化研究中表现出高效、高选择性的效果,是一类备受关注的催化材料。结合金属原子的特性,将金属间化合物的组分设计、多孔结构制备与催化性能进行协同,是发展新型纳米多孔催化
本文是一篇翻译实践报告,原文文本选自美国著名小说家托马斯·佩里(Thomas Perry)的悬疑小说Fidelity,此书写于2008年,至今无汉译本。本翻译实践报告对其前十章进行翻译,约25900字。讲述了以一名私人侦探死亡而引发的一系列的不同的人物之间的故事,繁乱复杂,跌宕起伏。彼得·纽马克(Peter Newmark)是英国著名翻译理论家和翻译教育家,其主要的翻译理论为语义翻译和交际翻译。语
在夏朝、商朝、周朝这三朝音乐文化中,青铜乐器是重要的,也是最有代表性的历史文物。在之前学者研究的基础上,本文选择了春秋早期刻有铭文的青铜乐器进行研究,吴镇烽先生的《图像集成》这本专著共收录春秋早期的青铜乐器计57件,其中芮国有1件,曾国有13件,铸国有1件,鄀国有1件,秦国有11件,楚国有10件,邾国有1件,虢国有8件,其他国家有11件。但由于有些青铜乐器是成套出土,而且铭文相同或者相差不大,因此
从2005年全球首家P2P平台成立开始,P2P平台网络借贷服务在世界各地得到积极推广,P2P平台网络借贷服务于2007年第一次引入我国,我国P2P平台即以P2P借贷与网络借贷相结合方式运营的互联网金融服务网站,是一种将若干小额款项集中在一起借贷给有借贷需要意向方的一种民间资金借贷模式。此种模式实现了资金及利率在一定程度上的自由化,提高了民间借贷中的资金流通性,弥补了信贷市场长期以来借贷信息闭塞、信
水稻种子与人类生活息息相关,也是基因改良的重要目标材料,启动子作为水稻种子遗传改良工作中一个重要的分子工具,在基因转录起始过程中有高效调控功能,其中胚特异性启动子不仅决定了外源基因在特定组织、发育阶段的表达,还有效避免了外源基因在水稻其他器官或组织表达,造成能源消耗等不利影响。因此,了解胚特异性启动子在水稻种子中的表达特征及作用机制,鉴定并获得高效专一的种胚特异性启动子,有利于研究外源基因在水稻种
正交频分复用(OFDM)技术存在较强的抗多径干扰能力,在光通信中能有效地抵抗色散,因此,OFDM与光通信融合,使光通信系统具有大容量、高速率、长距离的特点,同时,光OFDM的物理层安全问题也值得重视。混沌作为非线性动力学系统中出现的不规则运动,有初值敏感性、类随机性、有界性等特性,与密码学存在着天然密切的关系,所以近年来有关混沌与物理层加密结合的研究较为广泛。本文对DNA编码进行改进,结合混沌加密
随着老龄化问题的日益严重,在我国大多数地区和范围内存在着养老供需不平衡的问题,而这样的问题在人力和物力资源相对较为匮乏的少数民族地区更为突出,因此,该怎样解决这一问题也是我们关注和研究的重点,该研究也就有了理论与实际上的意义。一方面,互助养老作为传统家庭养老和机构养老的有效补充,通过整合利用闲置资源,能为少数民族农村地区的老年人提供多样化的养老服务;另一方面,少数民族地区社会资本存量丰富,社会资本
抗生素广泛应用于细菌性感染疾病的预防和治疗。然而,由于机体代谢的不完全,一些抗生素被排放到环境中,会对生态系统和人类健康造成不利影响和严重威胁。传统的物理、化学和生物法处理水体中抗生素存在效率不高、产生二次污染等问题,而光催化技术具有低成本、环境友好等优点,被认为是一种有效处理水体中抗生素的方法。石墨化氮化碳(g-C3N4)是一种热门的光催化半导体材料,具有合适的带隙和优异的化学稳定性,但比表面积
传统汽车的加速普及造成了日趋严重的能源消耗和环境污染问题,电动汽车作为一种环保的交通工具,是未来汽车发展的主流方向。动力锂电池荷电状态(State of Charge,SOC)是电池能量和功率计算的至关重要的状态参数,其估计(或估算)准确性对于优化整车能量控制、防止过充电和过放电、电池安全防护具有重要意义。基于等效电路模型的方法是效果比较好的SOC估计手段。然而,电池等效电路模型的不确定性和外部噪