论文部分内容阅读
伴随着社交网络及电子商务的普及而带来的是越来越多的评价性文本,不同的用户借此表达个人的情绪,而如何从泛滥的文本中获得有价值的信息成为研究人员的关注热点之一。文本情感分析任务即判断包括评价性文本在内的情感色彩,基于此,使得该任务近年来受到了广泛的关注,大量的学者采用不同的分析方法以获得更高的判断精度,部分企业也将文本情感分析任务应用于舆情分析系统作为数字化战略之一。因此,解决文本情感分析任务并进一步应用具有很大的价值,本文在此基础上进行了深入的研究。近年来,深度学习技术在图像、文本等领域的应用发展迅速,利用深度学习来解决文本情感分析任务引起了相关研究人员的广泛关注。然而,以往的许多方法效果一般,不同语境下需要关注的文本以及上下文之间的交互均没有得到很好的实现,这在一定程度上限制了不同解决方法的有效性。在本文中,我们提出了有效的新方法,以多种注意力网络为主体架构,并在此基础上改进,提出了迭代的多头注意力网络,其性能要优于现存的基线方法。将训练好的分析方法应用于舆情系统,进一步验证该方法的广泛应用性。本文的主要工作和创新点如下:(1)针对当前处理文本级别不够精细的问题,本文从细粒度的分析角度出发,通过分析文本中出现的方面词的情感极性,以更准确判断文本的情感倾向。(2)针对当下文本情感分析任务中使用的词嵌入语义特征不够丰富的问题,将预训练语言模型BERT的词嵌入作为任务的文本表示。目前,BERT在自然语言处理中的应用较少,作为新兴的技术,已有相关实验证明了该技术的有效性。(3)针对传统的解决情感分析方法精度低的问题,本文摈弃传统方法,采用多个注意力网络,包括常规注意力机制、多头注意力机制和多头自注意力机制等。最终的实验结果表明,融合了多种注意力机制的效果会更好。(4)将基于注意力网络的情感分析方法应用在实际的舆情分析系统项目中,进一步证明了该方法的实用性。舆情系统的实现过程如下:首先利用爬虫技术在相应网站采集所需要的数据;其次对数据进行预先处理和分词;然后采用改进后的情感分析方法判断文本情感极性;最后可视化的方式将结果展示。舆情系统既能帮助决策者分析问题,也利于用户了解不同产品的实际应用性。通过大量的相关实验,本文所提出方法的准确率接近90%,能较好的反映出针对所分析文本的倾向性。另外,将该方法应用于实际的舆情项目,实验结果通过了黑盒测试并优于先前所采用的分析方法,表明本文所提出的方法是有效且实用的。