结合主题目标信息的社交媒体文本立场分析

来源 :哈尔滨工业大学 | 被引量 : 0次 | 上传用户:wofucyou4444
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着互联网与移动互联网的飞速发展和社交媒体的广泛应用,越来越多的网络用户可随时随地浏览热点新闻报道,并在网络中发表和交流观点,表达立场与情绪。因此文本情感分析研究吸引了广泛的研究兴趣。现有的文本情感分析通常只对文本做出倾向极性分析,但无法深入挖掘文本对特定主题目标的立场倾向。而在很多应用场景下,用户关注更多的是文本表达的立场倾向,而不仅是文本本身情感。因此,针对特定主题目标的社交媒体文本立场分析研究具有巨大的科学价值与商业价值。  现有文本立场分析的研究方法主要是基于传统语义特征的机器学习与深度学习的方法。基于传统语义特征的方法构建成本较高,迁移也较为复杂;基于端到端的深度学习方法通常未考虑主题目标信息。针对现有方法存在的不足之处,本文从以下两个方面展开对文本立场分析的研究。  针对现有文本立场分析往往缺乏考虑主题目标信息的问题,本文研究一种以条件编码的方式结合主题目标信息与文本信息的文本立场分析方法。该方法使用编码主题目标信息作为先验知识来指导立场分析中的文本信息编码。结合文本立场分析语料的特点,进一步改进了条件编码模型。在SemEval2016英文立场分析数据集和NLPCC2016中文立场分析数据集的实验结果显示,本文提出的基于条件编码的立场分析方法的微平均F1值分别为0.671与0.698。有效提高了文本立场分析的性能。  考虑到主题目标对文本信息内容存在不同侧重点的特点,本文将文本立场分析中的主题目标信息作为注意力机制的导向,给予文本信息不同权重的关注度,并在其中挖掘立场分析的模式。由于注意力机制与条件编码分别从“编码”与“解码”两个不同角度引入主题目标信息,本文提出了一种结合注意力机制与条件编码神经网络的文本立场分析方法。在“编码”过程中条件编码利用主题目标信息指导文本信息的编码,在“解码”过程中注意力机制根据主题目标信息在编码信息中抽取与立场分析相关的分类模式。在SemEval2016英文数据集和NLPCC2016中文数据集的实验结果显示,微平均F1值分别为0.689与0.716。对比两个数据集评测任务的最优系统,微平均F1值分别提高了1.08%和0.61%,显示了结合注意力机制与条件编码神经网络的方法在社交媒体文本立场分析任务上的有效性。
其他文献
随着Internet上信息服务的内容与功能不断增加,使得服务器的负荷越来越重。如何合理分担信息站点服务器的网络负载,使多台提供相同服务的服务器具有高可用性、可扩展性,并且能保
一个规模较大的视频点播系统拥有大量的媒体文件,系统中的媒体文件是不断更新变化的,并且会在各个服务器之间传输。这就需要有一套良好的内容分发策略使得节目的更新和传输更高
20世纪80年代由J.J.Hopfield和D.W.Tank提出的Hopfield神经网络模型在很大程度上促使了人们对神经网络的重新关注。至今,该模型已被成功应用于各类与优化相关的问题,其中著名的
本文主要研究个性化推荐在对等网络平台上的应用。目前,个性化推荐系统的研究与应用已经成为一项热点,但是在信任性、实时性、可扩展性以及对移动用户提供推荐等方面还存在很
在信息科技高速发展的今天,软件已成为现代高新领域中不可缺少的一部分,被广泛地应用于通信网络,尖端武器以及日常办公处理中。但是,由于软件以人为本,是一个主观创造过程,因此在开
随着以太网技术的广泛应用,各个应用领域对以太网数据传输的性能也提出了越来越多的要求,人们对以太网的应用已经不仅仅局限在传统的非实时数据的传输,而在一些实时数据传输
超声多普勒技术在临床医学中的应用十分广泛,如对循环系统血液动力学信息的获取,胎儿心率的测量等等。检测和量化人体各个血管中的血流状况是超声多普勒技术应用的一个主要方面
针对移动设备资源有限,网络不稳定,所需功能有限等特点,本文对MICO进行了深入的分析,并设计和实现了一个可应用于BREW平台的移动中间件——MICO2B.MICO2B是根据移动设备的特
PBS是目前已有的集群作业管理系统中颇具代表性和影响力的一种。PBS有OpenPBS和PBSpro二个系列。前者是免费软件,因而应用得更加广泛。但是OpenPBS只支持Globus的pre-WS版本,而
近年来,为了保证各种软件的正确性和提高软件的可维护性、可重用性,人们对软件形式方法的研究越来越广泛和深入,形式方法的研究之所以能够迅速,除了因为其本身固有的优点,如精确、