案件微博评论的属性级情感分析方法研究

来源 :王静赟 | 被引量 : 0次 | 上传用户:qq20881010
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
当前,热点案件吸引了人们较多的关注,并在微博等社交媒体平台上进行大量的讨论,引起涉案舆情,容易对法院的审判工作造成负面影响。识别涉案微博评论中的属性词,挖掘属性词的观点并判断其情感极性,有助于帮助法院监测涉案舆情,评估舆论走势。面向案件微博评论的属性级情感分析存在缺乏案件属性级情感分析语料、属性词抽取中缺乏案件领域知识的有效利用、观点词和属性词之间的关系利用不足等问题。本文围绕面向涉案微博评论的属性词抽取、属性级观点挖掘等任务展开研究,完成了以下工作。(1)由于缺乏公开的涉案微博属性级情感分析语料,本文构建了涉案微博评论的属性级情感分析数据集。首先,利用爬虫技术从微博网页上获得了大量的涉案微博评论数据。其次,制定标注体系,对涉案微博评论的属性词、观点词和情感倾向性进行人工标注,构建涉案微博的属性级情感分析语料库,为后面的研究提供数据支撑。(2)涉案微博属性词抽取旨在从微博评论中识别出用户评价的案件属性词项,现有方法并未考虑涉案微博的领域特点,即评论通常围绕正文中出现的案件关键词展开讨论。因此,本文提出了一种基于关键词结构编码的案件微博属性词抽取方法。该方法通过结构编码机制综合利用微博正文的案件关键词信息,并通过交互注意力机制将其融入评论句子表示,来指导属性词的抽取。针对两个数据集的实验结果表明,所提方法在涉案微博属性词抽取方面是有效的。(3)涉案微博属性级观点挖掘任务旨在提取属性词对应的观点词,并判断其情感倾向性,包括观点词抽取和属性级情感分类两个子任务。该任务的难点在于如何对属性词和观点词的关系进行建模,从而利用抽取的观点词预测情感极性。考虑到属性词和观点词之间存在一定的句法联系,同时,观点词抽取和属性词情感分析是两个相互促进的任务,因此,本文提出一种基于图注意力网络的案件微博属性级观点挖掘方法。该方法利用句法关系和关系感知的图注意力网络对观点词抽取和属性级情感分类进行联合训练,从而提升观点挖掘的精度。针对两个数据集的实验结果表明,与当前最优模型相比,基于图注意力网络的模型在属性级观点挖掘任务中取得了更好的结果。(4)本文设计了面向案件微博评论的属性级情感分析原型系统。该系统可以通过本文提出的基于关键词结构编码的属性词抽取模型实现涉案微博评论的属性词抽取功能,并通过本文提出的基于图注意力网络的观点挖掘模型实现涉案微博评论的观点词抽取和属性级情感分类功能。
其他文献
肠道菌群与诸多人类重大疾病相关,比如,肝硬化、糖尿病、肥胖症、自闭症等,研究在不同条件下肠道菌群结构差异具有重要意义。传统聚类方法识别肠道菌群数据中结构模式时,对噪声敏感,运行时间长,无法处理不规则数据。而谱聚类不仅可以聚类任意形状的样本数据,能够收敛于全局最优解,对数据分布的适应性更强,计算量小,且具有更高的性能。因此本文采用谱聚类(Spectrum)方法来分析肠道菌群结构,以轻微肝性脑病和2型
学位
在实现“双碳”目标的背景下,我国“三西”地区受特殊能源资源开发条件与生态环境所限,尽管为国家经济发展提供了强大的能源支撑,但也为我国自然环境的演变贡献了大量的煤炭采空区与二氧化碳。回顾了“三西”地区煤炭采空区形成的历史原因,分析了实施能源“立体开发模式”的必要性与有利条件,提出该地区煤炭开采业应当加快转变发展模式,在政府的组织协调下与土地承包户建立合作关系,创造条件,高效利用采空区煤炭、土地、太阳
期刊
癫痫是一种慢性脑神经疾病,由神经元过度和瞬时放电引起。全世界有数百万癫痫患者,患者不仅生活质量降低,丧失生产力,还可能导致过早死亡。在医学上,头皮或颅内脑电图反映了头部表面的电活动,包含大量病理信息,是作为诊断癫痫的重要标准之一。目前大多采用时频域、非线性等方法研究癫痫脑电,易忽略脑电空间位置信息。微状态分析方法能获取脑电的时间动态信息和空间位置信息,被用于很多脑神经疾病的研究,然而患者脑电微状态
学位
骨质疏松症是由于骨吸收和骨形成之间的动态平衡被打破,从而导致骨质流失,骨密度降低以及骨骼微细结构遭到破坏所形成的一种慢性骨代谢疾病。近年来,越来越多的研究证明,外泌体疗法将成为骨质疏松治疗的一个重要方向。外泌体是参与细胞间通信的脂质双分子层细胞外囊泡,可通过传递脂质、蛋白质、核酸的方式调节受体细胞的生物活性。其来源十分广泛,可存在于各种生物体液中,也由多种动物细胞分泌,如间充质干细胞等。脂肪来源的
期刊
脑机接口(BCI)可以提供一种将大脑信息传递给外界的通信方式,完成与中枢神经系统和外设的直接交互。基于运动想象的脑机接口(MI-BCI)由受试者的心理活动驱动,脑电信号在健康人和患有神经肌肉疾病的患者等个体中容易检测到。目前,MI-BCI对脑控机器人,如康复机器人、护理床机器人、无人驾驶飞行器等起着重要的作用。多数的MI-BCI,主要向外设提供离散的逻辑控制命令,如简单的方向控制意图,这是通过识别
学位
目的 探讨腹腔镜卵巢囊肿切除术对卵巢囊肿(OC)患者卵巢功能及生活质量的影响。方法 选取我院2019年1月至2020年12月收治的100例OC患者作为研究对象,以随机数字表法将其分为传统组(50例,传统开腹手术)和腹腔镜组(50例,腹腔镜卵巢囊肿切除术)。比较两组患者的临床指标、术后1年内的妊娠率和流产率、性激素水平、卵巢形态和功能指标、生活质量。结果 腹腔镜组的手术时长、卧床时长、住院时长均短于
期刊
随着热点案件的发生而伴生的涉案舆情新闻迅速传播,涉案新闻的主题分析及匹配变得尤为重要,亦是舆情监测的重要组成部分。然而,由于涉案新闻的数据来源广泛,格式多样化,网络爬取的涉案新闻文本分布不均衡,文本结构和语义差异性大,并且含有较多冗余信息,常规的主题分析方法很难抽取出涉案新闻中具有涉案偏好的主题信息,同时也导致了涉案新闻文本匹配性能较差。本文首先过滤出爬取新闻中的涉案新闻数据;其次从规整法律文书数
学位
在大数据时代,网络已经成为文化传播的主要载体,利用智能化信息技术及时获取和分析边疆民族文化大数据意义重大。跨境民族文档关联分析能够省时省力地帮助人们分析跨境民族文化间的差异性,及时获取跨境民族文化文本数据之间的关联关系。然而,跨境民族文化文档关联分析属于特定领域任务,文本数据中语义比较复杂,仅通过现有的深度学习模型探索跨境民族文化文本数据之间的关联存在一定的困难。本文立足于跨境民族文化领域的实际需
学位
自最高人民法院发布《类案检索指导意见》以来,类案检索在我国智慧司法建设中成为了重要的一部分。相似案例匹配作为类案检索的重要技术,对提高类案检索的准确率具有重要作用。本文以民间借贷案件作为对象,开展相似案例匹配方法研究有很好的应用和理论价值。民间借贷案件在司法领域中较为常见,但其中蕴含诸多要素和细节信息,常规的文本匹配方法难以很好地区分两案件裁判文书之间的差异。本文利用深度学习技术,针对民间借贷案件
学位
为了研究长链非编码RNA生长抑制特异性转录本5(lncRNA GAS5)在小鼠子宫中的表达及其在子宫内膜蜕膜化中的作用,本试验收集妊娠第1~8天的小鼠子宫组织样本,分离妊娠第4天的小鼠子宫内膜基质细胞(ESC)并通过类固醇构建体外诱导蜕膜化模型,采用实时荧光定量PCR(RT-qPCR)检测GAS5、蜕膜化标志因子蜕膜催乳素相关蛋白(Dtprp)、心脏神经脊衍生物表达转录因子2(Hand2)、骨形态
期刊