基于深层观点要素抽取的情感分析研究

来源 :中国科学院大学 | 被引量 : 0次 | 上传用户:kongque168
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
情感分析,又称为观点挖掘,近些年来作为研究热点被广泛应用于公众观点识别、产品评论摘要等诸多需要自动获取人们的观点与情感的应用场景中。情感分析不仅可以帮助消费者做出明智的购买决策,还可以帮助企业理解客户和公众对其产品与服务的评价。在情感分析研究领域,观点词与评价对象抽取是其中的一项基础任务。评价对象是评论的主体,是观点所表达的对象,观点词是用于表达情感倾向的词语。观点词与评价对象组成的情感搭配(评价搭配)对于情感分析的上层任务有更多的支持作用。  本文以观点词与评价对象抽取任务为主要研究内容,将现有的抽取方法总结归纳为自启动扩展抽取框架与流水线处理抽取框架。通过对现有抽取方法进行分析,发现主要存在以下问题与挑战:第一,错误传递问题;第二,多种类型的观点词发现问题;第三,长尾低频评价对象发现问题。针对现存的若干问题,本文对抽取框架进行了重新设计,特别关注情感搭配识别的处理,主要研究工作如下:  (1)提出了观点词与评价对象的扩展提纯抽取框架。该框架通过迭代扩展过程中识别情感搭配关系来抽取新的观点词与评价对象,并增加了抽取结果筛选和抽取规则修正步骤,以缓解迭代过程中错误传递问题。  (2)提出了基于句法模板的情感搭配发现方法。在扩展提纯抽取框架的基础上,利用依存句法分析方法,定义了句法模板来描述情感搭配关系,通过自动句法模板获取达到发现潜在观点词与评价对象搭配,以解决多种类型的结果发现问题。  (3)提出了句法模板泛化与基于图结构节点权重排序的抽取结果提纯方法。句法模板泛化和模糊匹配处理是对自动获取的句法模板实例的提纯过程,提高了情感搭配的识别能力。同时,基于图结构节点权重排序方法可以对抽取结果进行有效的筛选提纯,减少结果对频次的依赖,以改善长尾抽取结果发现问题。  综上所述,本文以情感分析中的观点词与评价对象抽取任务为主要研究内容,面向解决现有方法存在的若干问题,提出了新型的扩展提纯抽取框架,并以此为基础设计了改进的情感搭配发现与结果提纯处理方法。通过真实的语料数据集上进行横向对比实验,本文所提出的方法在观点词与评价对象抽取任务中均取了得最佳效果,实验结果显示较传统的自启动扩展方法与流水线处理方法在F值上分别有平均10%和7%的提升,验证了所提出方法的有效性和优越性。
其他文献
本论文在参考国内外关于实验室管理系统最新研究成果的基础上,充分调研和分析了现代实验室管理模式,根据现代实验室管理,开放的特点,并针对我校计算机实验教学中心实验室的特点及
移动通信和互联网的迅速发展,使得两者的结合——移动互连技术成为研究的热点。越来越多的用户希望能够随时随地的接入Internet。为了解决计算机无线上网以及计算机在移动的过
随着网络技术、数据库技术以及其他信息内容存储访问技术的发展,用户需要访问和可以访问的信息范围不断扩大,信息内容也不断增加,同时这些信息内容可能存在于通过网络连接的分布
学位
国内电信企业唯有依赖先进的电信理论优化和标准化自己的前后台,才能抓住机会赶超国际水平。如何利用TMF(Telemanagement Forum)提出的NGOSS(NextGeneration Operation Suppor
学位
移动代理是一个独立运行的计算机程序,可以自主地在网络上按照一定的规程迁移,寻找合适的资源,完成用户给定的任务。由于移动代理具有移动性、自主性、智能性等特点,使之突破了传
时间序列数据挖掘(TSDM)是一个新兴的研究领域.该论文研究时间序列数据库相似查询、模式发现、分割以及时间序列预测等问题.具体包括:1)提出了一种基于多项式回归分析的相似
近年来,人脸识别技术得到了广泛的重视和发展。在安防、刑侦、人机交互等领域,发挥着越来越重要的作用,已逐步进入到了应用推广阶段。与此同时研究人员对更高效而准确的人脸识别
中性束注入(NBI)加热是核聚变装置上对等离子体外部加热和维持的主要手段之一。离子源及其电源供电系统是运行在NBI实验装置的80kV高压电位上,为了隔离高电位及增加采集信号的
日益重要的线延迟、变化的工作负载、功耗以及设计/验证复杂度等问题共同促进了片上多核处理器时代的到来。然而,当前主流的商用片上多核处理器主要针对多线程应用,单个串行程
随着IP语音(VoIP)技术在全球电信市场的不断普及,对服务供应商、设备制造商以及最终用户而言,性能改善、成本降低以及功能支持使VoIP成为一种极富吸引力的事物。由于人们对Vo