中文评论短文本的评价对象抽取研究

来源 :合肥工业大学 | 被引量 : 0次 | 上传用户:yeyuxx008
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
文本的情感倾向性分析在实践中应用广泛。对于评论性短文本而言,抽取评价词语及其所评价的对象,是判断情感倾向的关键。由于中文语言存在的缺少形态变化及关系修饰灵活等特点,使得中文评价对象抽取迄今仍是一个未得到妥善解决的问题。随着近年来中文依存句法分析技术的成熟,评论性短文本可以被较准确地解析成依存关系树,可从中挖掘出能反映评价对象及其特征之间关系的特有自然语言模式,以用于辅助提高评价对象抽取的准确性。本文的主要研究工作如下:(1)在分析现有评价对象抽取方法的基础上,基于从依存关系树库挖掘的频繁树模式,提出一种新颖的针对中文评论性短文本的评价对象抽取方法。该方法包括3个主要的步骤:基于依存关系频繁树模式的初始标注;基于错误驱动框架的频繁树模式有序规则集训练;基于频繁树模式有序规则的评价对象抽取。与传统方法不同,该方法能自动提炼反映评价对象的特征,形成相应的依存关系频繁树模式,利用错误驱动框架来解决模式和规则的选用和融合问题。实验证明了该方法的有效性。(2)针对中文评论性短文本的评价对象抽取方法FTTBL在有序规则集训练阶段时间消耗过大的问题,设计了两种优化策略。首先从降低初始频繁树模式规则集规模的角度出发,研究了初始规则集中存在的冗余问题,以不降低评价对象标注准确性为前提,给出了冗余消除策略;对于最为耗时的频繁树模式有序规则集的训练问题,研究发现导致这个问题的主要原因是前后相接两轮训练存在的重复计算量很大,为此分析了前后轮训练重复计算部分所存在的关系特征,据此设计了通过增加少量内存消耗来消除重复计算的策略,从而大大降低算法的计算时间。对以上两种优化策略作了实验验证。
其他文献
人脸检测(Face Detection)是指对于任意的一幅输入图像,通过一定的搜索方法,判断其中是否有人脸存在;如果其中包含人脸,则返回人脸所在的数目、位置及其大小等信息。一方面,人脸检
对于NP难问题来说,精确的指数时间算法是算法领域一个重要的研究课题,特别是在某些情况下近似算法难以满足计算的需求。在设计这一类算法的时候,最常见的是Davis Putnam所提
随着人类基因组计划的开展与现代生物技术的迅猛发展,生物信息数据的增长呈现爆炸之势,这为揭开生命奥秘提供了数据基础;计算机运算能力的提高和国际互联网络的发展使得对大规
无线传感器网络是由大量低成本、低功耗具有一定存储能力和计算能力的小型传感器节点通过自组织方式形成的网络。其节点一般部署在户外,通过无线信号进行数据传输,信号容易被
随着信息化时代的到来,军事、航天、工业控制领域对中间件的要求越来越高,实时中间件逐渐成为实现分布计算的关键技术之一。实时中间件提供了真正的通用软件总线结构,可以去
随着无线局域网(WLAN)技术的飞速发展,无线局域网应用领域越来越广泛了,其上的协议最终成为人们研究的焦点。协议开发过程是一个一体化的过程,对协议的一致性测试也是其中一
随着信息技术的快速发展以及各种网络业务的不断涌现,对信息安全的需求日益增强。密码算法是信息安全的重要基础,为了保证密码算法的安全性和有效性,在设计过程中通常涉及到
井下移动无线网络由分布于巷道的多个AP和多台机车上安置的车载终端组成,是实现机车无人驾驶系统通信网络的重要组成部分,提高其资源利用率是亟待解决的问题,对井下通信网络
随着金融分析、网络监控、传感器数据监控等新型数据流应用的出现,催生了一种新的数据管理技术——数据流查询处理,数据流查询处理技术已经在数据流应用中获得了较大的发展。
目前,在计算机和信息系统中大部分采用口令作为身份认证方法。其中,文本口令是使用最为普遍的,但其在安全性和可记忆性等方面都有很多的不足。研究证明,图形口令由于其更高的