观点提出者(opinion holder)提取研究

来源 :北京邮电大学 | 被引量 : 1次 | 上传用户:mawenbo111
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
情感分析主要是针对主观性文本单元自动的获取有用的意见信息和相关知识。随着互联网和信息产业的快速发展,大量用户在论坛、博客等平台上发表自已的意见和观点,针对的内容几乎囊括所能想象的一切。在情感分析领域中,对于意见和观点的提出,需要提取出意见的提出者或发起者(opinion holder),以更全面的掌握人们对社会或公众问题的看法,从而制定更加正确的措施或发表更加正确的言论。因此,基于自然语言处理方法的opinion holder提取有着重要的研究价值。本文针对不同领域的语料,采用基于统计和基于规则的方法分别对opinion holder进行提取,最后将基于统计和基于规则的方法相结合进行提取。本文的研究成果主要有:首先,通过分析opinion holder的定义,提取和提出了相应的6个特征,分别为词、主观表达触发词、词性标记、命名实体、依存关系和句子结构特征,并对特征定义了特征观察窗口以尽量精确的包含特征的上下文。其次,通过进行句法分析,定义了两条基于主观表达触发词的用于提取opinion holder的句法规则,并根据所提出的句法规则设计了基于句法规则的opinion holder提取算法。最后,将基于条件随机场和基于句法规则的opinion holder提取进行结合,即将句法规则所得结果进行句法路径挖掘和置信度分析后选取相应特征作为条件随机场的训练特征。其结合进行提取的结果显示了较高的准确率和召回率,得到了较满意的结果。然而不足之处在于我们并没有进行指代消解,下一步将进行指代消解并运用语义消歧来进一步提高opinion holder识别的精确性。
其他文献
本文主要针对电弧炉电极调节系统的非线性数学模型,研究了具有不确定性和弧长干扰的电弧炉电极调节系统控制的问题,提出了一种基于不确定项上界的鲁棒控制器设计方法。应用反馈
研究和开发高智能化船舶是世界航运事业的一个重要课题。船舶运动本身具有非线性、时变、大惯性等特点,且船舶模型具有不确定性以及受到环境的干扰复杂,对船舶操纵这样一个复杂
电弧炉电极调节系统是一类典型的非线性、三相强耦合、参数时变系统。目前,电弧炉炼钢已成为主要的炼钢方式之一,控制合适的电弧弧长成为电弧炉电极调节系统的主要任务。  本
现代战场条件下,目标越来越呈现出高速灵活机动的趋势,拦截导弹的飞行速度和机动性能优势正在被削弱。传统的制导方法将无法胜任目标拦截的任务,如比例导引,因此,为应对新型战场环
近年来,各类工业生产事故带来的严重后果和恶劣影响,时刻提醒着安全生产的重要性。为了保障生产过程的安全、预防事故发生,过程监控作为预防事故新技术得到了普遍的关注。本文主
为提高国家的整体战斗力和国防人员在战场上的生存能力,必须提高现代武器装备的快速反应能力和精确打击能力。针对传统火炮采用象限仪、水平仪等装置进行发射角装订存在设置误
为了应对日益激烈的市场竞争,实现企业经济效益最大化,生产调度在企业生产资源优化中发挥着日益重要的作用;所谓生产调度就是按时间分配资源并达到给定目标最优,本质上调度问题
如何能够在一个复杂的音频环境下检测音频事件并进行相关语义分析研究在多媒体检索、安全领域和移动机器人领域等都有广泛的应,成为基于内容的音频语义分析和检索的热点问题,
现代制造业的发展很大程度上取决于车间生产调度的优化过程,车间调度的方法以及优化技术的研究对于推进制造业的现代化具有重要的理论价值与指导意义。作为生产调度问题的一个
热红外线不受电磁信号的干扰,不受光线的影响,可以在黑暗的夜间使用,因此红外图像在很大程度上解决了可见光图像的光照变化对检测性能的影响这一问题。同时,利用热成像技术可以精