论文部分内容阅读
随着网络信息化的发展,网络上涌现出大量的用户评论信息,如何对这些文本情感信息进行分析整理并抽取出用户关心的问题引起了研究工作者的广泛兴趣。文本情感分析作为自然语言处理的一个应用方向逐渐成为新的热点。文本情感分析又称为意见挖掘,是指对具有感情色彩的主观性文本进行分析、处理、归纳和推理的过程。文本情感分析涉及了多项具有挑战性的研究任务,根据研究内容的不同,文本情感分析可以分为情感分类、情感信息抽取和情感信息检索和归纳等。其中研究情感信息抽取是指抽取情感文本中有价值的情感信息,情感信息抽取具有实际应用价值。围绕文本情感分析,文本的工作主要包括以下几个内容:(1)研究文本情感资源的构建技术。为解决目前情感资源缺乏的问题,文本借鉴已有的研究成果并使用了三种方法进行情感词词典扩展,扩大了情感资源的规模、提高情感资源的可信度,并对扩展后的情感词词典进行了校验,最终构建了一个可信度比较高的情感词词典。(2)研究产品评论语料中的产品属性(评价对象)抽取方法。产品属性抽取是一个很有价值的研究任务,为了提高评论语料中产品属性抽取的准确率,本文采用条件随机场模型和最大熵模型在产品属性抽取任务中进行比较分析。此外,还对词性、浅层句法等相关特征选取进行了细致的介绍,分析加入这些句法特征对产品属性特征抽取的影响。(3)探索文本情感分析中产品属性跨领域移植的方法。针对目前文本情感语料缺乏的现状,提出了一种基于主动学习的评价对象跨领域移植方法。本文将模型从电子产品领域移植到汽车领域,实验结果证明本文提出的基于主动学习的方法在情感领域移植中起到了很好的作用。(4)设计并实现了一个细粒度情感分析系统,主要的功能包括评价对象抽取、极性词识别、评价对象极性判断等,综合了本文在文本情感分析中的研究成果。