论文部分内容阅读
商品评论文本中包含了用户对产品的组成部分、性能和功能等方面所表达出的主观态度,这在很大程度上影响着用户的购买决策。因此,分析商品评论文本中用户对产品的情感倾向有着重要的意义。通过对大量商品评论文本的分析,发现用户不只关注商品的整体好坏,更关心商品特征属性的质量。针对商品评论文本,进行了基于产品特征级的情感倾向性分析研究。本文围绕文本情感倾向性分析的关键任务,通过对笔记本电脑评论语料的分析,首先抽取具体的评价对象和针对该评价对象的评价词语,分析评价对象和评价词语的搭配关系,得到评价二元组。在此基础上,进一步面向具体的评价对象进行特征层次的文本情感倾向性分析。具体的研究工作主要包括以下几个内容:第一,研究商品评论中评价对象、评价词语及其搭配关系的抽取技术。将基于知识的方法和机器学习方法相结合,首先构建笔记本电脑领域知识库,抽取常用的评价对象;再利用条件随机场模型进行建模,将分词、词性特征作为特征模板融入条件随机场模型抽取新出现的评价对象。在得到评价对象的基础上,将修饰词特征、位置特征增加到条件随机场模型中,用来抽取评价词以及评价对象和评价词之间的搭配关系。利用真实的评价语料,通过实验验证本文方法的有效性、准确率和召回率第二,研究基于评价单元的笔记本电脑领域特征本体构建方法。考虑到评价对象之间并不是相互独立的,而是有一定的层次关系。构建了笔记本电脑领域特征本体,将抽取到的<评价对象,评价短语>二元组作为本体的属性添加到构建的特征本体中,辅助本文的情感倾向性分析。第三,提出基于情感词汇集的文本情感倾向性分析方法。对现有的情感词典构建进行了改进,分别构建评价词典和情感词典。针对评论文本中用户的情感表达,将情感类型分为四个类别,通过相似度计算进行细粒度的情感倾向性判断。同时,考虑到描述词具有特征针对性,构建了特征描述词集,辅助情感倾向性判断,进一步提高情感倾向性判断的准确率。通过实验验证了本文方法的有效性。