论文部分内容阅读
在社交网络中,对于巨大数量的产品和服务,每天都会产生越来越多非结构化的在线评论。在线用户不仅表达对产品和服务的整体意见,还会针对感兴趣的某一个特定产品特征表达他们的情感。在特征层面上,自动识别用户们的主观意见能够给生产者和消费者在决策制定方面提供很大的支持。虽然特征层面的情感分析和意见挖掘的方法有很多,但是对于这些本身是客观、没有情感的而在特定的知识域中却表达了积极或者消极情感的名词特征,却只有很少的研究。在本文中,我们对这种特征层面的域依赖名词极性进行分析处理。对于名词特征的处理,我们使用基于语言学框架的提取算法。对于文本中的每句话,我们进行分词处理,同时为每一个词标注上相应的词性。接下来,也是比较重要的部分,就是确定句子中每个词语与其他词语之间的依赖关系,以及确定出每个词语的作用域。这样,我们就可以准确地提取出句子中的名词特征。同时,为了后续的情感得分计算,我们还需要提取出副词-形容词-名词短语结构。在意见挖掘领域中,挖掘域依赖的意见词是一个很重要的问题,这个工作有助于文本的情感分析和意见挖掘。然而,现有的情感分析和意见挖掘工作主要分析形容词和动词,只有很少的工作把分析重点放在名词和名词短语。在我们的研究中,我们使用基于语言学分析的意见挖掘方法,来识别和提取在特定知识领域中表达着积极或消极意见的客观名词特征。首先,我们提出一种自动提取名词特征的方法。这种提取方法利用语言学框架来提取副词-形容词-名词结构的短语。随后,对于提取出的副词-形容词-名词结构的短语,我们提出了一种通用加法模型来计算副词-形容词-名词结构中名词特征的情感得分。然后,通过使用统计算法和删除掉在特定领域中不表达情感的名词特征,我们能够确定在特定领域中表达意见的客观名词特征。最后,我们进行了多次实验,以体现我提出方法的优点。基于现实生活中的数据集,提出的方法在精确度和鲁棒性上展现了很好的优势。另外,我们做的实验体现出了预计的召回率和准确率。