论文部分内容阅读
随着互联网的迅猛发展,网络上用户产生了大量富有情绪表达的文本信息。情绪分析研究旨在对这些文本表达的情绪(例如:喜、怒、哀、恐等)进行自动分析。近年来,情绪分析研究受到计算语言学领域研究者们的密切关注,成为一项基本的热点研究任务。作为一种特殊的情绪,读者情绪具体是指读者看完文本后所产生的情绪。本文针对面向新闻文本的读者情绪,开展了以下关于读者情绪分类的几个方面研究:首先,本文提出了一种基于协同训练算法的粗粒度情绪分类方法。该方法是一种半监督学习方法,其核心思想是结合新闻文本的读者情绪和评论文本的作者情绪进行读者情绪分类。具体而言,将新闻文本和评论文本作为两个不同的视图,采用协同训练分类方法提高半监督方法的情绪分类性能。最后实验结果显示,我们提出的方法取得了较好的分类效果。其次,本文提出了一种基于标签传播算法的粗粒度情绪分类方法。该方法是一种半监督学习方法,其核心思想是充分利用新闻和评论文本之间的相关性并克服了评论信息不足的困难进行读者情绪分类。具体而言,构建两个关联的二部图子图(新闻文本二部图和评论文本二部图)用于描述新闻文本和评论文本之间的关联。在此基础上,设计关于评论文本长度的关联转移概率函数用于描述新闻和评论之间的情绪转移强度。该双视图标签传播方法克服了协同训练算法的局限性,有效克服了评论文本内容不足所带来的不利影响,从而提高了情绪分类效果。最后,本文提出了一种基于特征-标签因子图模型的细粒度情绪分类方法。该方法是一种全监督学习方法,其核心思想是联合文本特征学习和标签相关性共同建模进行多标签读者情绪分类。具体而言,构造每个情绪标签对应的伪样本及由这些伪样本构成的样本网络用于描述不同情绪标签间的关联。在此基础上,构建特征-标签因子图(FLFG)模型用于实现对文本特征和情绪标签间关联的共同学习。实验结果表明,本文的方法能够有效地使用标签间的关联来帮助学习分类器,取得更好的分类效果。