论文部分内容阅读
随着互联网的高速发展,社交网络迎来了新的时代,特别是时下自媒体的发展,使得信息传播具有高度参与性和交互主体性。自媒体用户数量的激增,越来越多的用户在平台上各抒己见,用户在线评论数量也呈现着爆发式的增长。这些评论体现了用户对某一事件的主客观评价,包含着用户自身的情感态度。因此,综合分析在线评论数据,挖掘用户对事件的情感信息具有十分重要的意义。情感分类是根据文本内容所体现的用户意见的情感极性,将带有相同特定情感倾向的文本归为一类,其目的是为了更好地分析在特定情感倾向下,用户评论所关注的主题或其他信息。目前在线评论情感分类主要采取统计自然语言处理、情感语义特性两种方式,而将这两种方式相结合进行情感分类的研究较少。故提出将这两种方式进行结合,设计基于词向量与情感本体相融合的情感分类方法。经由实验表明,本文提出的情感分类方法在分类效果上较优于仅基于词向量和基于情感本体的分类方法。在对评论文本情感分类之后,为抓住评论主题和用户情感之间的联系,提出一种将潜在狄立克雷分布模型(Latent Dirichlet Allocation,LDA)和语义网络相结合的情感信息挖掘模型。对LDA主题分析的结果进行处理,把与主题相关的高频词语划分为与主题相关的名词和带有感情色彩的情感词。之后结合主题词和情感词建立词共现矩阵,基于词共现矩阵形成评论文本语义网络图,对文本的情感信息进行描述。经由实验表明,该模型较优于基于词频-逆文档频率(Term Frequency-Inverse Document Frequency,TF-IDF)所构建的情感信息挖掘模型。