论文部分内容阅读
电子商务的迅猛发展,让人们的生活更加便捷。同时,它产生了大量有用的用户评论信息,对这些信息进行情感分析具有重要的学术研究价值和实际应用价值。一方面,这些信息语言结构复杂,涉及到多个领域的处理技术,且目前尚无统一成熟的模型可以对其直接应用。另一个方面,对这些评论信息进行情感挖掘能够实现商家和用户的双赢,商家通过评论信息发现用户对产品的意见,提高产品的质量。用户可以通过其他买家的评论信息发现产品的优劣,做出购买决策。在一些学者研究的基础上,提出一种针对用户评论的新的情感分析方法,主要研究内容包括:(1)提出了基于情感词抽取和LDA特征表示的粗粒度情感分析方法。首先使用情感词典抽取文本中的情感词。其次,以情感词作为特征值使用LDA模型建模,得到评论的主题分布。最后使用SVM分类器将评论进行褒贬二元分类。为了处理评论特征稀少的问题,LDA建模时,通过多次调节主题数的大小实现多次分类,发现最优的分类结果。实验表明该方法在网络评论的褒贬分类方面的有效性。(2)提出了基于词性句法规则和LDA特征聚类的细粒度情感分析方法。首先分别独立使用词性规则和句法规则发现评论中的评价对象,然后将两种规则结合,得到最终的评价对象。其次,使用LDA模型对评价对象聚类,设置较少的主题数计算主题分值,实现主题的排序,设置较多的主题数发现每个主题下的频繁词簇。最后,为了验证该方法的性能,使用两类新的文档进行测试。结果表明,该方法在评价对象挖掘和主题聚类方面的有效性。