论文部分内容阅读
随着互联网在我国的飞速发展,人们的生活也随之发生了巨大的变化。人们能够用越来越快的速度了解到我国甚至是全世界发生的各种各样的事情,并且对这些事情发表自己的看法。在网络视频领域中,人们可以在各大视频网站上寻找自己感兴趣的视频观看,发表用户评论或者留言等。这些评论和留言能够在一定程度上表达用户的观点和态度,所以它们对于视频网站、制片方、演员和用户来说都是十分有价值的。目前,在英文领域中,情感倾向分析已经取得了一定的成果。但是,在中文领域中,由于中文的特殊性,所做的研究还是相对零散。本文利用基于《知网》的情感倾向分析方法对视频评论进行了研究,主要内容包括以下几个方面。首先,从视频网站中提取出用户对视频做出的评论。利用中文文本分词算法,对提取的用户评论进行分词,并对分词结果进行词性标注。提出了一种视频评论固定模式,并且按照该固定模式提取评论特征词。其次,提出了一种视频评论模型,该模型是进行视频评论分析的整体框架。提出了情感基准词集合,包括贬义词集合与褒义词集合,并且介绍了集合的构建方法。利用基于《知网》的情感倾向分析方法,计算特征词与情感基准词集合之间的相关度,进一步判断该特征词的情感倾向性。再次,根据每条评论中提取出的特征词,将评论进行归类。将某个视频的所有评论按照评论角度以及该角度在所有评论中出现的次数划分为几大类。最后,实现了视频评论特征词提取与情感倾向分析的自动化处理,将最终的结果以柱状图的形式展示出来,对结果进行分析。