论文部分内容阅读
随着信息技术以及互联网技术的不断发展,使得大量用户能够以更便捷的方式和更快的速度获取网上的信息,并在各大门户网站、论坛或微博等平台上发表关于网络事件的内心真实看法、态度、情绪和意见,这些主观性言论形成了网络舆情。网络舆情一般形成迅速并在短时间内会对社会产生巨大影响,因此对网络舆情信息进行深入研究具有重要意义。文本情感倾向研究是近年来比较新颖和热门的研究方向,也是研究网络舆情的重要技术之一。文本情感倾向技术是对某个事物(如产品、事件)的看法或评论文本的挖掘,从而判断文本的情感倾向。文本情感倾向性分析技术被广泛应用在诸多领域,在本文中,将利用文本情感倾向分析技术对网络舆情信息进行分析。本文在了解近年来网络舆情和文本情感倾向性研究国内外发展情况的基础上,对网络舆情及文本情感倾向性研究的应用情况以及分析方法进行了总结,并提出了本文的研究内容和文章架构。同时,以文本情感分类过程为主线,主要研究了中文分词、停用词处理、特征选择、特征权重计算以及文本表示方法,并着重介绍了三种文本分类算法。随后,探析了不同数量的特征项及不同数量的正反评论训练数据对分类结果的影响,并通过对支持向量机、k阶最近邻方法和朴素贝叶斯方法的比较,得到更加适合研究网络舆情热点信息情感分析方法,用文本情感倾向分析技术对网络舆情热点信息进行分析。在本文的最后,选择凤凰网互联网专题中“2012电子商务价格战”这一热点的网络舆情热点信息为研究对象,进行情感倾向分类研究,分析了随着时间走势,网民对于这一事件的态度与看法。另外,从发表的评论的情感倾向的整体趋势出发分析了网民对该事件整体看法的发展状态,探析了正反评论数量不同的原因,以及当前电子商务网站存在的问题并据此给出了自己的看法和建议。本文对网络舆情热点信息的进行文本情感倾向分析研究具有一定的理论意义与实用价值。一方面,本文通过对网络舆情分析及文本倾向分析的学习,将文本倾向分析用于网络舆情分析中,并重点研究了网络环境中网络舆情热点信息的文本情感倾向性分析方法,对文本情感份分类的整个过程的各个环节的应用技术进行了详细的研究,实现了从语料采集到文本情感分类的全过程,不仅丰富了网络舆情和文本情感分析的研究内容,而且对相关技术的理论发展有一定的补充作用;另一方面,利用文本情感倾向分析技术对网络舆情热点信息分析方法与现实具体实例相结合,使社会管理者能够及时了解及分析民情民意,判断事件发展情况及趋势,对正确的网络预警,引导舆论方向,维护社会经济健康稳定发展等方面都具有一定的现实意义。