论文部分内容阅读
Web2.0时代的技术发展正在不断影响和改变着人们的生活。各种各样的社会网络服务,给人们的在线互动交流带来了前所未有的便利与快捷,同时也开启了大规模真实数据的时代,为基于社会网络的用户行为研究提供了机会与挑战。一方面,传统研究中不易获得的大量用户数据及关系信息,现在可以由大型社会网络服务平台较为轻松地获得;另一方面,处理这些大规模数据并从中抽取出有用的信息应用于实际任务,也为研究者们提出了新的难题。用户的情感信息被认为是能够影响用户行为决策的主要因素之一。随着社会网络服务的日益壮大和发展,如何利用从社会网络数据中获取到的相关情感信息来对网络中的用户行为和主观观点进行分析和预测,是非常具有实际研究意义的工作。本文以真实社会网络中出现的用户和话题为对象,着重研究了在不同的用户行为预测任务下情感影响模型的建立和分析,并通过实验给出了一系列有参考价值的结果。这三个研究任务分别为:用户关系预测,个性化话题推荐,以及用户对话题的情感推测。各个任务中的实验结果均表明,有针对性地利用情感影响因素而建立的预测模型,能够得到比已有方法更好的效果。论文的主要工作和贡献如下:(1)基于近年来最受欢迎的社会网络服务之一的Twitter,爬取了一段时间内的真实数据,建立了一个可用于各项实验的Twitter数据库。该数据库不仅包括了Twitter用户的基本信息,还可以提取到用户间的关系网络,以及每个用户在该时段内的发布的消息文本。文中应用了一个快速有效的情感分析工具对数据库中的用户消息文本进行了情感类别标记。(2)对用户关系预测中的情感影响进行了研究。这部分工作中考虑的情感影响因素是用户在社会网络中带有情感倾向的影响力。首先定义和计算了用户情感影响力,并基于计算出的结果对用户进行了属性划分。本文将用户情感影响力属性作为新的特征,针对两个不同的用户关系预测子任务分别建立了情感影响模型SA-UFP和SA-RFP。对比实验的结果分析显示,SA-UFP和SA-RFP模型能够有效提高预测正确率。(3)对个性化话题推荐中的情感影响进行了研究。这部分工作中考虑的情感影响因素是社会网络话题下用户情感观点分布的影响。文中提出了关于话题的情感分布特征,并在真实数据上对它们进行了观察分析,而后基于话题情感分布对用户兴趣的影响建立了SDA-TR话题推荐模型。通过与已有推荐模型进行对比实验分析,证明了SDA-TR模型能够更好地为用户进行个性化话题推荐。(4)对用户对话题的情感推测这一应用任务中的情感影响进行了研究。这部分工作中考虑的情感影响因素是朋友用户间的相互情感影响。在分析了朋友用户间的情感影响并验证了相关假设的基础上,本文建立了SFMF推测模型。用户对话题情感推测任务上的对比实验分析表明,考虑了情感影响的SFMF模型更为准确有效。