论文部分内容阅读
近年来,随着互联网的迅猛发展和普及,社交媒体已经成为人们获取信息、表达思想以及分享观点和情感的重要平台。社交媒体中用户间的交互行为使得某些用户生成的内容(如讨论帖、微博话题等)变得流行。对所关注内容的流行度进行建模和预测在商业、安全等多个领域中具有十分重要的研究和应用价值。本论文工作聚焦社交媒体内容的流行度建模和预测问题,研究建立刻画其动态演化过程的模型来预测其流行度的发展趋势和发展阶段,并研究不同媒体内容之间的相互作用对流行度建模和预测的影响。本论文采用多个典型的社交媒体形式,包括豆瓣小组和新浪微博的数据对所提出的流行度建模和预测方法进行了有效性验证。 本论文的主要贡献包括: 1)面向网络社交媒体内容,给出了其流行度趋势预测问题定义;总结了影响流行度的相关动态因素,包括评论树结构特性和用户回复关系;利用局部特性计算各个动态因素的先验信息并改进kNN算法,提出一种融合多个动态因素的流行度动态演化趋势预测方法,并通过实验验证了该方法的有效性; 2)在流行度趋势预测的基础上,给出了流行度不同发展阶段的定义并提出流行度发展阶段预测问题;面向多分类问题给出一种基于动态因素的流行度阶段预测方法;同时针对典型社交媒体形式,挖掘其流行度演化模式并提出一种结合演化模式的流行度阶段预测方法,并通过实验验证了该方法的有效性; 3)首次研究并提出基于社交媒体内容之间相互作用关系的流行度预测方法;基于社交媒体内容的交互特点,给出计算媒体内容相互作用关系的算法;利用非负矩阵分解从相互作用信息中自动抽取相互作用特征,建立基于社交媒体内容相互作用特征的流行度预测方法,并通过实验验证了该方法的有效性。