论文部分内容阅读
随着互联网的快速发展,各类互联网产品也呈现爆发式地增长,对于那些卓越的互联网产品而言,用户关系是一个非常重要的环节,它关系到整个用户生态系统的建立及发展。用户只有建立了自己的朋友圈才能更好地在系统中寻找自己所需要的内容,增加用户存在感以及对系统的粘度,因此,对用户关系的挖掘和分析对一个完整的互联网产品有着至关重要的作用。在当前社交类互联网产品中,用户关系一般都是以好友推荐作为载体,直接向用户推荐二度好友,这时往往不能很好地表达用户的真实意愿,本文对相关的用户关系链算法进行分析,整合了其他领域的一些分析方法,提出了一套基于向量空间模型和三角闭合法则的好友关系综合评价算法,本方法从用户关系链和用户属性两方面对用户关系进行系统地分析、推荐等。在分析用户关系链中使用的向量空间模型,三角闭合法则等新方法,这些模型与传统的模型相结合,解决了以前好友分析过程中的无法引入社交网信息以及无社交网内朋友分布情况这些因素等缺陷,同时,为了解决海量数据带来的存储和计算等问题,本文对Hadoop平台进行研究,并给出了一个基于Hadoop的分布式分析系统的构建方案,最终在微博平台上进行应用和实验。