论文部分内容阅读
随着互联网技术的发展,社交网络越来越受到当今人们的欢迎,随之而来的是庞大的社交网络数据,如何利用错综复杂的社交网络数据为用户提取潜在的信息成为研究者们关注的重点。目前有两种主要的手段挖掘社交网络数据中的潜在信息,一种是传统的数据分析方法,强调机器的计算能力和人工智能;另一种是近年来兴起的可视化方法,强调机器并不擅长的、人所具备的认知能力。数据的分析过程需要机器和人的相互协作与优势互补,本文针对复杂的社交网络数据,在提出新的数据分析算法的同时,进一步采用数据可视化技术,通过结合数据分析与可视化使得用户更好地分析和理解数据。 本文研究的对象是从豆瓣网抓取的包含多种节点类型的网络数据,包括用户好友关系、用户电影评分、电影影人信息等。数据分析部分,本文采用数学模型的方法,从电影评分信息中提取用户兴趣特征向量,据此对用户进行基于兴趣的聚类;另外本文结合用户评分信息,在推荐中考虑用户的兴趣信息,从而改进了传统基于拓扑结构的好友推荐算法,为用户带来更精准的推荐;可视化部分本文提出了交互的层次气泡图对聚类进行可视化,让用户从聚类整体概览到局部细节进行观察和探索,另外通过力导引、饼图等形式展示了用户拓扑结构以及用户兴趣信息,并设计了多种交互形式帮助用户理解数据分析结果,支持用户自主得探索和分析数据中潜在的信息。 论文的主要工作如下: (1)基于用户兴趣的用户聚类与可视化:本文通过用户电影评分数据提取用户兴趣特征向量,并基于该用户特征向量对用户进行聚类。对于豆瓣网数据的聚类结果显示该方法可以对社交网络中的用户进行有效的聚类。进一步设计基于层次气泡图的交互可视化展示聚类结果,通过方便的交互操作可以从总体概览到局部细节感知基于用户兴趣聚类的信息。 (2)结合评分信息与拓扑结构的好友推荐算法及可视化:在好友拓扑结构的基础上结合用户兴趣的计算,本文提出了一种改进的好友推荐算法。对豆瓣网社交数据进行实验,实验结果表明该算法较传统基于拓扑的好友推荐算法准确度更高。进一步,为了让用户更好地理解推荐结果,设计了基于多视图联动的可视化展示全局用户的网络拓扑和局部用户的兴趣网络。通过联动交互的设计,使用者可以通过点击、缩放、高亮等方式比较不同用户间的兴趣差异。 (3)面向社交网络的数据分析与可视化原型系统:在上述研究的基础上,本文设计并实现了一个面向社交网络的数据分析与可视化原型系统,该系统将上述数据分析以及可视化工作有机结合在一起以方便用户操作。原型系统包括后台数据分析模块以及前台可视分析模块。系统后台进行数据聚类、好友推荐、可视交互的计算;前台提供了多个联动的可视分析界面,该可视界面采用节点连接图、饼图、层次气泡图等不同可视手段来展现和分析社交网络中各数据间的关系。