面向社交网络的数据分析和可视化

来源 :浙江工业大学 | 被引量 : 0次 | 上传用户:deannazhu
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着互联网技术的发展,社交网络越来越受到当今人们的欢迎,随之而来的是庞大的社交网络数据,如何利用错综复杂的社交网络数据为用户提取潜在的信息成为研究者们关注的重点。目前有两种主要的手段挖掘社交网络数据中的潜在信息,一种是传统的数据分析方法,强调机器的计算能力和人工智能;另一种是近年来兴起的可视化方法,强调机器并不擅长的、人所具备的认知能力。数据的分析过程需要机器和人的相互协作与优势互补,本文针对复杂的社交网络数据,在提出新的数据分析算法的同时,进一步采用数据可视化技术,通过结合数据分析与可视化使得用户更好地分析和理解数据。  本文研究的对象是从豆瓣网抓取的包含多种节点类型的网络数据,包括用户好友关系、用户电影评分、电影影人信息等。数据分析部分,本文采用数学模型的方法,从电影评分信息中提取用户兴趣特征向量,据此对用户进行基于兴趣的聚类;另外本文结合用户评分信息,在推荐中考虑用户的兴趣信息,从而改进了传统基于拓扑结构的好友推荐算法,为用户带来更精准的推荐;可视化部分本文提出了交互的层次气泡图对聚类进行可视化,让用户从聚类整体概览到局部细节进行观察和探索,另外通过力导引、饼图等形式展示了用户拓扑结构以及用户兴趣信息,并设计了多种交互形式帮助用户理解数据分析结果,支持用户自主得探索和分析数据中潜在的信息。  论文的主要工作如下:  (1)基于用户兴趣的用户聚类与可视化:本文通过用户电影评分数据提取用户兴趣特征向量,并基于该用户特征向量对用户进行聚类。对于豆瓣网数据的聚类结果显示该方法可以对社交网络中的用户进行有效的聚类。进一步设计基于层次气泡图的交互可视化展示聚类结果,通过方便的交互操作可以从总体概览到局部细节感知基于用户兴趣聚类的信息。  (2)结合评分信息与拓扑结构的好友推荐算法及可视化:在好友拓扑结构的基础上结合用户兴趣的计算,本文提出了一种改进的好友推荐算法。对豆瓣网社交数据进行实验,实验结果表明该算法较传统基于拓扑的好友推荐算法准确度更高。进一步,为了让用户更好地理解推荐结果,设计了基于多视图联动的可视化展示全局用户的网络拓扑和局部用户的兴趣网络。通过联动交互的设计,使用者可以通过点击、缩放、高亮等方式比较不同用户间的兴趣差异。  (3)面向社交网络的数据分析与可视化原型系统:在上述研究的基础上,本文设计并实现了一个面向社交网络的数据分析与可视化原型系统,该系统将上述数据分析以及可视化工作有机结合在一起以方便用户操作。原型系统包括后台数据分析模块以及前台可视分析模块。系统后台进行数据聚类、好友推荐、可视交互的计算;前台提供了多个联动的可视分析界面,该可视界面采用节点连接图、饼图、层次气泡图等不同可视手段来展现和分析社交网络中各数据间的关系。
其他文献
Web2.0的发展加剧了信息过载的问题,帮助用户从Web获得有用的信息是当前的研究热点。本文课题是研究如何将Web社会网络与协同过滤技术相结合,以更有效帮助用户从Web获取有用信
移动机器人路径规划是机器人研究领域最基本的环节之一,包括环境建模和路径搜索两个子问题。常见的栅格法由于其计算简单,易于实现和维护,已被广泛的应用于路径规划的环境建
随着固态硬盘(Solid State Disk)在高端数字领域的广泛应用,用户数据的存储安全成为一个重要课题。现有的数据保护技术有软件加密、Trusted Platform Module(TPM)芯片、加密
随着软件规模的不断增大,软件缺陷的检测愈加重要,一个不起眼的小错误,可能会导致巨大的损失。然而长期以来,程序中冗余代码的存在被认为是可以忽略的问题,认为对程序不会造
为高效利用数量逐渐增长的三维模型资源,并有效避免三维模型检索中输入源限制的问题,本文介绍了基于特征线条的三维模型检索方法,主要针对模型视图与上下文图像两类检索。本文首
随着Java开源运动的不断发展,从数据持久层到业务逻辑层再到表示层都涌现出一批优秀的轻量级框架,从而极大地推动了J2EE技术的发展。传统的以EJB为核心的J2EE架构由于引入了
Deep Web(深层网络)是指无法被传统搜索引擎索引、需要通过查询接口搜索在线数据库并动态生成的网络资源。与Surface Web(浅层网络)相比,Deep Web拥有更为丰富、专业和高质量
随着计算机网络的普及,传统的有线网络已经不能满足日益增长的应用需求,无线移动网络正在得到越来越广泛的应用。由于无线移动网络性能不稳定、容易受到外界干扰等特点,无线移动
无线多播是传播共享媒体及数据的有效技术,广泛的应用于移动TV、体育直播、视频会议、地域服务、软件升级以及网络管理等服务中。得益于无线传输介质的的共享特性,一次多播传输
随着网络和制造业的迅猛发展,企业内的系统集成已不能满足密集型业务的需求;Web服务是一种新型的松耦合的,跨平台的分布式计算技术,采用Web服务技术进行网络化制造和生产,可以