基于微博数据的个性化好友推荐算法研究及系统实现

来源 :山西大学 | 被引量 : 2次 | 上传用户:aig2008
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着微博、微信等社交工具的普及,每个人都成为了社交网络信息的发布者及传播者,这些社交服务也因此积累了大量用户产生的数据信息,其中包括用户的个人档案、社交关系、文本内容等。大量的用户数据不仅成为工业界进行大数据分析,从而认识用户、了解用户的重要信息来源,同时也为学术界的研究工作提供了充分的数据支持。但不容忽视的是社交工具给人们生活带来便利的同时,网络中的信息过载问题也随之日趋严重。面对海量的信息,人们很难从中即时发现自己真正感兴趣的内容,因此,个性化推荐系统便作为一种有效的解决手段在各类社交网站中得到应用。本文针对微博用户数量急剧增长的问题,利用用户发布的博文内容及已存在的关注关系为用户推荐潜在的好友。具体研究内容和结论如下:(1)基于用户博文主题及网络结构信息的好友推荐方法由于人们在书写用户属性信息时的随意性和虚假性,使得在进行用户兴趣建模时用户属性无法得到有效利用。针对该问题,本文提出了一种基于兴趣偏好和网络结构的混合好友推荐方法。首先采用LDA主题模型对用户微博进行建模,从中挖掘用户兴趣,并依据同质性原理对目标用户兴趣进行修正。同时,采用一种新颖的基于网络结构的预测指标度量用户间的亲密程度。实验结果表明,与仅利用网络结构的推荐效果相比,加入用户兴趣后的模型在准确率及AUC指标上有显著提升,同时也可提高部分博文主题不明确用户的兴趣挖掘效果。(2)基于改进Link-LDA的用户兴趣挖掘方法LDA主题模型仅仅利用文本内容挖掘用户兴趣分布而忽略了已存在的好友关注信息。针对该问题,本文放弃了传统的LDA而借鉴一种新颖的Link-LDA模型,并对其进行一定改进使其能够更好地适应社交网络上用户兴趣的挖掘工作。实验结果表明,这种新颖的兴趣挖掘算法可以更加有效地刻画用户对不同主题的偏好程度,并在好友推荐任务中取得更加精准的推荐效果。(3)微博好友推荐系统的设计与实现采用B/S架构,spring-MVC设计框架,设计一款微博好友推荐系统。该系统模拟了真实的社交网络,并根据本文提出的推荐算法为用户推荐新的好友,同时将推荐结果及相关推荐解释展现在好友推荐模块中。
其他文献
MHC分子在免疫学中扮演着重要角色,该分子与多肽的结合反应是引起T细胞免疫的重要前提,所以MHC分子与多肽绑定预测问题成为了生物信息学中的研究热点。这方面的研究不仅有效的
随着万维网的快速发展,可搜索的在线数据库数量大大增加。这些在线可搜索数据库中的数据往往隐藏在查询接口之后,被称为深层网络。为了更好地利用这些隐藏在查询接口后的深层
科技在进步,时代在发展。在这个"读图"和"听音"的时代,语音技术已不再陌生,让机器开口"说话"也不再是幻想。目前,语音合成的清晰度已达到人们的要求,流畅度却尚待提高,合成的
网格(Grid)是一个分布式和并行计算的支持平台,是一种无缝、集成计算和协同环境。它关注于在动态的、多机构的虚拟组织中协调资源共享和协同解决问题,核心思想是在一组参与问
随着计算机网络技术的迅速发展,人们逐渐从传统的桌面应用程序向在线的web应用程序迁移。web应用程序有方便易用、跨越不同平台等优点,但是用户的数据分散在各种不同的web应用
虚拟人动画是当前计算机图形学领域的一个研究热点,在游戏影视、体育仿真和可视通信等产业都得到了广泛的应用。本文针对虚拟人的脸部建模与动画、人体运动合成等环节开展研究
随着信息化的全面推进和网络技术的迅猛发展,计算机支持的协同工作(Computer Supported Cooperative Work,CSCW)越来越受到人们的青睐。协同编辑是CSCW的研究热点,应用前景广
软计算是指将处理模糊现象的方法与仿生算法结合、解决传统计算不能解决的复杂问题的方法。已有的研究成果显示出软计算特有的价值和作用。本文研究了中介真值程度度量(measu
内河航运在我国交通运输中地位越来越重要,但随着内河船舶数量不断增加,且船舶不断向大型化高速化发展,以及内河环境复杂多变和内河河流弯曲等这些问题给船舶航行安全带来了严峻
软件测试是保证软件质量与可靠性的重要手段,随着软件复杂性的提高,软件测试在软件开发过程中的地位也越来越重要。然而,软件测试过程复杂,且重复性较高。提高软件测试的自动化程