基于社交网络的个性化微博关注推荐系统的研究与实现

来源 :山东大学 | 被引量 : 0次 | 上传用户:zhongguohuhu
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着大数据时代的到来,新技术层出不穷,社交网络的发展如火如荼。微博是最热门的社交平台之一,拥有着庞大的用户群体,每天产生无数热点信息。在微博中,人们可以发布原创消息;用户可以在系统中找出自己感兴趣的对象,成为其粉丝;转发、评论、@等行为极大地丰富了用户之间的互动体验,也使得微博用户之间的交互更加多元化。然而,信息的泛滥也让用户难以选择,出现了信息过载的现象。推荐系统是用户和项目之间的桥梁,能够挖掘和捕捉用户的偏好,主动给用户推荐相关内容,目前已经被应用在很多场景下。协同过滤算法是其中最为经典的算法之一,然而该算法非常依赖用户-项目之间的评分数据,并且面临着严峻的数据稀疏性问题。在微博中,不存在用户对于项目的评分数据,因此不能简单地将协同过滤算法应用在微博关注推荐中。微博的社交网络特征给推荐问题提供了更多解决方案,融入社交行为、社交信任、邻居意见、隐语义模型等都会大大改善推荐的性能。本文首先对推荐系统的发展以及微博关注个性化推荐进行了研究,介绍了协同过滤算法的相关技术和原理,阐述了当前算法面临的困难与挑战。通过腾讯微博数据集分析了微博社交网络的相关特征、社交图谱、用户关系等,重新定义了微博关注推荐的相关术语,对微博中的不同社交行为进行建模,并介绍了系统的整体流程、技术平台、系统环境等。针对Top-N推荐问题,提出了基于社交相似度的微博关注Top-N推荐算法。根据微博关注行为、互动行为以及历史推荐记录分别计算相似度,通过计算出来的相似度找出最近邻集合,在此基础上给用户进行推荐。在微博数据集上对比了不同相似度计算方法的准确率、召回率和Fl-measure,并在Hadoop平台上利用MapReduce对算法进行了并行化设计,提高了算法的执行效率。针对评分预测问题,提出了融合社交信任和隐语义模型的微博关注推荐算法。将用户的历史推荐记录建模为评分矩阵,引入社会化推荐,通过用户之间的互动行为数据(包括@、评论和转发)计算用户之间的隐式信任,从用户的直接社交关系中得到用户之间的显式信任,将显式信任和隐式信任结合来构建扩展信任矩阵并融入SVD++模型。最终在KDD Cup 2012数据集上的实验表明算法在RMSE和MSE上得到了更好的结果。
其他文献
伴随着网络融合的推广,无线网络将成为互联网通信量进一步发展的重要平台。近年来,网络通信量有了爆炸性的增长,尤其是具有延迟约束的视频通信量。随着网络规模与业务的发展,到20
  现代无线通信飞速发展,无线设备用户的增加以及有限的频谱空间,随之出现了新的数据传输模式( OFDM,WCDMA等)以及高效的频谱调制技术(QAM 等),而这些非恒包络、高效率的调
自然三维电视(Natural 3DTV)系统,作为一种新型的视觉媒体,可以让用户身临其境地感受到真实的立体世界,是当今高清平板电视之后又一个新的发展方向。Natural 3DTV系统的一项
高速发展的通信技术对信息传输速率和频谱利用率提出了越来越高的要求,MIMO技术在不增加发射功率的条件下可以成倍的增加频谱利用率,因此得到广泛的应用。复杂的无线信道使MIMO
图像和视频是与人感官最密切的信息载体,而网络通信、大规模集成电路以及传感器等技术的飞速发展和人们生活、娱乐、学习和科研等需求的快速提升,不但使人们获取图像和视频的
随着网络通信技术不断地发展,宽带网络的结构变得越来越复杂。为了能更有效地管理和维护网络,就需要对网络进行性能评价,从而达到优化网络配置的目的。随着网络自相似的发现,大量
联合低密度奇偶校验(Low-Density Parity-Check,LDPC)码的比特交织编码调制迭代译码(Bit-interleaved Coded Modulation Iterative Demodulation/Decoding,BICM-ID)技术,由于具
随着网络信息化的快速发展,以云计算(Cloudcomputing)和IPTV(InternetProtocolTV)为代表的互联网应用服务正逐渐走进千家万户,日益增长的网络服务对网络带宽提出了更高的要求。但是
  随着人们对日益增长的高品质多媒体服务需求的不断增长,第三代合作伙伴计划(3GPP)为通用移动通信系统(UTMS)制定了一个长期的演进计划(LTE)。数字中继能够提高系统覆盖和