论文部分内容阅读
互联网的高速发展将人们带入了信息化时代,而信息量的指数级增长意味着大数据时代的到来。如何从海量数据中分析和挖掘出潜在有价值的知识或者规律,帮助用户找到感兴趣的信息意义重大。如今,电子商务以及SNS等在线社会网络服务已经成为人们日常生活中不可或缺的一部分。然而,人们享受在线社会网络带来便利的同时造成了信息过载问题。此时,推荐系统应运而生,它利用数据挖掘、机器学习等方法从海量信息中找到用户潜在感兴趣的内容。因此推荐系统的研究具有重要的理论价值和现实意义,得到了国内外学者的广泛关注。目前,网络科学已经成为最具有活力的交叉科学。其中,关键节点挖掘是网络科学中一个具有广泛应用的重要课题。例如,关键节点的失效将有可能导致整个网络的瘫痪,甚至有可能导致其他相关网络的瘫痪(级联失效)。然而,现有的关键节点挖掘通常是针对单模网络进行的,如何将节点重要性挖掘应用到基于二部图的推荐系统中将是一个很有意思的研究课题。本文首先研究基于二部网络的个性化推荐算法,进一步结合用户社交网络提高推荐算法的性能,主要研究工作如下:(1)在二部网络中随机游走推荐算法给大度商品过高的权重,导致其多样性较差,本文研究了在随机游走过程中将商品的度考虑进来,降低大度商品的影响从而同时提高推荐系统的准确率和多样性。另外,本文还研究了在推荐系统中同时将随机游走算法与热传导算法考虑进来时的权重分配问题,发现给予随机游走过程和热传导过程相同的权重,并且提高大度商品的影响将同时提高推荐系统的准确率和多样性。(2)目前很多性能卓越的推荐算法都是通过调节一个可调参数来获得最佳的推荐性能。为了获得这个最优推荐性能,需要使用测试集信息来遍历参数以得到最优参数值。但是在真实的在线系统中测试集信息是不可知的。在一般情况下,这个参数是针对相应的算法考虑了整个系统的推荐性能,这个最优参数由数据集和算法本身的一些属性来确定。本文假定最佳参数应该是与数据集的某些分析结果一致,从数据的角度出发,根据数据和算法直接得到一个可接受的估计参数值,并且该参数可以在不知道测试集的情况下来做出估计。最后本文发现只使用少量用户的信息就可以对整个系统的最优参数做出估计。(3)针对如何利用社交网络进行推荐这一问题,本文研究了计算有向社会网络上用户之间的社会相似性的三种方法,然后使用一种非线性的方法将社会相似性与用户偏好进行加权合并,最后使用协同过滤框架来产生推荐结果。通过两个调优参数来获取系统的最优参数和性能,并且调查了社会相似性和个性化偏好在推荐系统中所起的作用大小。通过实证研究了用户社会相似性与用户偏好之间的关系。最后通过实验说明了本文所提出的方法的优越性,尤其在推荐冷门商品上的能力。(4)针对传统的重要节点挖掘主要集中在单模网络中这一缺陷,研究了具有社会网络和二部网络的耦合社会网络中的重要节点排序算法,与LeaderRank算法得到的影响力节点相比,传播速度更快,传播范围更广。基于此,本文还研究了如何将关键节点挖掘应用到推荐中,提出了一种将耦合社会网络中的节点排序信息用到推荐系统中的方法,并且提高了推荐系统的准确率和多样性。综上所述,本文提出了在线社会网络中信息推荐和重要节点挖掘的技术和方法,并且将节点的排序信息应用到了推荐系统中,最后通过实验分析验证了本文所提算法的有效性。本文的研究丰富了在线社会网络中信息推荐和重要节点挖掘的研究方法,为信息过载问题的解决提供了有意义的探索。