论文部分内容阅读
在线社交网络的快速发展,使得网络用户可以从中获取大量的信息。近年来,无线通信技术和定位技术的发展进一步增强了社交网络服务,允许用户通过移动设备进行在线签到并在社交网络上分享他们的兴趣点体验。这些以位置属性作为考察对象的社交网络被称为基于位置的社交网络,其得到了越来越多的关注,并且被广泛开发应用,如Foursquare,Gowalla,Facebook Place和Geo Life。位置社交网络使得线上虚拟社会和线下真实世界得到了有机结合,从而产生了海量的签到数据,这些签到数据可以用来研究用户的行为模式,并挖掘用户对兴趣点的偏好。为了提高位置社交网络中的用户体验,兴趣点推荐应运而生,其通过挖掘用户的历史签到记录并利用位置社交网络中的情景信息,来为用户推荐有趣的地点。兴趣点推荐已经成为了一个热门的研究课题,得到了学术界和工业界的广泛关注。传统的兴趣点推荐研究忽视了用户行为的连续性,这种签到行为的序列模式是用户行为方式的重要特征。本论文认为兴趣点推荐系统应该根据用户的当前位置,为用户提供及时高效的兴趣点推荐服务。最近的一些工作将上述问题定义为连续兴趣点推荐(也称为下一个兴趣点推荐),并对该问题展开了研究,用以预测用户下一步要访问的兴趣点。连续兴趣点推荐不仅可以帮助用户探索自己喜欢的城市,而且还可以帮助广告商将有针对性的广告推送给潜在客户。然而,实现准确的连续兴趣点推荐是具有挑战性的,这是因为用户的签到行为是一种隐式反馈,而且每个用户的历史签到数据是极其稀疏的。基于上述挑战,本论文对连续兴趣点推荐模型和算法进行了研究,通过融合位置社交网络中影响用户签到行为的因素开展研究工作,旨在为用户提供准确高效的位置服务。本论文的主要内容和创新点总结如下:(1)基于潜在行为模式的连续兴趣点推荐。用户在不同的情景下,会表现出不同的移动模式和行为规律,本研究基于用户在不同情景下的潜在行为模式对连续兴趣点推荐进行建模。具体而言,本研究采用三阶张量模型对连续签到行为进行建模,通过Softmax函数将个性化的马尔科夫链与潜在行为模式相结合,并构建了基于贝叶斯个性化排序算法的优化标准对模型进行优化。在参数学习阶段,使用期望最大化算法对模型参数进行迭代求解。通过在三个真实权威的位置社交网络数据集上进行广泛的实验,验证了本研究提出的模型相比于目前先进的推荐模型有着显著的性能提升。(2)基于分类感知的连续兴趣点推荐。兴趣点的分类信息有助于建模用户对兴趣点的偏好,因此很多研究工作试图融合分类信息来提升兴趣点推荐的性能。然而,当前的研究工作普遍受到高计算复杂性的制约,此外,用户在兴趣点之间的移动模式尚未得到深入的研究。为此,本研究提出了一个两阶段的连续兴趣点推荐框架。在第一阶段,使用列表级贝叶斯个性化排序算法优化三阶张量,并通过该张量预测用户接下来要访问的兴趣点分类。在列表级贝叶斯个性化排序算法中,本研究分别使用Plackett-Luce模型和交叉熵模型建模排序列表的似然函数。在第二阶段,根据第一阶段预测的兴趣点分类生成候选兴趣点集合,并综合地理距离影响和分类排名影响对候选兴趣点进行排序。本研究利用兴趣点分类信息建模用户在兴趣点分类之间的移动模式,使得该推荐框架可以向用户推荐其尚未访问过的兴趣点。在两个真实权威数据集上的实验结果表明,本研究提出的算法相比于目前先进的算法有着显著优势。(3)基于签到时间间隔模式的连续兴趣点推荐。用户签到行为的时间效应在连续兴趣点推荐中起着重要作用,大多数的当前研究工作都利用用户签到的时间戳来提升推荐性能。假设连续签到之间的时间间隔中带有多样化的用户行为模式信息,本研究提出了一个基于因子分析的概率模型,该模型从三个方面对用户的兴趣偏好进行建模,分别是基于三阶张量模型的个性化偏好,基于地理约束影响的地理距离偏好和基于连续潜在变量的时间间隔偏好。在该模型中,通过最大化用户在兴趣点之间移动的后验概率,可以估算用户对接下来要访问的兴趣点的转移概率,并预测转移到下一个兴趣点的时间间隔。本研究使用期望最大化算法求解模型参数。实验结果表明,本研究提出的模型在连续兴趣点推荐任务和时间间隔预测任务中都优于目前先进的方法。