论文部分内容阅读
随着互联网技术的快速发展与普及,网络空间与真实世界正在不断融合,简单的线上社交已经不能满足用户的社交需求,一种将用户线上虚拟社交关系与线下实际面对面沟通相结合的新型社交网络——基于活动的社交网络(Event-based Social Network,EBSN)由此而生。EBSN网络平台一方面给用户提供线上交流的机会,另一方面以组为单位帮助用户协调组织线下的社交活动。EBSN与传统社交网络平台相比,同样面临着严峻的“信息过载”问题,用户难以从海量数据中发现自己最感兴趣的活动,迫切需要合适的推荐技术来提高平台的运行效率、提升用户的使用体验与忠诚度。但EBSN的推荐问题和传统社交网络不同,由于每个活动都是崭新的内容,缺乏历史评价信息和参与记录,EBSN网络中的推荐算法面临更严重的“冷启动”问题,本文基于挖掘用户和社交活动更深层次网络特征的解决方向,提出了一种基于深度神经网络的社交活动推荐算法,论文的主要研究工作包括:(1)构建EBSN实验数据集。设计网络爬虫,通过公开API采集典型的EBSN网络——Meetup网站的社交活动、小组、用户等数据,构建EBSN数据集,并验证其符合现有复杂社交网络的结构特征,可为进一步研究EBSN提供数据基础。(2)分析EBSN的社交、地理位置、时间、语义特征,并提出了这些特征的向量化表示方法。具体来说,对社交影响因素采用图嵌入的算法,将网络中的用户节点表示成向量;将活动举办地的经纬度采用基于球面距离的DBSCAN算法划分区域,对划分后的区域生成One-hot编码,将地理位置因素向量化;对活动时间按照用户行为习惯划分时间段,根据划分后的时间段采用One-hot编码将时间因素向量化;最后,对用户和待推荐活动的语义因素采用潜在语义分析算法生成表征活动和用户偏好的语义向量。(3)设计基于深度神经网络的社交活动推荐算法。首先对目标用户和待推荐活动从社交、地理位置、时间和语义四个方面建模,得到用户和社交活动的特征表示向量,并将其作为深度神经网络的输入;其次,为了解决EBSN中的活动冷启动问题,本文利用深度神经网络强大的表征能力,深入挖掘用户和社交活动的关系,学习用户和社交活动的隐含特征向量,计算用户对待推荐活动的评分值;最后,将评分值最高的若干个活动推荐给目标用户。(4)验证本文提出的社交活动推荐算法的有效性。首先,对深度神经网络的输出特征维数进行讨论,综合考虑推荐效果和模型性能选择最优输出特征维数;其次,研究社交、地理位置、时间和语义这四个影响因素对本文推荐算法效果的影响;最后,将本文提出的社交活动推荐算法与其他推荐算法进行比较,实验结果表明,本文的推荐算法在纽约和洛杉矶这两个城市的数据集上均得到较优的性能。