论文部分内容阅读
近年来,各种学术会议、座谈会、研讨会等学术活动在全球范围内开展地越来越广泛,这类学术活动蕴含着海量的学术资源,包括参会者的信息、学术论文以及学术报告等。通过这些学术资源,参会者可以培养潜在的合作可能、增强社会感知能力并促进彼此之间的交流,因此如何合理利用这些学术资源变得非常重要。然而,海量的学术资源同时引起了信息过载的问题,这使得参会者难以获得自身感兴趣并恰好需要的资源。因此,缓解学术资源的信息过载问题,使参会者能够准确获得必要且感兴趣的信息来增强社交关系、促进个人学习是一个重要的研究方向,亟需被深入关注。一方面,推荐系统在我们的社交生活中非常普遍并占有重要的地位,适合用来解决学术会议中的信息过载问题。另一方面,与传统的学术会议相比,智能会议能够让参会者通过移动智能手机与其他人交互并且获取社交推荐。本文中,我们创新性的整合了用户(参会者)的社会属性(社会关系和度中心性)、用户的兴趣和研究分类,来研究智能会议中基于社会感知的推荐,并解决如下三个问题:(1)如何利用社会属性为参会者推荐学术论文,以降低他们在获取感兴趣的学术论文时遇到的困难。(2)如何利用社会属性为参会者推荐学术报告会场和环境,使得参会者能够根据他们与报告人的共同兴趣参加合适的报告会。(3)如何根据参会者的研究兴趣来为他们推荐兴趣相关的研究者,以增强学术交流和合作。针对以上三个问题,我们的提出了创新性的解决方案,即本文的主要贡献。(1)针对第一个问题,我们分析了用户的社会关系属性,提出了基于社会感知的学术论文推荐(SARSP)算法。SARSP通过计算参会者之间的接触时间和接触频率来定义他们之间的社会联系,从而有效区分参会者之间的强关联和弱关联,并且能够使一些积极的参会者根据某个社会关联阈值来决定把他们的学术论文推荐给其他强关联的参会者。另外,SARSP进一步计算参会者的众分类,并利用归一化的方法生成参会者的分组属性。通过众分类和组属性使积极的参会者将他们的学术论文推荐给其他同组参会者(同时间内更多的参会者),我们在相关数据集上进行了一系列基准实验,以评估SARSP推荐效果,分别称为:社会关联推荐和社会组推荐。评估指标包括召回率、准确率和F值。实验结果表明,SARSP在上述评估指标方面优于其他最优对比算法。另外,通过引入社会属性信息,SARSP有效地减少了冷启动和数据稀疏带来的挑战。(2)针对第二个问题,我们根据社交群体和上下文来分析用户的社会关联和度中心性,提出了基于社会感知的会议场景和环境推荐(SARVE)算法。SARVE通过参会者与报告者之间接触的时间和频率来计算他们之间的社会关联性,并计算报告者的度中心性来度量他们的知名度,来表示参会者与报告者之间的弱关联和强关联。从而,基于参会者与报告者的强关联性,并结合社会关联强度阈值和报告者受欢迎程度来给参会者推荐学术报告。同时,SARVE进一步计算参会者和报告者在研究兴趣方面的关联强度,并利用一个合适的模型来适配上下文关系,形成有效的推荐。我们在相关数据集上进行了的一系列基准实验,评估了SARVE推荐结果,分别称为:社会关联推荐和社会上下文推荐。评估指标包括准确率、召回率和F值。实验结果表明,SARVE在上述评估指标方面优于其他最优对比算法。另外,由于引入社会属性和上下文环境,SARVE有效的减少了冷启动和数据稀疏带来的挑战。(3)针对第三个问题,我们分析了预估的社会关联和用户的个性化特征,提出了基于社会和个性化感知的参会者推荐(SPARP)算法。该算法利用参会者之间的接触时间和接触频率来计算他们之间的预估(精确)社会关联强度。为了促进学术合作,SPARP利用强个性化特征和社会关联性加权混合的方法,计算并向参会者推荐不认识(弱关联性)的其他参会者。我们在相关数据集上进行了一系列基准实验,来评估SPARP推荐结果,分别称为:合并相似系数与不同权值参数。评估指标包括准确性、平均绝对误差(MAE)、和归一化的平均绝对误差(NMAE)。实验结果表明,与其他最优算法相比,在上述评估指标方面,SPARP表现更好。另外,由于利用了社交信息和个性化特征整合的加权混合方法,SPARP积极避免了冷启动和数据稀疏的问题。