基于门店位置的协同过滤推荐算法

来源 :电脑知识与技术 | 被引量 : 0次 | 上传用户:jiekoala
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
  摘要:传统的协同过滤推荐算法一般基于用户对商品的评分而并未考虑用户的地理位置信息以及受到数据稀疏性问题的影响很大,该文针对以上问题,提出了一种基于用户地理位置的协同过滤推荐算法,根据用户的距离计算用户相似度,结合用户的评分信息对传统的user-based算法进行改进。实验结果表明,在对商品进行top-k推荐时,改进后的算法具有更好的推荐效果,推荐精确率和召回率都有所提升。
  关键词:地理位置;距离;协同过滤;门店推荐;位置相似度
  中图分类号:TP311 文献标识码:A 文章编号:1009-3044(2018)33-0012-03
  随着移动互联网的快速发展,越来越多的用户通过手机等移动设备接入互联网,网络中的数据也呈现出爆炸增长的趋势,如何充分利用这些数据,为移动用户提供更好的推荐内容显得越来越重要。传统的推荐方式有基于内容的推荐、基于关联规则的推荐、协同过滤推荐、基于矩阵分解的推荐、集成学习推荐,其中协同过滤推荐是在移动推荐领域应用最广泛的推荐算法。传统的协同过滤算法面临很多的不足,如受用户评分标准不一致性和数据稀疏性影响较大,针对这些问题,我们考虑引入门店的地理位置信息,通过结合门店的距离[1]来实现更加精准的用户推荐。
  一般来说,由于用户个体活动范围的局限性,用户倾向于选择固定地区的门店进行消费,距离该个体消费门店越远的店,其产生消费的成本越高,消费的概率也越低。目前一般的推荐系统并没有深入研究门店聚集性对用户消费产生的影响,本文综合用户喜好和门店的距离因素,提出了一种加入门店地理位置的协同过滤推荐算法[2][5],用于为门店寻找合适的用户。
  1数据与算法
  1.1数据来源
  本文数据集来自门店交易数据。门店每天产生交易流水,其中包含了丰富的用户行为记录,结合门店本身的地理位置信息,产生了包含地理位置的行为数据[3]。原始数据集为北京市某个商圈的所有门店消费记录以及门店的地理位置坐标,经过预处理过后,如表3所示。mid为门店ID,uid为用户ID,rating为门店对用户的评分,这里采用的是隐式评分,即只要有过消费记录,不论消费多少次,即把评分置为1,表名该门店的用户偏好。latitude为门店的纬度坐标,longitude为门店的经度坐标。
  1.2推荐算法
  传统的协同过滤算法是从门店-用户的二元评分矩阵中计算目标门店与其他门店的相似度,找到距离目标门店最近的n个门店,综合这n个门店对用户的评分,对目标门店对用户的评分,最终得出该门店的top-k用户推荐。
  在计算目标门店与周围门店的相似度时,相似度的计算方式主要有两种:皮尔逊相似度和修正的余弦相似度。
  一般采用的距离衰减函数主要有3种[9],高斯衰减函数、指数衰减函数、幂函数衰减。如图1所示,可以看出,指数函数和幂函数在门店距离较近时衰减非常快,高斯函数在门店间距较低时衰减较为平滑,我们采用高斯衰减函数。
  针对门店最近邻个数的取值,从实验结果图3、图4可以看出,最近邻个数越低,precision值越高,以top-k取值20为例,当nearest达到最低为3时,precision、recall、f1值最优,推荐效果最好。这说明用户在选择门店进行消费时,与门店的相关性很高。
  综合以上试验结果可以看出,在精确度(precision)、召回率(recall)、f1这3个指标上,基于地理位置的协同过滤算法都要明显的优于传统协同过滤算法。
  3结语
  本文提出了一种基于门店地理位置的协同过滤推荐算法,通过计算门店地理位置的相似度,对比传统的通过皮尔逊相关系数与余弦距离的相似度计算方法,取最近邻的N个门店进行top-k用户推荐。实验结果表明,基于门店地理位置相似度的协同过滤算法在本数据集上要优于传统无改进的协同过滤算法。
  参考文献:
  [1] 刘树栋,孟祥武.基于位置的社会化网络推荐系统[J].计算机学报,2015(3802):322-336.
  [2]田恩菊.基于地理位置的朋友推荐研究[D].山东大学,2017.
  [3] 任星怡,宋美娜,宋俊德.基于用户签到行为的兴趣点推荐[J].计算机学报,2017(4001):28-51.
  [4] 朱鵬军.基于用户行为特征的性别预测研究[J].电脑知识与技术,2018(1402):158-160.
  [5] LogeshRavi,SubramaniyaswamyVairavasundaram,SilviaConforto.ACollaborativeLocationBasedTravelRecommendationSystemthroughEnhancedRatingPredictionfortheGroupofUsers[J].ComputationalIntelligenceandNeuroscience,2016.
  [6] JieBao,YuZheng,DavidWilkie,MohamedMokbel.Recommendationsinlocation-basedsocialnetworks:asurvey[J].GeoInformatica,2015(193).
  [7] HaidongZhong,ShaozhongZhang,LinglingHua,WentingYuan,XudongZhao.AConceptualandTechnologicalFrameworkonLocationBasedPersonalizedRecommendationforMobileE-commerce[J].JournalofConvergenceInformationTechnology,2013(810).
  [8] ACOLLABORATIVELOCATIONMODELFORCELLULARMOBILEPOSITIONLOCATION[J].JournalofElectronics,2004(06):449-453.
  [9] YuLiu,ChaoguiKang,SongGao,YuXiao,YuanTian.Understandingintra-urbantrippatternsfromtaxitrajectorydata[J].JournalofGeographicalSystems,2012(144).
  【通联编辑:光文玲】
其他文献
随着人类基因组学计划(HGP)的完成,基因组学研究的重心自然地从结构基因组学转向功能基因组学,弄清每个基因的功能、发现与其它基因的关系及其表达调控方式,成为后基因组时代的重
中等职业学校的课程教学是各个专业建设的重要手段,其课程的设计与二次开发必然是中职学校课程改革的深化和发展。因此,对基于专业群的某一重要课程进行必要的发展是专业群建
在小学语文课堂教学中,朗读是不可或缺的重要环节,扮演着关键性角色,有感情地朗读课文能够帮助学生更加深入地理解文本内容,受到课文情感熏陶,实现"美感、乐感、语感、情感"
<正>德国哲学家伽达默尔曾经说过:我们每天都沐浴在文化之中,但倾我们之所知、所能也未必说出什么是文化。这正是文化的神秘之处。哲人黑格尔比喻说:文化好比洋葱头,剥掉一层
期刊
《深圳市建设儿童友好型城市行动计划(2018-2020)》(以下简称《行动计划》)的制定和出台有着政策议程建立的内在逻辑。从美国政策学家金登的多源流理论来看,儿童友好型城市建
目的 探讨颈椎病患者心理健康状况,为康复治疗提供依据。方法 采用焦虑自评量表(SAS)和抑郁自评量表(SDS)对30例颈椎病患者进行评定。结果 颈椎病患者和中国常模相比有显著的
子宫肌瘤是妇产科常见的良性肿瘤。以往主要采用手术治疗,近年的研究表明,子宫肌瘤的发生、发展与雌、孕激素受体有关。米非司酮用于治疗子宫肌瘤,国内、外已有数篇报道,认为其治
盆腔炎是一种常见的妇科疾病,多见于育龄期妇女。慢性盆腔炎病程缠绵,反复发作,影响患者的身体健康。近来对中药治疗慢性盆腔炎的研究较多,归纳起来主要是从中药口服、中药外敷、
<正>柳小姐:在你眼里,我一直都是情商为负数的&#39;菜鸟&#39;。你不明白,为何如此善于交际的你竟会生出这样一个不善交际的我。我也不明白,就算陪着你去了很多场聚会,我依旧
期刊
JNC7首先引入“高血压前期”这一概念-TROPHY试验结果显示“治疗”这一阶段的高血压有益处,但是疗程应该多长,成本效益比如何还无定论。英国有两篇关于高血压诊治指南的研究报