一种基于用户购买葸向的个性化推荐模型

来源 :软件 | 被引量 : 0次 | 上传用户:oucuifang
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
  摘要:伴随随着互联网技术的发展,020餐饮领域发展迅速,然而平台同质化严重,个性化推荐已经成为提升用户体验和提高运营水平的一种主要方式。而传统的协同过滤方法在数据稀疏的情况下,用户推荐准确率不高。本文研究基于020餐饮行业背景,研究用户的行为对购买意向的影响,综合考虑购买行为、评价行,为等多种用户行为,判断用户的兴趣点,从而确定用户的购买意向,提出一种基于多种用户行为的购买意向模型。基于此提出基于购买意向的推荐方法。最后通过与传统基于用户的协同过滤算法进行比较,确定了本文推荐方法的有效性。
  关键词:行为分析;个性化推荐;协同过滤;推荐模型
  中图分类号:TP391.3
  文献标识码:A
  DOI:10.3969/j.issn.1003-6970.2015.12.019
  本文著录格式:安政磊,姚文斌.一种基于用户购买意向的个性化推荐模型[J].软件,2015,36(12):80-82
  0 引言
  近两年来,随着瓦联网的发展,020餐饮领域已经成为一种重要的商务模式。在丰要大城市中迅速的扩展开来。与此同时,其中的推荐系统却没有跟随发展,多数平台还停留在用户丰动获取商品信息的时代。这些平台同质化严重,全都标榜以用户为中心,然而由于原始的建站思路,并没有完全应用好快速发展的计算机技术,导致发展上的瓶颈。
  各种推荐系统层出不穷,推荐机制复杂多变。协同过滤算法已经被广泛的应用到各个推荐系统,但随着用户数量的增加和站点内容结构的日益复杂,协同过滤技术的一些缺点逐渐暴露出来,首要问题就是稀疏性,随着用户和项目的数量的增长,用户相似性矩阵也会急剧扩大。在维度巨大的相似矩阵并且用户参与度不是很频繁的情况下,推荐的可信度随之降低。
  目前多数协同算法研究和应用都集中在传统的电子商务,对于基于餐饮行业的协同过滤算法的推荐研究较少。协同过滤算法的研究目标丰要是商品。本文针对餐饮行业的特点,研究的丰要原子单位是餐厅,考虑不同用户行为对用户的购买意向的影响,基于用户的购买意向设计推荐算法,提高推荐准确率。
  1 用户行为的研究分析
  1.1 购买行为分析
  相交于传统电子商务的购买数据,020餐饮行业的购买行为确实不少,但是对于准确的分析用户购买意向和购买行为之间的关系这项复杂的工作来说,在数量上还是有一定差距。而用户的购买行为是用户对某商品研究的结果,因此,用户必然在前期进行过一系列与该商品相关的用户浏览行为,可见用户的购买行为还和用户的浏览行为紧密相关。为此需要建立基于PV兴趣统计出的用户购买行为模型,基于用户的兴趣发现用户的购买意向。分析步骤如下:
  Stepl:根据日志文件中浏览记录的定义找到所有餐厅访问的记录,过滤没有餐厅的浏览记录。同时,从数据库获取用户的购买记录。这两种记录作为本次分析的依据。
  Step2:针对以上数据,统计每个餐厅的访问次数和购买次数。两种数据对用户的购买意向的影响的程度显然不同,为了融合两种数据,为购买数据进行加权分析,餐厅的购买数据加倍,将数据整合在一起。
  Step3:根据商品的被访问时间和餐厅商品数量,来确定用户对某商品的购买意向。公式如1-1所示。
  ti表示用户浏览餐厅时间,Ci表示餐厅的商品数量。而现在多数平台还有其他查看商品的具体信息的弹出框页面以及能够查看单独商品评价和评分信息等。但是这些信息不具有代表性,所以行为分析时也对这些行为进行忽略。
  1.2 评价行为分析
  评价行为是用户购买意向的直接反馈,不仅是对本次购物感受的表达,还能够据此对用户未来的购买意向作出判断。可以通过对用户评价的情感分析,获取用户的购买意向。
  Stepl:建立基本语料库,选取常见情感表达词语,根据知网的基础语料分析库,将这些情感表达词语分别按照褒义词和贬义词的分别放到positive和negative两个集合中。
  Step2:短语或句子分词。对于020餐饮行业来说,这个领域内的表达情感的词语是有限的,且本文只针对用户的感情词汇进行处理。这样对评价样本进行分词,达到能够满足区分用户情感趋向的程度。采用字符匹配算法来进行分词。
  Step3:词语分类。为了构造用户评论的短语模型,需要对分词进行词性分析,明确评价信息中的名词、形容词等词性区别。
  Step4:构造评价内容的短语模型。
  Step5:计算短语的情感值。采用统计学方法,计算一个短语模型在positive和negative集合中的文本出现次数,分别结尾GNumber和BNumber。情感值计算公式1-2所示。
  Step6:根据用户评价内容分词,采用单词匹配分析算法,按照公式1-3计算整个评价内容的购买意向值。
  2 基于购买意向的推荐模型
  2.1 购买意向模型
  对用户行为进行分析,根据上节所述的用户购买意向和用户的购买行为以及用户购买意向和评价行为的关系计算用户的总体购买意向值。需要分别计算每个用户对每个餐厅的购买意向值并求意向值之和,意向值之和定义为T。
  T-upi+S
  (1-4)
  将购买意向值T作为计算用户相似度的指标。
  2.2 基于购买意向的推荐模型
  基于用户购买意向模型中用户购买意向的变化,构建基于购买意向的推荐模型。
  (1)循环更新待推荐用户的购买意向值。
  循环所有餐厅,通过购买行为计算当前用户u对第i个餐厅的购买意向度定义为Tupi(u,i),通过用户评论计算出当前用户u对第i个餐厅的购买意向值Ts(u,i),计算用户对该餐厅的购买意向总和,记为T(u),更新当前用户u对该餐厅的购买意向值。   (2)选择该用户u的购买意向最强的10个餐厅作为用户u的向量。作为和其他用户进行比较相似度的来源。采用余弦相似度进行用户相似度的比较,选择m个相似用户,根据普通协同过滤算法,根据待选集合中用户对餐厅的购买意向,得到中间推荐结果L1
  (3)对于选择出来的10个餐厅,从高到低分别附上10到1之间的权重,根据数据库内定的餐厅类别进行如下分析:1)统计每个类别的餐厅个数;2)将每个类别餐厅的个数和每个类别中权值最大的餐厅的权值相乘得到各个类别的一个值;3)在该类别中选择2k个同类餐厅作为中间推荐结果L:
  (4)将中间推荐结果L1和L2求交运算,当最终结果不到k个时,从L2剩余结果中在随机补选儿个,得到k个最终推荐结果
  3 实验对比分析
  3.1 实验对比标准
  本文的丰要目的是为了完成用户的推荐工作。针对推荐工作,有常用的两个评价于段,分别是召回率(3-1)和准确率(3-2)。
  其中Tn代表数据集合中用户u喜欢的物品的集合,Rn代表向用户推荐的物品集合。
  3.2 实验分析
  根据以上模型和算法步骤,根据用户日志文件和后台数据库提供数据,设置取相似用户数量取值范围为[50,100],实验结果如图l所示。
  实验结果表明,基于用户协同过滤算法和购买意向模型差距不是十分大,在开始时两者儿乎准确率同等大小。并且随着召回率的增加,两者的准确率都在降低。区别是基于用户的协同过滤算法在开始时下降明显,而后者下降不是很明显,出现这样情况的原因可能是,基于购买意向模型的推荐算法综合考虑了用户的购买行为、浏览行为、评价行为对用户的购买意向的影响,从而能够比基于用户的协同过滤算法在推荐任务上完成地稍微好一点。
  4 结论
  协同过滤技术已经被广泛应用,但有很多还停留在最简单的基于用户的协同过滤,随着用户行为种类和数量的不断增多,这些隐藏的行为比显示的行为提供更多有关用户购买意向的信息,然而很多现有的用户网络行为却被推荐系统忽视。针对以上问题,本文从用户行为角度出发,并且抓住常见的隐式行为,分析用户行为和用户购买意向的关系,进而根据用户行为建立用户行为和用户购买意向的整合模型,根据这个模型设计出一套用户推荐算法,经实验证实,该方法虽不能极大提高推荐效果,但确实在某些情况下提高了召回率和准确率,为了更好地优化推荐效果,还应该继续研究基于用户行为的购买意向的优化计算方法。
其他文献
摘要:针对高动态环境下频率和频率变化率的估计问题,本文分析了常用的载波同步的帧结构及方法,并在此基础上为满足估计频率变化率的要求提出了一种间插式帧结构及算法,仿真表明此算法有很好的估计精度和性能。  关键词:高动态;频率变化率;间插式帧结构  中图分类号:TP29 文献标识码:A DOI:10.3969/j.issn.1003-6970.2015.05.027  0 引言  物体相对运动速度的变化
期刊
摘要:探讨互联网+时代背景下,高职专业核心课程教学改革的模式,结合学生职业素养训练的需求,设计一种嵌入职业素养训练的专业核心课程微平台的框架,并以防火墙技术课程为例,给出具体的设计方案,为高职网络安全类专业核心课程基于微信平台的教学改革提供一种切实可行的方法,提高人才培养质量。  关键词:职业素养;专业核心课程;微平台;防火墙技术  引言  信息时代背景下,互联网+的兴起,使得学校的教育改革模式也
期刊
摘要:传统的MVC模式在Android的应用开发中存在诸多不足,主要表现在Android应用开发的关键类Activity会充当Controller和View的合体,既要负责业务逻辑,又要负责显示,造成Activity的职责过多,耦合度高。MVP模式是MVC模式演进而来,引入了Presenter彻底分离Model和View层,在解决Activity臃肿的问题同时,还有助于后期的测试与维护。本文分析M
期刊
摘要:通过对三维模型原始三角面片的规格化,对原模型内的三角面片进行基于体素的划分和表示。将规格化后的三角面片进行基于连接边的分类,并对每一连接边类型对应的三角面片的位置进行编码。通过找寻规格化后的三角面片之间的表示特点,探索具有规律性的存储方法。实验结果表明,该方法能够有效的降低三维模型的存储空间,提高存储效率。  关键词:体素;规格化;连接边;三角面片  中图分类号:000000 文献标识码:A
期刊
摘要:指纹支付是支付方式的一个新的方向。指纹识别技术是依靠指纹的唯一性,通过对指纹的采样、特征值提取来实现身份识别的技术。和传统的帐号加密码或是Ic卡扫描识别等身份识别方式相比,指纹支付具有更高的安全性、不会遗忘、丢失、不变性、唯一性、防伪性能好和使用方便等优点。本文设计并实现了一个通过指纹识别方式,完成支付等功能的系统,同时设计了无线功能,可以完成主机和客户端的无线数据通讯、同步功能。该系统可以
期刊
摘要:文章分析了贺州学院计算机专业转型发展过程中面临的挑战,从职业生涯规划、课程体系、“双师型”师资队伍和校企合作四个方面与国外应用技术大学进行了对比研究,提出了以校企合作为基础,校企双方功能需求和资源相互嵌入的“嵌入式”创新思路,并对“嵌入式”人才培养模式进行了理论研究,为全面向应用技术大学转型莫定了良好基础。  关键词:计算机专业;嵌入式;人才培养模式;转型发展  中图分类号:G642 文献标
期刊
摘要:遥感图像已经是人类生活离不开的一类图像,由于其强大的应用性导致了对其质量要求非常高,所以本文对遥感图像去噪融合算法进行了研究,将ICA应用于遥感图像的去噪和融合中,并与传统图像去噪和融合算法进行了比较。实验结果证明,该算法适用于高斯白噪声背景下遥感图像的去噪,也能兼顾分辨率及光谱信息实现遥感图像的像素级融合。  关键词:遥感图像;ICA;图像去噪;图像融合  中图分类号:TP391.41  
期刊
摘要:应急通信体系在城市运转遭到突发灾害或事故时,承担着及时、准确、畅通地传递第一手信息的“急先锋”角色,是决策者正确指挥抢险救灾的中枢神经。目前,我国已经认识到应急通信系统的重要性,因此我国各个部门已经配置了不少应急通信系统和设备,并且积累了相当的使用经验。但是,对于应急通信的功能需求和系统建设目前仍存在不少值得讨论的问题。本文重点探讨了一种改进的应急通信系统的原型设计和构想,为后续应急通信网络
期刊
摘要:航空发动机维修是一个具有高动态性和高复杂度的商业领域。本文采用多Agent方法对航空发动机维修进行调度仿真。本系统可对等待维修的飞机数量、周转时间和维修生产线利用率等关键指标进行分析,从而为航空发动机维修提供可靠的决策支持。同时,本系统以动态脚本的方式支持多种发动机可靠度估计算法,增加系统的可扩展度。最后,通过多个案例验证本系统的有效性。  关键词:计算机软件与理论;航空发动机维修调度;仿真
期刊
摘要:本文基于Roku流媒体播放器,设计开发了IPTV接入应用。分析了IPTV的体系架构,和业务流程;详细介绍了基于Roku的IPTV应用系统的接入应用开发:包括Roku与web服务器的数据通信,数据解析,Roku开发平台及编程语言BrightScript的介绍,Roku程序界面的设计,测试了Roku程序的可操作性,业务能力的可操作性,基本直播点播功能的可操作性,给出了该系统的运行结果,结果显示:
期刊