基于深度强化学习的商品推荐模型研究

来源 :武汉理工大学 | 被引量 : 0次 | 上传用户:wanghai19881016
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着电子商务市场规模的持续扩大,商品种类不断增多,面对琳琅满目的商品,用户如何快速、准确的寻找自己最喜欢或最需要的商品成为用户和电商商家最关心的问题。商品推荐系统能够自发为用户寻找最符合其偏好的商品,成为解决“信息过载”问题的重要方法,因此,研究如何提升商品推荐精准度是一个兼具学术价值和商业价值的课题。传统推荐方法存在数据稀疏、冷启动、特征识别等问题。而深度强化学习在强化学习的基础上引入深度神经网络,使其同时具备深度学习的自动特征识别能力和强化学习的策略决策能力。为了解决传统推荐方法存在的问题,本文基于深度Q网络(DQN)引入竞争架构(Dueling Network)和长短期记忆网络(LSTM),提出一种考虑用户负反馈和商品购买时序性的深度神经网络结构,同时构建基于深度强化学习的商品推荐模型,使其更适用于用户-商品特征识别和商品推荐策略决策。本文的主要工作如下:(1)对传统推荐技术和当前流行的推荐技术进行详细评述,总结目前推荐技术中存在的缺点和不足,提出本文的研究内容;(2)分析传统DQN网络结构用于商品推荐的不足,并针对不足设计考虑用户负反馈和商品购买时序性的深度神经网络结构。该网络采用竞争架构(Dueling Network)和长短期记忆网络(LSTM)对传统DQN网络结构进行改进,一定程度上解决了无法对正负反馈数据区分性训练,以及无法对商品购买中存在的时序性特征进行提取的问题;(3)构建基于深度强化学习的商品推荐模型。该模型基于上述改进的DQN网络结构,分为数据获取、线下训练和线上更新三个部分。首先构建用户和商品相关特征存放于用户-商品特征数据库;然后利用用户和商品间的交互日志线下训练得到离线模型;最后将预处理后的数据输入到训练好的改进DQN网络中,进行线上模块的更新;(4)设置多组对照实验对所构建的模型进行实证,验证模型在商品推荐精准度和多样性上的优越性。本文提出的考虑用户负反馈和商品购买时序性的深度神经网络结构,在一定程度上解决了传统DQN网络无法对正负反馈数据区分性训练,以及无法对商品购买中存在的时序性特征进行提取的问题;构建基于深度强化学习的商品推荐模型,解决了传统商品推荐模型中的两个问题,一是只考虑最大化当下回报而忽略未来回报,二是利用历史数据中频繁出现的特征进行学习和推荐,使用户感到厌倦。实验结果表明,本文提出的基于深度强化学习的商品推荐模型与对照组模型相比,在准确率、召回率、MAP、NDCG和商品多样性这五组指标中均具有突出表现,未来可在本文研究内容基础上继续拓展,进一步提升商品推荐的精准度。
其他文献
随着云计算应用的不断深入以及对大数据处理需求的不断提升,越来越多的企业选择使用云平台来处理海量的数据。由于云计算的商业性,这就对云计算中的任务调度提出了更加严苛的要求,如何合理且经济的完成任务调度成为了研究云计算的关键问题之一。批处理科学工作流是大数据时代的一种新型工作流建模形式,近两年已引起业内的重视,但当前仍处于起步阶段。传统的科学工作流任务调度算法已经不适用于批处理科学工作流。因此,本文在前
双基前视合成孔径雷达(Synthetic Aperture Radar,SAR)由于发射机和接收机分置于不同平台上,相比于单基SAR,具有反侦察、隐蔽性好、抗干扰能力强等优点,同时还可以对接收站前
在生物识别中,手指静脉识别具有极大的优势和可靠性。目前,大多数针对手指静脉识别的研究主要基于二维的手指静脉投影图像。由于手指静脉是三维的网状结构,不同的手指静脉可能具有相同或相似的二维投影,所以利用二维的手指静脉图像识别可能导致识别错误。为解决这一问题,根据手指静脉骨架的三维拓扑稳定性和唯一性,本文围绕手指静脉骨架的三维重建问题展开研究。本文对手指静脉骨架的三维重建进行研究,设计了一种双平面手指静
本文在微晶玻璃制备过程中掺入具备负离子发生功能的材料制备具有负离子释放功能的功能型微晶玻璃,并对热处理制度和稀土氧化物等对负离子微晶玻璃性能的影响进行了研究。采
组网雷达是近些年提出的一种新体制雷达,由多部雷达组成,各雷达站点在不同的位置进行协同工作,可以构建一个全方位多层次的作战体系,在提高目标分辨率与获取多维度的信息方面有较大优势。站点的配置对组网雷达的性能有直接影响,是组网雷达的关键技术之一。不同的站点配置将获得完全不同的性能,因此组网雷达的站点配置问题已成为国内外学者的研究热点。本文针对组网雷达站点配置问题,采用改进的粒子群优化算法,开展了不同场景
生物质是自然界中大量存在的一种可再生资源,常被用作制备碳材料。生物质炭化得到的硬炭,由无序排列的石墨微晶及其之间存在的无定形碳交联而构成。这种受限制的、无序的结构
星机双基地线阵合成孔径雷达(SA-BiLASAR)是一种结合星机双基SAR(SABiSAR)和线阵SAR(LASAR)优势,具有重要应用价值的新概念、新体制SAR,在机理上具备正下视、前视和侧视等多视角高分辨三维成像的能力,突破了传统侧视SAR成像模式限制,能够实现观测目标的三维成像。新兴的压缩感知理论指出只要原始信号具有稀疏性或者可压缩性,那么远低于传统Nyquist采样率的测量信号就可以恢复出
改革开放以来,我国农业不断发展,取得了举世瞩目的成就,但同时也暴露出诸多问题。农业生产仍然以小农经营模式为主,生产方式停留在粗犷的低级阶段,这种极其低效的生产模式难以适应激烈的市场竞争。我国自2001年开始实施农村集中居住建设,旨在提高农村土地利用效率,改善农民生活条件,推动农村环境好转。在该政策实施的过程中,传统的小农生产生活状态发生了变化,与之相随的经济效应也逐渐显现出来。本文利用作为“国家级
创新集聚有利于促进创新的涌现,创新主体之间高度集中的知识溢出和频繁的互动学习使得创新成果的大量出现成为可能。伴随着经济全球化、信息网络化和知识产业化的发展,创新集聚的趋势也发生了改变,从单纯的地理上聚集在一起,转变为网络化的集聚形式。目前,关于创新集聚的研究多从空间的视角研究创新主体在地理上的集聚对创新的影响,亟需从创新网络出发丰富创新集聚的研究。创新网络中的创新集聚现象表现为社团结构,从社团结构
近年来,作为超分子主体化合物的有机分子笼和作为金属有机化学重要配体的N-杂环卡宾受到了研究者的高度重视。前者具有特殊的空腔结构,可应用于主客体化学、分子识别、气体存储与分离以及催化等方面的研究和应用;后者及其配合物在催化领域被广泛研究和应用。本论文首先通过席夫碱反应设计合成了一种含有吡啶基的有机分子笼。以4,4’-(1,4-亚苯基)双(吡啶-2,6-二甲醛)和具有不同单一手性的环己二胺通过亚胺缩合