基于深度强化学习的商品推荐系统的研究与实现

来源 :北京邮电大学 | 被引量 : 0次 | 上传用户:Rainwave
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
互联网的快速发展加速了信息的流通,大数据时代的到来更让商品买家面对成千上万的商品无从下手,商品推荐系统需要在海量数据中满足用户的多元化需求。当前商品推荐系统生成推荐列表大多是处于用户特征不再发生改变的前提下,然而用户和推荐系统的交互会使用户的购物状态发生改变,若商品推荐系统未能记录相应状态改变并依据当前状态进行推荐就会存在未能更好的揭示用户状态特征的问题。研究和实现一种能揭示用户与推荐系统交互下用户特征的商品推荐系统将具有重要的研究和实用价值。本文有两个创新点。第一个创新点是提出了将商品品类、商品品牌和商品ID多种元素通过多层深度学习网络生成包含更多商品信息的向量。第二个创新点是提出了状态分组机制,把用户相关商品行为设计分数并按照同一分数纳入同一分组,方便后续根据余弦相似度预测相关商品行为减少计算量,这也是在为生推荐列表提速。然后本文在前述研究的基础上,一是实现了基于深度强化学习的Actor-Critic框架;二是设计和实现能调用Actor-Critic框架生成推荐列表的商品推荐系统,从注册用户、商家、管理者用户这三类角色进行核心功能的划分,实现了用户注册、商品查询、商品购买、订单评价等商品推荐系统常有的功能;三是储存注册用户的商品行为日志,以便为推荐模型下一次迭代优化提供数据集。本课题完成了对核心功能的测试,验证了基于深度强化学习的商品推荐系统能够有效完成用户注册、商品查询、商品购买、订单评价等功能,并且能根据用户当前状态进行相应的推荐列表生成。该系统在推荐准确度上与多个推荐算法进行短长期的准确度比较,短期准确度达到40.5%,长期准确度达到63%,同时与多个模型的AUC指标比较达到77.94%,可有效保证依据用户状态生成推荐列表的准确性。
其他文献
在自动化生产线上,拆垛机器人利用视觉定位系统实现拆垛过程中对不同形状包装袋的判断与识别,从而开展自主导航和自主工作的任务,进而提高机器人的感知能力和智能化水平。本文针对工厂复杂拆垛作业环境中光照不稳定且有较强背景干扰下的拆垛视觉需求,实现了多袋型垛堆的视觉识别和包装袋定位。本文主要研究工作如下:(1)设计了拆垛机器人视觉定位系统的总体解决方案。在调研分析了复杂工业场景下的拆垛环境后,提出了针对自然
首先,探究漳州东立交桥现存问题,在分析现状交通流量的基础上进行交通需求预测,以评估未来节点的交通通行需求.然后,综合考虑通行安全、交通需求、工程投资、实施难度等因素,提出改善提升方案.最后,通过对比分析提出最优改造方案,以供同类工程参考借鉴.
路基结构的稳定性和强度是高速公路工程施工质量的根本.为此,在阐述公路路基施工质量要求的基础上,结合具体工程项目,介绍了公路路基施工工艺要点,包括路基挖方、填方、排水和压实等工艺,最后对试验路段的压实度进行了检测.结果表明:施工后路基的压实度能够达到规范要求,工程质量良好.
疲劳点蚀斜齿轮啮合刚度计算是齿轮故障动力学分析的重要基础.基于有限元的斜齿轮啮合刚度计算方法,建立了正常齿轮和疲劳点蚀齿轮的有限元模型.通过有限元模型计算,得到了齿面法向接触力和综合弹性变形量;并根据啮合刚度计算方法,得到了齿轮的单齿啮合刚度和多齿综合啮合刚度.分析不同点蚀剥落长度和宽度对齿轮啮合刚度的影响得知,剥落长度和宽度对齿轮啮合刚度影响较大;而且剥落长度会影响齿轮啮合刚度的变化区域.通过疲劳点蚀试验证明,齿轮啮合刚度的减小使得齿轮振动冲击响应增大.
共享物流以其低廉的价格,方便的服务受到了市场的广泛欢迎。然而,目前的共享物流方法绝大多数都是基于中心化的架构,即存在第三方公司收集、发布相关的共享信息。在该种方式下,共享参与方需要上传身份、位置等敏感信息。同时,第三方公司出于利益的考虑可能人为控制共享匹配的结果。为了避免第三方对共享物流系统造成的影响,本文着眼于构建分布式的共享物流系统。然而在分布式的情况下,由于缺少第三方节点的统一管控,共享物流
随着无线通信技术的高速发展,电磁波频谱的低端频率已趋于饱和,毫米波技术的兴起已成必然。由于毫米波的频率更高,因此在传输时趋肤效应会更严重,产生新的信号完整性问题。因此,在高频、高速信号的时代背景下,传统的衰减器可靠性问题又将面临新的挑战。本文采用理论与计算、数值仿真分析等方法对同轴步进衰减器的传输性能进行了研究。首先,对同轴步进衰减器在低频直流工作条件下的传输性能进行了分析,利用Holm的a斑点理
物联网技术的飞速发展,推动其在不同行业领域中的应用,而多场景中应用服务的互联互通是物联网应用中的主要难题,为此,中间件技术应运而生。本文面向多样化物联网设备的接入和服务管理,设计基于OCF的物联网服务中间件系统,研究中间件系统中异构设备的接入识别、服务调用的序列化方法关键技术,为实现上层物联网应用之间的服务共享提供技术支撑。本文的主要工作如下:首先,针对互联互通的规范性问题,研究了 OCF协议并结
为了提高道路施工质量,总结了水泥稳定碎石基层施工技术特点,从材料的选择、混合料配制、运输、摊铺、碾压、养生等方面对水泥稳定碎石基层施工技术进行了分析,并提出了相应的质量控制措施.工程结果表明,水泥稳定碎石基层施工技术能有效提高道路基层的稳定性,减少道路早期病害的出现.
伴随着软件研发行业在全球突飞猛进的发展,软件研发项目的失败率居高不下。为解决日趋严重的软件危机,软件研发行业引入项目管理来规范软件项目研发进程。随着虚拟仿真类软件的准入门槛的降低,同行之间竞争加剧,能够快速的推出高质量的软件成为一个公司的核心竞争力,项目进度管理正是这一核心能力的关键的一环。论文以R公司的F虚拟仿真软件的开发项目为研究对象,分析了当前行业现状、公司情况、项目组织形式。分析了影响F项
结合具体工程实例,分析了该技术的原材料和施工环境要求,重点研究了该技术的施工工艺流程,包括施工准备、原材料撒布和碾压等,并对施工质量进行检测及评价.结果表明:该施工技术可有效改善沥青路面老化和防水性能,能较好地发挥对沥青路面进行预防性养护的作用.