基于流计算的在线商品推荐系统的设计和实现

来源 :华中科技大学 | 被引量 : 0次 | 上传用户:abc000123444
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
由于网络信息技术的不断成熟和飞速发展,在web应用、网络监控、传感监测、电信金融、生产制造等领域,兴起了一种新的数据密集型应用——流数据,即数据以大量、快速、时变的流形式持续到达。如何对这些流数据进行收集和计算,产生实际的经济价值,是近些年来网络技术研究的热点,并且电商网站中都有着数量庞大的商品信息,用户找寻到适合自己的商品无异于大海捞针,所以,开发一个在线商品推荐系统。这个推荐系统可以对用户浏览和购买商品时产生的流数据加以利用,发现用户的即时购买意图和兴趣,从而为用户找到与其兴趣相似的商品,并推荐给用户,不仅能提高商品销售量,也可以增加用户的购物满意度。基于流计算的在线商品推荐系统包括数据采集模块、在线推荐模块、冷启动问题的解决、离线计算模块和Web展示模块。数据采集模块采用Flume框架进行实现,主要职责是采集用户的在线日志数据信息(浏览、收藏和购买),然后传送给分布式消息队列Kafka;离线计算模块是对用户过去的行为信息进行分析计算,采用基于物品的协同过滤推荐模型思想和基于标签的推荐模型思想,使用Flink流计算框架,计算商品推荐列表,并将计算结果存储在数据库中;在线推荐模块主要功能是当用户有操作发生时,在线的发现用户的即时购买意图和兴趣,同时利用离线计算模块的计算结果,在线的给用户推荐相关商品;Web展示模块是提供一些对外的接口,对离线推荐结果、热门商品和在线推荐结果进行一个简洁的展示。对系统进行测试的结果表明,系统可以在线的发现用户的即时购买意图和兴趣,为用户推荐与其兴趣相似的商品,且能长时间稳定运行,达到了设计目标,因此本文的推荐系统可以在电商领域,定制化地为用户推荐与其兴趣相关的商品。
其他文献
目的急性心肌梗死(AMI)一直以来在世界范围内威胁着人类的生命健康,一旦发生心肌梗死(MI),如何治疗以及预防不良并发症依然是未攻克的难关。胸腺基质淋巴细胞生成素(TSLP)参与人类多种疾病的进程,包括过敏性疾病、慢性炎症性疾病以及肿瘤等,在各种免疫炎症调节和器官纤维化中发挥一定的作用,但其在心血管疾病中的研究甚少。本研究的目的是探索TSLP/TSLPR对心肌梗死后心功能和心室重塑的影响。方法(1
研究背景:阿尔兹海默症(Alzheimer’s Disease,AD)是常见的神经退行性疾病,主要病理特征为胞外Aβ斑块沉积、胞内异常磷酸化tau蛋白聚集而成的神经原纤维缠结(NFT)形成、炎症反应过度激活以及神经元变性和死亡,患者进行性认知能力下降1,目前发病人数逐年上涨,却还没有有效的预防和干预措施2。小胶质细胞是中枢神经系统的固有免疫细胞,在健康的大脑中,小胶质细胞(约占CNS的10%)形成
随着虚拟机在云计算等领域扮演着越来越重要的角色,其本身的安全性也备受关注。虽然虚拟机软件已广泛集成在操作系统中,但现有的操作系统安全测试工具缺乏对虚拟机安全方面的研究。虚拟机复用宿主机物理设备资源,首先应该做到安全隔离。针对此问题,设计开发一套组件,测试虚拟机的安全隔离性。以广泛使用的KVM虚拟机为例,从虚拟机安全隔离角度出发,对虚拟机CPU、内存、存储和网络四个方面的安全隔离测试进行了研究。通过
钢铁产业是国民经济发展的重中之重,是社会发展和综合国力的重要标志之一。冷轧带钢为高附加值产品,是汽车制造、机械加工、电子信息、食品包装等行业不可或缺的原材料。在冷轧生产过程中,张力控制是产品质量控制的重要评定指标,张力控制精度的好坏将直接影响到产品的最终质量,影响企业的经济效益。冷轧连续退火机组是带钢生产的重要工序,它的主要优点是产量高、流程短、产品质量好,对于表面质量要求高以及较高强度的带钢来说
胶原蛋白作为人体中广泛存在的结构蛋白,具有良好的生物相容性和优越的机械性能,在体外组织培养、可植入组织修复材料等领域都有着广泛的应用。然而,天然的胶原蛋白物理化学性质比较单一,不能够满足材料制备时复杂多样的功能需求。因此,对胶原蛋白的化学修饰显得尤为重要。本论文着重研究了Ⅱ型胶原蛋白的交联化修饰和电荷化修饰,探索了其在形状记忆水凝胶、自组装纳米囊泡等智能生物材料领域的应用。主要包括以下三个方面的研
随着信息科技的迅猛发展,人们面临严重的信息过载问题,如何从海量信息中快速找到目标信息成了亟需解决的问题。通过类目,关键词检索等传统方法在许多场景下已经无法满足用户的需求,因此被动为用户提供信息的推荐算法受到了学术界与工业界的广泛关注。首先,介绍了推荐算法的研究背景与相关基础概念,然后介绍了推荐算法国内外的研究现状与发展趋势,并介绍了矩阵分解算法,注意力机制与循环神经网络等常用算法以及常用的损失函数
短视频的便捷性和即时性促进了在校大学生学习成果的多模态化,也为课程思政的教学改革提供了全新的学业成果形式。但是面对其多维度和多模态的海量评价信息,传统评价方法难以应对。因此,文章基于《文化传播英语》课程"培养中华文化大使"的教学目标,针对课程学习成果——学生自制中华文化主题的中英双语短视频,采用Yaahp软件辅助下的模糊层次分析法,创建了5个一级指标和18个二级指标的权重评价层级。招募30名评分员
轴快流CO2激光器因其稳定性强、光束质量好,被广泛应用于工业加工领域。随着物联网技术的发展,越来越多的制造业企业把自己的产品与物联网相结合,进行工业4.0升级。将物联网技术运用于轴快流CO2激光器上设计云监控系统,可以实现对激光器进行远程的实时监测、状态记录与故障诊断。还可以通过对大批量激光器运行状态数据的收集和分析,对激光器部件进行故障和寿命预测,降低激光器停机检修时间,从而提升激光器产品的竞争
我国法定职业病名单所列十二类尘肺病中,煤工尘肺(CWP)约占总发病的半数左右,成为煤矿工人发病率最高且最为严重的疾病之一。通过肺部健康检查结合流行病学研究,调查某煤矿工人肺功能损伤现状,探讨肺功能损伤的相关影响因素,为用人单位和监管机构制定煤工尘肺的综合预防策略和措施提供科学的参考依据,具有重要的实践意义。本研究选取某煤矿年龄范围在40岁以上的接尘工人作为研究对象,收集并统计该群体肺功能及X线胸片
目的:研究术前炎性指标对结直肠癌根治性切除术患者的预后价值。方法:回顾性审查2015年1月至2016年12月于华中科技大学同济医学院附属同济医院胃肠外科一病区行结直肠癌根治性切除术的386例结直肠癌患者的医疗记录。收集术前一周内常规炎性指标,包括:术前外周血中性粒细胞数目、淋巴细胞细胞数目、单核细胞数目、血小板数目、以及纤维蛋白原和白蛋白水平;病理结果由病理报告查询获得并根据第8版AJCC指南重新