基于Storm的实时热点商品分析系统的设计与实现

来源 :中南民族大学 | 被引量 : 0次 | 上传用户:zhang5832
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
目前电子商城应用中出现了越来越多的商品秒杀活动,如:小米每周二12点手机秒杀、淘宝双十一秒杀和京东618商品秒杀等,几乎每个电商网站都存在着商品秒杀活动。商品秒杀系统如此常见,同时也面临着各种问题:数据隔离、高并发请求、单账号和多账号多次请求、数据一致性、实时热点发现等等。商品秒杀系统一般会给热点数据部署单独的Cache集群、单独使用更高带宽的服务器,从而将热点数据与普通数据进行隔离,目的是为了不让1%的热点数据影响99%的普通数据。尽管如此,仍然可能从99%的普通数据中出现实时热点数据,由于系统无法提前知道哪些普通数据可能会成为实时热点数据,因此也就无法提前进行保护。因此需要根据系统数据进行实时分析,在尽可能短的时间内发现实时产生的热点商品数据,随后立即做出相应调整,才能有效保证系统的高可用。本文主要解决秒杀场景下实时热点商品数据发现问题,不涉及热点发现后的系统调整问题。由于热点数据的产生都是用户行为导致的,比如购买、浏览、分享、搜索等,所以本文将针对秒杀系统中的用户行为日志进行实时分析,主要进行了如下工作:1.介绍系统使用的相关技术。使用Flume框架进行分布式日志采集;使用Kafka作为日志消息队列,防止日志数据采集过快而计算模块处理数据速度过慢导致数据丢失;使用Storm进行实时数据处理,保证数据分析的实时性;使用MySQL数据库对数据进行持久化存储;使用Redis内存数据库进行数据快速存取。2.设计基于多维排序的热点商品排序算法。多维排序设计原理通过结合多种属性排序和属性权重得到综合排序。系统可以根据单个用户行为属性对热点商品数据进行排序,但是单属性的排序结果综合性性效果差,有大量的偶然性。本文通过比较普通场景和秒杀场景下各属性的增长情况,来确定每个行为属性的权重,然后结合商品在单个属性排序中的排序情况得到该商品的综合评分,最后对所有商品评分进行综合排序。3.设计并实现基于Storm的实时热点商品分析系统。系统整合了Flume、Kafka、Storm、MySQL和Redis技术,能有效监听日志文件并及时读取日志数据;将排序算法逻辑写入Storm的数据处理中,能很快的通过对日志数据进行分析得到需要的实时热点数据;将数据存储在MySQL中进行持久化,能很好的用于后续海量数据的离线处理。
其他文献
针对大连理工大学国家级示范性微电子学院引进的具有全自动硅片传送系统与表征、分析系统的科天四探针电阻仪,介绍了此设备原理、技术特点及主要构成,包括硅片传输系统、测量系
针对当前国内各高校多媒体教学系统迅速发展的趋势,明晰多媒体教室管理之要素,保障教学设备的完好率.从人才培养需求出发,提高管理水平,为保障教学质量提供人性化服务.
1临床资料我院门诊注射室自2009年3月至2010年10月注射破伤风抗毒素人数约1200人,有6人在此期间注射后发生局部迟发反应,其中男性4人,女性2人,年龄7-60岁.6人外伤后遵医嘱给
周恩来曾说:“过去绍兴人靠什么为生,一靠土地,二靠当绍兴师爷。”“我的家庭近几代祖先也是绍兴师爷。”
实验研究了泵浦光斩波、斩波占空比、斩波频率对两波耦合过程及光扇噪声的影响,结果说明斩波调制抑制了光扇噪声,Ce:KNSBN晶体体全息存储再现图像质量得到明显改善.
【摘要】机器人的教育在如今信息化发展迅速的社会已经刻不容缓,很多中学开展了机器人兴趣班或社团,学生在机器人社团中能够充分结合各领域知识,开动脑筋,将想象力与实践动手充分结合,得到能力上的提高。在这种新兴社团中,教育者要特别注意用一种全新的动态教学方法,充分联系实际,能够集各领域知识于一身,充分发挥机器人社团的能动性。  【关键词】机器人教学 优势 反思  【中图分类号】G633.98【文献标识码】
相比于浮游生存方式,细菌更倾向于粘附在材料表面生存。细菌粘附在材料表面最终会导致生物膜的形成,对生物医疗设备、水存储及处理系统、海洋船舶和食品等研究和应用领域造成
对于化学类研究所而言,试剂耗材是实验室继仪器设备之后又一主要的消耗源。试剂耗材单价低、数量多、购置频繁的特点给传统管理带来了很多麻烦。依靠数字化技术,建立试剂耗材
仪器设备在科研工作中起着重要的作用,同时也是培养创新人才的重要条件。阐述了仪器实验平台建设思路、发展历程、管理与运行办法以及研究生创新实验教学模式。测试平台经过3
为改善联合变换相关器的实际识别效果,将形态学算法引入输入面图象边缘检测,提出利用形态学边缘检测的宽度可调节性来改善联合变换相关器的实际识别效果,实验表明,改进后的算