基于Flink的电商实时分析系统的设计与实现

来源 :华东师范大学 | 被引量 : 0次 | 上传用户:momoyangli
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近年来,随着信息通信技术的发展,各行各业对其系统的数据采集、处理和积累的数据量越来越多,数据量呈爆炸式增长。在此背景下,大数据在各个领域得以高速发展,全球正大步迈向大数据新时代。随着数据量越来越大,数据的高效存储和实时分析处理等需求也随之被提及。想要从海量的数据中既快速又有效的分析出对于我们有意义的数据信息,就需要一套贴合实际业务需求的数据实时统计分析系统。电商行业作为互联网行业,在如今的大数据时代,同样也面临着相同的挑战,目前主流的电商数据分析都是基于非实时数据的,存储的往往是T+1的数据,无法满足对数据的实时处理的需求,有些企业把调度调整到半天甚至更短。这种方式具有耗时较长以及高吞吐量,只满足对时效行不高的场景需求。本论文为满足实际业务中的实时数据统计分析需求,基于Flink技术实现对用户产生的行为数据以及业务交易数据进行实时分析。本论文分为四大模块,分别为数据实时采集,数据建模,数据实时统计分析以及数据接口可视化。数据实时采集模块中日志数据通过Nignx实时采集至Kafka中,业务数据采用Flink CDC实时同步到Kafka消息队列,事实数据和维度数据分别存入下一层Kafka中和Kudu数据库,通过Flink拉取Kafka上的业务数据进行实时处理,计算结果实时写入至Kudu中;结合实际需求场景对接收到的数据进行数据建模,设计合理且复用性高的宽表。最后的统计分析通过接口传输给前端Sugar大屏展示。本论文主要应用于电商行业的大数据实时分析。本系统满足运营人员对实时流数据进行在线实时处理分析,运营人员可以直观的从Sugar大屏上实时的看到商城营销数据分析。本系统可以通过错误日志分析模块使线上App的错误日志预警得到即时响应。本系统同时也为推荐算法部门提供模型训练数据,以及本系统的接口和宽表层数据可以作为模型入参,为商城的实时推荐提供不可缺少的数据源。
其他文献
报纸
报纸
新高考背景下,高中教学不再对文理科进行划分,为了全面落实“一核四层四翼”高考评价体系的要求,化学作为一门基础学科,“教什么,怎么教”,教师要根据学生实际情况,面对新高考模式也应开展新的教学实施研究,积极转化化学教学观念和教学方式,促进学生对化学这门学科的探索研究,从而达到“素养为本”的教育目标。
期刊
新课改深化背景下,培养学生核心素养成为高中化学教学教师中心任务。因此,对于高中化学而言,应当与时代需要相契合,应用针对性的方法,增强学生的核心素养。本文就此基于学生核心素养培养,对高中化学课堂教育策略进行分析。
会议
随着电商规模的逐渐扩大,传统的Hadoop资源利用率和计算速度都无法全面满足发展需求,因此提出将低延时、基于内存计算的Spark作为计算引擎。利用SparkCore、SparkSQL做离线分析、利用SparkStreaming做实时分析,将Hadoop分布式文件系统(HDFS)作为分布式文件存储,利用YARN做资源管理与程序调度,从而完成了一个电商的行为数据分析系统,通过Flume、Kafka等技
期刊
报纸
多源图像融合技术将同一场景的异源图像信息整合到单幅图像,使融合图像包含了多源图像的互补信息,辅助工程系统做出更加精确的后续处理;其在无损检测、生物传感器、军事监测、临床诊断和遥感等领域均得到了广泛应用。传统的多源图像融合方法通过人工设计复杂的活动水平测量和融合规则来提升图像融合质量。在实际应用中,传统方法需要相应地调整融合策略来适应复杂、多变的应用场景。因此,传统方法的算法复杂度高,实现相对困难,
学位
目的 探讨急性缺血性卒中溶栓治疗后使用益气活血类方剂干预的用药规律,预测核心药物防治脑缺血再灌注损伤的潜在作用机制。方法 检索中国知网、万方、维普和PubMed数据库中急性缺血性卒中溶栓治疗后使用益气活血类方有效干预的文献,对方中使用的药物进行频数、聚类及关联分析,依据关联规则选取置信度和支持度最高的核心药物,构建核心药物-活性成分-交集靶点网络图,并进行基因本体(gene ontology,GO
期刊
“两个结合”是马克思主义中国化时代化的根本原则,是习近平新时代中国特色社会主义思想的重要内容和重大理论创新成果。“两个结合”蕴含着“理论—实践”与“理论—文化”二维双向改造、相得益彰的科学内涵,体现了严谨的逻辑理路和明晰的实践要求,充分彰显了马克思主义真理伟力。准确理解和坚定贯彻“两个结合”,对于全面推进马克思主义中国化时代化新境界,对于科学指导中国式现代化新征程,对于实现中华优秀传统文化新跃升,
期刊
报纸