基于大数据的铁路客运用户画像系统研究及应用

来源 :中国铁道科学研究院 | 被引量 : 15次 | 上传用户:yuanchonghuanca
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着铁路的高速发展以及“互联网+”商业模式的快速推广,互联网已渗透到铁路客运的各个服务场景,铁路互联网用户呈现爆发式的增长,已经积累了大量的用户行为数据。通过用户的行为数据构建铁路客运用户画像系统,能够更加准确的把握旅客群体,圈定高质量旅客,针对不同的旅客群体制定个性化、差异化的营销和服务策略,在细分价值等级的旅客基础上合理配置铁路客运资源,实现铁路从传统的营销策略拓展为以旅客价值为依据的铁路利益最大化和旅客服务质量最优化的共赢策略。本文首先介绍了相关的社会背景和技术背景,深入的研究了大数据生态环境中的相关技术,包括分布式文件系统HDFS、分布式数据仓库工具Hive、分布式计算框架Spark等。同时研究并实现了铁路客运用户画像系统的总体架构和用户标签计算的相关算法。最后介绍了铁路客运用户画像系统的运用场景,取得了良好的应用效果。本论文主要研究成果包括:(1)针对铁路12306互联网售票系统,站车WIFI运营服务、广告平台、互联网订餐等信息系统的实际需求,并结合当前大数据领域的相关技术,研究并设计了铁路客运用户画像系统的总体架构。(2)针对铁路不同信息系统产生的数据特点,深入研究并实现了结构化数据以及非结构化数据的批量处理和实时增量处理的方法。(3)对铁路旅客行为数据进行了深入的研究,设计了铁路旅客标签体系,对基础标签、统计类标签、潜在标签的计算方法进行了详细的研究。(4)针对海量的旅客行为数据,研究并实现了基于MapReduce的K-means算法、BP神经网络算法、PassengerRank算法,提高了潜在标签(例如:用户价值)的计算效率。(5)针对铁路客运用户画像系统,设计了系统安全预警系统,实时监控铁路客运用户画像系统的运行情况,以实现运维人员对系统运行异常的快速反应。(6)基于铁路客运用户画像系统,介绍了多个应用场景,研究并设计了一套完整的为第三方提供数据核验服务的平台,并取得了良好的应用效果。
其他文献
现实世界中存在诸多复杂网络,如生物网、科技网和社交网等。近年来复杂网络的研究吸引了来自计算机、物理、数学和生物等众多领域的研究者,已成为多学科交叉研究的热点之一。
随着计算机网络的迅速发展,网络设备和网络上运行的各种应用服务越来越多,计算机网络正变的日益复杂。如何及时有效的了解计算机网络的运行情况,准确快速的排除计算机网络出现的
目前,主要应用数据仓库来存储大量的历史数据用于决策分析,数据仓库必须支持各种各样的多维查询,随着信息的数据量迅速膨胀,这些多维查询通常要涉及海量的数据,而且要对这些
Markov随机场(简称MRF)是一种描述元素问相互作用的数学模型,它能简洁合理地刻画图像像素的空间相关性,是图像分割应用中备受关注的建模方法之一。 本文在传统监督式MRF模型的
近年来,在传感器网络、系统性能保持等应用领域中产生的数据量越来越大,每天以数以百万计甚至没有上限的速度增长,这样的数据流中蕴含大量信息,可以用来作为智能决策的依据,
Web服务组合作为基于Internet的典型的服务组合形式,正在得到广泛的关注。由于Web服务的松耦合特点,为保证多个服务交互获得正确的执行和一致性的结果,有必要为服务提供事务
随着互联网和物联网的高速发展,物流行业中运力供应链数据规模正在逐渐增大,为了充分利用海量物流运力数据为物流企业提供决策支持,从而保障物流运力行业安全、高效地运行。
随着计算机技术与网络通信技术的迅速发展,特别是Intemet技术的日益广泛的应用,网络信息系统的安全性问题日益凸显。为了保证计算机系统之间数据通信的安全性,对未知的入侵进
在知识经济时代,通过知识管理可以对企事业单位的知识资源进行开发和有效地利用以提高企事业单位的创新和创造价值的能力。知识管理系统必须支持知识积累、存储、传播、交流
伴随网络教育的发展,网络上积累了大量的学习资源,但同时也存在着资源结构简单、语义缺乏、学习资源无法有效共享、异构系统之间不能有效互操作等问题,严重地制约了网络教育