基于公交车刷卡数据的客流分析研究

来源 :北方工业大学 | 被引量 : 3次 | 上传用户:A13573338539
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
公交行业的发展,产生了海量多元的公交IC卡刷卡数据,为行业应用提供快速、准确的站点客流量统计,以及站间公交时速的服务一直是智能公交建设的重点。以往对站点客流量的研究只是针对上下车客流量进行了简单的数据统计;在站点换乘客流量方面,根据站点吸引等方法对站点换乘客流量进行预测,缺乏大量出行记录作为其数据支撑,使得准确度不高;在公交站点区间行程时间及公交站间运达时速等方面的研究,也主要集中于小规模样本数据统计的基础上进行的预测,提出的并行算法在海量数据规模下不具备水平扩展能力。本文在总结已有的相关工作和研究成果的基础上,对海量公交刷卡数据进行数据清洗,并在此基础上,根据数据所具有的时空特性对站点客流量、及站间公交运达时速等方面进行分析研究,并对提出的计算分析方法在Hadoop MapReduce上进行了实现验证,具体的研究工作如下:(1)在公交数据清洗方面,针对具有时空属性的原始公交IC卡数据,提出了在大数据环境下基于时间的聚类、和基于规则的过滤的分析计算方法。基于时间的聚类主要是根据时间一致性原则判断数据时间范围,并根据数据所在城市,即北京市的交通运营情况等,采取基于规则的过滤策略,对异常数据进行修改、剔除,为后续对数据的深入分析提供了数据支持。(2)在公交站点客流量方面,主要针对站点上下车客流量、站点换乘客流量进行分析:在公交站点上下车客流量方面,提出了在大数据环境下的一种公交刷卡时间的聚类方法,通过对每趟次刷卡数据的聚类分析,来判断该辆车上车刷卡数据或下车刷卡数据的归属时间段,在清洗后的数据基础上,通过两次计算得到所有站点在不同时间段的上车刷卡数据量和下车刷卡数据量;在站点换乘客流量方面,通过时空等条件的约束,判断是否有换乘行为,进而得到站点在不同时段的换乘客流量。(3)在反映相邻站间客流运达能力方面,针对相邻站间公交运达时速进行了分析,提出了在大数据环境下对公交车在站点停靠时刻、离站时刻的计算分析方法,在清洗后的公交刷卡数据的基础上,根据上述方法,计算公交车在不同线路方向上的相邻站点区间的行程时间和站间公交运达时速。本文搭建了实验环境,在Hadoop平台上,采用HDFS来存储海量原始公交刷卡数据及中间结果集,采用MapReduce编程模型对大规模数据集进行并行处理,并通过大量实验,对上述计算分析方法在大数据环境下的可行性、准确性及扩展性进行了验证。
其他文献
航空发动机转子结构是多样的,结构特性则决定装配工艺路线,发动机转子装配依靠人工、采用简单的高低点抵消的方式装配,时常出现不能满足技术要求的现象,调整工作量大,装配精
在急性疾病中,麻疹病毒(measles virus,MV)可能感染20%~70%的B细胞、T细胞与浆细胞,因此MV在免疫系统中有引起多重效应的可能性。Mina等在2020年4月报道,麻疹患儿患病长达5年
当前社会是一个科技高速发展的时代,科技带动了信息的快速传播,人们通过互联网将信息传播到各个角落,生活的环境与方式都发生了前所未有的改变,进入了新媒体时代。在新媒体环
随着电气自动化控制事业的不断发展,PLC控制系统的可靠性以及全面性在整个设计工作中占据着较为重要的作用。文章主要对PLC控制系统可靠性的影响因素进行分析,并对PLC控制系
孕妇,29岁,妊娠24周到本院作超声常规检查。超声检查时发现:胎儿双顶径69mm,一侧侧脑室内无回声区扩大,达23mm;脑中线向健侧移位;另外羊水暗区最大前后径达90mm。胎儿四肢及脊柱未发
在当今的教学活动中,教学方式越来越多,教学资源也越来越丰富,教学质量越来越高。然而,不可否认,这些改变都是以以前的经验作为基础,逐渐提高发展而来的,所以在强调数学教学
口语交际在人们的日常生活以及工作当中占据着较为关键的地位,小学语文口语交际教学对强化学生的口语交际能力具有较为重要的作用,合理的教学目标推动了教学的顺利开展。现阶
为了丰富玉米遗传变异,从1990年起,我们进行了玉米(Zea mays L.)和多年生二倍体大刍草(Zea diploperennis L.)远缘杂交的研究。经过5年8个世代的杂交、回交和自交选择,目前已
文章简要介绍了线缆自动测试技术的基本原理,线缆自动测试系统的基本组成和功能,同时对其在动车组制造过程中的应用进行了说明。
运用文献资料法、案例分析法、逻辑分析法、实地考察法分析体育对我们国家城市发展的推动作用和意义,初步探讨作为体育城市的几大指标要求,预测未来我国体育城市的发展趋势。