基于Spark的路网交通运行状态判别研究

来源 :长安大学 | 被引量 : 11次 | 上传用户:jiangcongzhi
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近年来,交通出行需求迅猛增长,单纯依靠扩大路网建设规模并不能有效解决交通供需不平衡问题,交通拥堵日益严重。为此,本文以高速公路路网交通运行状态为研究对象,针对单机串行学习路网海量交通流运行数据效率低下问题,提出利用Spark大数据机器学习平台构建路网交通运行状态判别模型,实现路网交通运行状态的及时、准确判别,以便制定科学有效的交通管理控制措施,这对解决交通拥堵,提高路网运行效率,提供畅通、安全、智能化的行程环境具有重要意义和价值。由于单台机器的数据存储和处理能力有限,串行的学习路网交通大数据进行交通运行状态判别效率低下,本文首先对大数据处理技术平台及并行机器学习进行分析,提出依托Spark灵活的数据重用及并行化执行机制,从数据存储、数据处理、数据应用三层构建Spark大数据机器学习平台。其次,针对传统交通运行状态判别采用单一参数绝对度量标准的不科学性,本文选取交通流量、车速和占有率三参数表征高速公路交通流运行情况,利用k-means算法对路网交通流运行数据进行聚类分析,确定交通运行状态相对度量标准;将聚类标记后的路网交通流运行数据作为输入数据,利用随机森林构建路网交通运行状态分类决策模型,实现交通流运行数据状态分类;同时,本文围绕不同交通参与者的交通运行状态信息需求,立足高速公路路网结构,提出利用交通运行指数对路网交通运行状态进行量化判别。最后,本文搭建Spark大数据机器学习平台,以奥克兰区域路网作为实验路网,利用PeMS系统采集实验数据,采用数据并行化与任务并行化的策略,对路网交通运行状态判别过程进行并行化分析与实现。实验结果表明:Spark大数据机器学习平台下,并行聚类与串行聚类具有一致的可靠性,聚类结果能有效反应交通流运行特性;并行分类与串行分类具有一致的准确性,基于随机森林的分类决策模型平均F度量、精确度、召回率可达98.97%,98.99%,98.96%;路网交通运行状态并行判别比串行判别效率明显提高,平台具有良好的可扩展性和加速比。本文方法能对路网交通运行状态进行及时、准确判别。
其他文献
2015年我国移动游戏业务收入已经高达五百多亿元,大唐高鸿公司作为电信研究院下属的央企,在移动互联网移动游戏行业中占据了一定的优势。由于外资的进入,加剧了移动游戏行业
书籍是人类文明的象征和载体,它的出现和演进标志着人类迈入了崭新的进程。书籍会调动人们的视觉、触觉等感官,这些知觉不仅仅来自于我们观察到它的最初视觉影像,也来自于当
建筑防水是一门综合性、实用性很强的工程技术,对建筑工程的使用功能起着至关重要的作用。根据近几年的施工实践,对建筑屋面、地下室、厕浴间以及储水池等提出建筑防水工程质
期刊
城市交通拥挤一直是世界性的研究热点和难点问题,已有研究发现出行者一般通过直接改变出行路径和出发时间的决策来间接地对路网延误现象实施应对.本文给出了一个简单的出发时间
随着服务业的重要性上升,越来越多的学者开始关注创新流程。同时,全球化正推动着创新流程变得越来越开放。现在有一条公认的智慧,即创新是源于合作和跨越专业或组织边界的知