基于Spark平台的高速公路流量预测研究

来源 :内蒙古工业大学 | 被引量 : 0次 | 上传用户:tree63
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着国民经济的发展,我国汽车保有量已经达到3.6亿辆。急速增长的车流量导致高速路网运行能力下降、交通事故高发、城市环境污染加剧、交通运营管理困难。及时准确的车流量预测作为智能交通系统(Intelligent Transportation Systems,ITS)中的研究主题之一,能够帮助交管部门针对外出车流进行提前约束和诱导,提高出行效率。针对现有研究存在对交通流时空特征提取不完整、预测精度不高、处理海量数据时计算效率较低且训练参数复杂等问题,本文提出了一种基于分布式内存计算的高速公路交通流预测模型。主要工作及创新点如下:首先对高速公路交通流原始数据进行分析,完成数据填充、数据转换、数据归约等数据预处理工作。其次为了分析高速公路交通流时空特征对交通流预测结果的影响,提出了一种交通流时空关系特征向量的构造方法,使用该方法生成高速公路交通流时空特征向量。再次为了准确预测高速公路交通流,本文给出了一种考虑时空特性的贝叶斯优化极端梯度提升(Based Bayesian Optimization eXtreme Gradient Boosting,BO-XGBoost)模型来实现高速公路交通流预测,该方法将交通流时空特征向量输入模型,通过不断分裂特征,生成多棵树,从而得到模型最优解,为避免因不合适的参数取值,造成模型陷入过拟合的问题,利用全局寻优式算法贝叶斯优化(Bayesian Optimization Algorithm,BO)算法优化模型重要参数,以此实现高速公路交通流的准确预测。最后为了减少BO-XGBoost模型在参数优化及构建最优树模型时的计算时间,本文提出一种基于Spark的优化极端梯度提升高速公路交通流预测(Optimized eXtreme Gradient Boosting model based on Spark,Spark-BO-XGBoost)模型,通过将BO-XGB oost模型部署在Spark分布式计算平台上,实现参数寻优以及最优树模型生成过程的并行计算。实验结果证明,考虑时空关系的BO-XGBoost预测模型具有更高的预测精度,整体性能较好。并且通过Spark并行化的BO-XGBoost模型具有良好的加速比和可扩展性,计算效率也明显提升。本文方法可以在保证高速公路交通流模型预测精度的同时,提升模型的计算效率。
其他文献
具有奇异系数的微分方程是近年来在核物理、气体动力学、流体力学、边界层理论、非线性场和光学等实际问题中提出的一类重要方程,数值分析和求解该类方程具有重要意义。早在二十世纪六十年代,计算数学工作者就开始研究此类问题。他们利用有限差分、对称和非对称、标准和非标准有限元等方法研究此类方程的线性以及非线性问题,并取得了一系列良好的结果。本文利用奇异有限元方法研究了一般二维奇异非线性椭圆方程。首先,利用Ban
本文研究Rn的子集X上的一类带有不等式约束的不可微广义分式规划问题。首先,在X是非空开集(凸集),约束函数是连续可微的情况下,讨论了单目标广义分式规划问题(FP)。接着,在X是闭凸集(凸集),约束函数是局部Lipschitz(连续可微)的情况下,讨论了多目标广义分式规划问题(FVP)。获得了问题(FP)和(FVP)的一系列有关于最优性条件和对偶理论方面的新结果。
基因技术从其产生开始便引起社会科学界的关注和争论。多年来,关于基因技术的社会研究主要集中在伦理学方面,事实上,由于基因技术的普遍性和特殊性,它已经成为整个人类社会的重大问题,对它的研究也不应只局限于伦理学范围,而应将视野扩展至哲学、社会学、人类学等其它学科。论文在吸收现有研究成果的基础上,从个体人、群体人、和类人三大层面系统地考察研究基因技术对人(包括个人、社会、人类)产生的影响,卉对当下学界的一
本文研究了单模q-形变光场与E型三能级原子相互作用系统和单模q-形变光场与E型三能级原子依赖强度耦合系统中的两种量子特性。通过数值计算,分析了旋波近似以及共振条件下这两种系统中形变参数q对光子反聚束效应和原子偶极压缩效应的影响。不同于平均光子数万的线性影响,形变参数q增大将导致光子数算符[n]非线性增大,非线性地调整两种量子现象随时间演化曲线所包含的各种周期、振幅不同的波动,使各种波动以不同的周期
microRNA是一类内源性的长度在22个核苷酸左右的非编码小分子RNA,它们广泛存在于真核生物基因组中。成熟的microRNA是由茎环结构前体pre-miRNA加工而来。microRNA基因具有三大生物学特性:保守性,基因成簇存在和时空特异性表达。成熟microRNA通过翻译抑制和靶mRNA降解两种机制来调控基因表达,在动植物的生长发育,细胞的增殖与死亡,细胞分化及肿瘤治疗等多种领域发挥着重要的
沙鸡(Pterocles)的分类问题一直困扰着鸟类学家。目前,对于沙鸡的分类有四种不同的观点:一种观点是将沙鸡归入鸡形目(Galliformes);另一种观点是将沙鸡归入鸽形目(Columbiformes);第三种观点是将沙鸡归入鸻形目(Charadriiformes);第四种观点是将沙鸡独立为目。鸥类的分类地位在目前也有两种不同的观点:一种是将鸥类归入鹆形目;另一种是将鸥类独立为鸥形目(Lari
本研究以牛的体细胞核移植为主题,比较了牛卵母细胞的不同采集方法、成熟培养方法以及牛卵母细胞的孤雌激活方法;分离并传代培养了牛的不同体细胞;并在此基础上较为深入的研究了影响牛体细胞核移植过程的激活方法、融合条件、发育培养的气相条件和供体细胞的血清饥饿状态等各个环节,比较了供体细胞的不同种类、不同来源和不同代次对重构胚发育的影响。 一、牛卵母细胞的采集、成熟培养及孤雌激活 1.以两种不同的
从20世纪60年代开始,随着科学技术的飞速发展,非线性科学已被深入研究并广泛应用于各种自然学科,例如机械、化学工程、电机、能源、土木工程、光学科学、通信、生物学、自动控制、材料等方面,同时出现了许多非线性发展方程式(简写为NLEE).目前,非线性科学已经渐渐成为了一门非常重要的现代学科,它能够很好的折射客观世界的发展变化规律,诠释个体与个体之间的相互联系.对这些非线性科学现象进行建模,并寻求这些N
骨骼肌肌球蛋白是肌肉收缩的关键成分,是把贮存在ATP中的化学能转化为机械能的分子马达。分子马达广泛存在于动、植物中,是生物体中多种运动的本质动因。有关分子马达的研究成为生物物理领域的热点问题之一。目前,在众多的分子马达中对骨骼肌肌球蛋白的研究较多,对其结构、工作循环机制及单分子动力学性质进行了探索。同时,对各种生化条件下肌纤维的收缩性质进行了研究。本文拟对肌肉收缩过程中的力与速度关系、肌球蛋白定向
谱方法作为求解微分方程的一种重要数值方法,是近40年来发展较快且相对成熟的数值方法,同有限差分法、有限元法相比,谱方法具有求解速度快、精度高、无穷阶收敛等优点.从七八十年代开始,随着现代电子计算机技术的飞速发展,谱方法的发展达到了前所未有的高度,被广泛应用于求解涉及物理学科、海洋科学、大气科学和工程技术等相关领域的微分方程,其基本思想是用整体光滑的试函数全局逼近问题的精确解,因此只要所求解的微分方