论文部分内容阅读
随着社会经济的高速发展,出行需求的持续增加,道路供需矛盾日益突出,致使交通拥堵路段的数量和里程逐年增加。实时准确的交通状态判别和预测,对于交通拥堵的智能管控具有重要的作用。随着ITS的逐步实施,各类交通检测设备提供了不同精度、广度和深度的大量交通数据。然而,如何有效分析交通数据却成为一个巨大的挑战。传统数据分析方法往往具有特定的模型结构和过多的假设条件,而不能满足分析各类数据的需求。因此,有必要研究和探索用于交通状态判别与预测的新方法,以充分挖掘交通数据所蕴含的丰富交通信息,进一步提升交通状态判别与预测的准确性和可靠性。本研究旨在改善交通状态判别与预测的效果,在分析各类交通数据的基础上,采用先进机器学习方法,并有机结合特征选择、群体智慧搜索和时间序列分析等理论方法,对交通状态判别与预测方法展开深入研究。主要研究内容及成果如下:(1)基于PSO-SVR优化FCM的交通流缺失数据修复方法在分析交通流数据时空相关性的基础上,提出了基于PSO-SVR优化FCM的缺失数据修复方法,以模糊C均值(FCM)为基础算法,采用粒子群优化算法(PSO)和支持向量回归(SVR)的组合形式对FCM进行优化。首先,分析了交通流数据缺失模式和缺失数据的表达形式;然后,分别以城市快速路和主干路数据为例,对交通流数据的时空相关性进行分析,并在此基础上,确定算法的输入;最后,从三个角度设计实验方案,对所提出方法的性能进行测试。(2)基于变量选择和KELM的交通事件自动检测方法在分析事件发生时段交通流参数变化规律的基础上,选择15个变量构成事件检测初始变量集。然后,通过随机森林-递归特征消除算法从初始变量集中选择重要变量。以重要变量为输入,训练KELM模型,并通过GSA优化模型参数。此外,针对事件样本和非事件样本不平衡的问题,选用SMOTE方法平衡两类样本。(3)基于NCA-BOA-RF的交通事件持续时间预测方法在分析交通事件持续时间影响因素的基础上,并考虑所使用数据集的特征,从而选择18个影响因素作为事件持续时间预测的相关变量。通过近邻成分分析(NCA)找出6个关键影响因素作为特征变量;然后使用特征变量构造训练集,训练随机森林算法并采用贝叶斯优化算法(BOA)进行参数优化。此外,在测试算法性能的过程中,考虑了缺少变量的情况。(4)基于谱聚类和RS-KNN的交通状态判别模型有机结合监督学习和无监督学习算法的优势,构建了一种基于谱聚类与RS-KNN的交通状态判别模型。以地点交通参数为基础,根据交通流运行特性并结合中国道路服务水平的四个等级,采用谱聚类算法将交通状态划分为四类;然后,使用已分类的交通流数据训练RS-KNN模型;最后,采用实测数据验证了该模型的有效性。(5)基于时序分析和机器学习的交通状态预测模型本部分以机器学习方法为基础,分别结合两种时间序列分析理论,构建了两种短时交通参数预测模型。第一,针对交通参数时间序列具有混沌特性的问题,将机器学习方法与混沌时间序列分析理论相结合,构建了基于多变量相空间重构(MPSR)和组合核函数-最小二乘支持向量机(CKF-LSSVM)的短时交通预测模型。在分析交通参数时间序列混沌特性的基础上,通过MPSR确定CKF-LSSVM模型的最佳输入形式,并采用PSO优化模型参数。实证分析表明,考虑混沌特性以及采用多变量作为模型输入,都有利于提高预测精度。第二,针对交通参数观测序列含有噪声成分的问题,将机器学习方法与时间序列降噪理论相结合,构建了基于奇异谱分析(SSA)与核极限学习机(KELM)的短时交通预测模型。通过SSA过滤原序列的噪声成分,然后使用降噪数据训练KELM模型并通过GSA优化模型参数。实证分析表明,以降噪数据为模型输入,有利于提高预测精度。