论文部分内容阅读
随着科学技术不断进步,公交客流数据在不断地积累,这些客流数据中存在不少缺失或者损坏的问题。公交客流数据能够准确地分析和应用是智能公交调度的基础,在智能公交调度与控制中起着重要的作用。为了能给公交调度人员提供准确的公交客流数据,指导公交调度的顺利进行,研究公交客流缺失数据填补和在此基础上的公交客流短时预测方法是非常有必要的。提升公交客流缺失数据的填补精度,利用填补好的客流数据进行短时客流预测,提升预测的准确度,是本文想要达到的目标。本文选择机器学习相关算法对公交客流数据进行研究,针对原始数据中含缺失数据的问题,本文提出利用NN-DSAE组合模型进行缺失数据的填补,在此基础上,为了更好地提升短时客流预测的准确度,本文提出基于LSTM网络和决策树组合模型用于短时公交客流的预测。本文在描述公交客流缺失数据填补模型过程中,对NN(邻域)、AE(自编码器)、DAE(降噪自编码器)和DSAE(堆叠降噪自编码器)进行分析,采用邻域-降噪堆叠自编码器的客流缺失数据填补方法。NN-DSAE组合模型首先对公交客流数据进行分析,在此基础上改进缺失值的邻域范围,提升寻找缺失值邻域的效率,将找出的邻域矩阵作为堆叠降噪自编码器的输入参数,经过该编码器的处理产生的数据填补缺失值。使用公交集团提供的真实公交客流数据,将该组合模型和神经网络模型、历史平均法进行实验对比,结果表明该NN-DSAE组合模型对公交客流缺失数据的填补准确率和填补率均优于神经网络和历史平均法。为了提升客流预测精确度,本文提出基于LSTM网络和决策树组合模型,该模型首先利用db3三层小波分解函数将公交客流数据分解成均匀部分和随机部分,使用LSTM网络预测公交客流均匀部分,使用公交集团提供的真实客流数据验证该算法的预测精度,并与ARIMA、SNN、回归树和RNN算法作比较,说明该算法的优势,实验结果表明LSTM网络预测的客流数据相对于其他算法在保证预测精度的同时更具平稳性。使用决策树算法处理公交客流数据随机部分,处理结果作为客流预测的误差调整项对经LSTM处理过的均匀部分调整误差,将调整结果作为最终客流量,并把该结果分别与单预测器LSTM、决策树的预测效果进行比较,结果表明本文的组合模型效果更佳。使用本文提出的NN-DSAE客流填补算法填补客流数据,在此基础上应用LSTM神经网络和决策树组合模型预测短时公交客流数据,经过这两步骤的处理,能提供比较精准的客流预测模型,为实现智能公交调度的目标打下了坚实基础,进一步推进智慧城市的建设与发展。