论文部分内容阅读
随着中国经济的飞速发展,城市间的联系变得愈加密切,货运行业市场变得越来越大。公路货运作为我国目前最主要的货物运输方式,运用有效的方法准确预测公路货物运量,能够帮助改善城市交通状况、提高运输效率以及促进合理调配资源。首先对国内外公路货运量预测和机器学习的研究现状进行分析和总结,结果表明在预测货运量的研究中,使用机器学习方法比使用传统方法更具有优势。然后通过定性分析方法,综合从各个方面考虑,确定了在预测建模中使用的公路货运量影响因素。同时对传统的公路货运量预测方法和机器学习方法从理论上进行了对比分析:由于城市公路货运量预测研究中相关影响因素之间存在复杂的相关性,以及统计数据中的异常值等原因,导致传统预测模型表现欠佳,将机器学习方法引入预测研究可以提高预测的精度。近年来对机器学习的深入研究表明,深度学习领域和集成学习领域的新型机器学习方法拥有更广的适用范围,且模型预测精度相比传统机器学习方法更好。本文采用了两种新型的机器学习方法进行城市公路货运量的预测,分别是集成学习领域的Stacking方法、深度学习领域的降噪自编码方法。降噪自编码降低了传统BP神经网络模型在训练中的遇到局部极值与梯度弥散的风险。此外在自编码结构训练中加入的随机噪声,可以提高公路货运预测网络的鲁棒性和泛化能力,不易出现过拟合。Stacking相比其他集成学习算法,能选择对解决具体问题已经拥有良好性能的模型作为初级学习器,从而提高了模型训练的效率;通过交叉验证的方法构造次级训练集能使得最终生成的模型具有更高的预测精度。以深圳市公路货运量预测作为实例进行了应用研究,依照上两种机器学习方法进行建模进行预测,同时以传统方法的预测结果作对比,验证新型机器学习方法的可行性和有效性,结果表明降噪自编码模型和Stacking精度良好,均优于传统预测方法。其中Stacking在预测精度和构建模型的效率方面更优秀,可运用于城市公路货运量的预测工作。本文提出两种新型机器学习方法可为其他地区的货运量预测研究提供参考与借鉴。