论文部分内容阅读
高速公路全国联网收费系统具有高效、环保、节能等优点,有效缓解了交通拥堵、环境污染等问题,为我国三大战略和新型城镇化建设提供了有力保障。但是,该系统在收费数据的拆分方面存在不足,不公平、不合理的拆分问题将随着全国联网收费的范围和深度的增加而更加突出。一方面,联网收费数据的模糊拆分必然引起收费数据的拆分争议,而高速公路路段业主在发现和解决收费数据拆分争议方面缺乏可靠依据,可能造成巨大的经济损失,亟需建立对联网收费数据拆分的校核系统。另一方面,基于硬件投入对通行费的拆分结果进行校核的方法成本高、效益小、准确率低、稳定性差,且难以推广应用。所以,研究低成本、高精度、稳定性强、易于推广的收费数据拆分校核方法具有重要的现实意义和经济价值。本文针对硬件投入式校核方案的缺点,首次提出基于数据挖掘技术的收费数据拆分与校核方案,通过对高速公路历史通行流水进行分析,建立收费数据拆分与校核模型,利用路段掌握的不完整收费数据预测路段无法掌握的收费数据,再与结算中心的数据进行对比,达到收费数据拆分与校核的目标。本文以广州北二环高速公路为研究对象,首先采集、整合了路段和结算中心半年的通行流水数据,对收费数据进行预处理,从宏观、微观角度对车流数据进行分析,建立以收费数据拆分与校核为主题的数据仓库;然后利用Lasso算法和逐步回归算法筛选变量,基于多元线性回归算法实现非本路段出车流的车流量和通行费的精确预测,并对模型进行评估;最后对该模型进行验证和应用,并对实际应用效果进行了分析。结果表明,Lasso算法和逐步回归算法的结合能很好的筛选出显著性变量,并解决多元线性回归中的多重共线性问题;该算法精度高、稳定性好、便于推广,能够满足路段对车流量和通行费的精准校核。