论文部分内容阅读
该项目来源于高睿鹏老师的科研项目以及本人在滴滴出行公司实习期间的实际项目。该项目基于智慧交通的应用及发展,结合多源异构交通大数据来预估道路的通行时间。在交通出行领域,道路的通行时间已经成为人们出行选择的重要参考指标之一。在实际的交通应用场景中,道路的通行时间也是衡量道路运行状态、交通规划、智能交通研发、城市交通运行水平的一个重要指标。准确预估道路的通行时间不仅能够提高人们的出行效率,还能够进一步提升交通的服务质量。当前道路通行时间的预估方法主要集中于路径的OD(origin-destination,OD)研究。该研究主要分为两类,一类是基于路径的预估方法,另一类是基于数据驱动的预估方法。通过大量的实验证明,当前方法在数据的稀疏性、模型的泛化能力以及数据的利用率方面相对来说具有很多的局限性。为了有效解决上述问题,本论文在现有方法的基础上,提出了基于神经网络的道路通行时间预估方法。在本方法中,分析利用多源异构数据特征如GPS轨迹数据、路网数据以及外部属性数据如天气、日期等,通过结合不同的数据特征输入到网络模型进行训练预测,得到网络模型的预测值。在该方法的实验过程中,本论文首先对现有的多源异构数据进行数据分析及建模;其次,针对不同的数据特征采用不同的数据处理方法,如为了进一步有效地提取路网数据的空间特性,本论文对路网数据采用DeepWalk算法,目的在于保留路网拓扑邻接关系的特性基础上,将路段编号进行向量化处理;对于外部特征,由于其属于类值属性,不能直接输入到网络模型,所以本论文采用Embedding方法将其向量化表示,不仅能够保留其语义之间相似性,还能够降低数据维度。最后,基于不同的交通数据特征,结合长短时记忆网络LSTM(Long Short-Term Memory,LSTM),采用深度学习框架PyTorch实现了预估道路通行时间的方法。通过对北京、上海两地的数据集进行模型的训练与测试,采用不同的评价指标,如平均绝对误差比MAPE(Mean Absolute Percentage Error,MAPE),平均绝对误差MAE(Mean Absolute Error,MAE)以及均方误差MSE(Mean Square Error,MSE)来评估模型的效果。在实验过程中,模型的MAPE的值分别为0.1736和0.1807,MAE的值分别为103.66和12.35,MSE的值分别为13279.21和13762.18。通过对现有不同方法的结果分析,本论文提出的道路通行时间预估方法具有较低的预测误差,其模型效果优于其他现有的方法。