论文部分内容阅读
出行模式识别在用户轨迹查询、用户行为预测、基于用户位置的兴趣推荐、用户隐私保护与市政交通规划等多个方面有广泛的应用。由于目前的识别准确率不能满足应用需求,所以出行模式识别研究是目前轨迹数据研究中的焦点问题。伴随着GPS导航技术与智能移动设备的普及,可以从中获取大量的用户移动数据信息,基于这些信息可以进行很多有意义的研究。其中,对轨迹信息的出行模式识别研究就是其中之一。在目前的出行模式研究方法中,对轨迹的特征提取只局限于轨迹的基础属性(速度、角度、加速度等)。本文在此基础上提出了使用排列熵作为轨迹的一个特征值参与轨迹分类研究,排列熵作为一个衡量时间序列复杂度的属性,本文使用了速度排列熵与角度排列熵作为轨迹的特征参与到出行模式的分类中。本文首先研究排列熵与轨迹分类准确度的关系,通过对相同数据集的实验分析,分类结果较差的排列熵值相对较大。在速度等属性的基础上,增加排列熵属性进行分类,可以提高实验结果的准确度。在分类模型的选择方面,由于目前使用的分类模型(SVM,决策树等)均属于浅层分类模型,本文采用的方法为深度神经网络(Deep Neural Network)模型,与浅层分类模型相比,深层模型能够使用隐含的多层复杂结构以及非线性变换,来表达对数据的高度抽象,从而得到更好的分类结果,在增加了排列熵属性的基础上,使用深度神经网络分类模型可以使实验效果进一步提高。本文在理论研究的基础上,设计并实现了出行模式分类系统以验证本文所提出的特征提取方法与分类模型的有效性。此系统通过采取一定数量的训练集,在监督学习的基础上,能够通过原始的GPS轨迹数据分析出此轨迹的出行模式,包括汽车、公交车、步行、自行车和火车的轨迹。通过分类系统的实验,验证了本文所提出的方法是可行且有效的。实验结果表明,本文所提取的属性与使用的分类方法与其他方法的分类结果相比准确性有所提高。