论文部分内容阅读
随着我国城市经济持续快速发展,汽车拥有量的飞速增长和有限的城市道路资源之间的矛盾日益加重。其中私家车具有较高占比,据统计,截至2017年底,私家车占比约为80.3%。一方面,私家车的高拥有量加重了城市问题,例如,能源消耗、交通拥堵、环境污染等,另一方面,随着定位技术、信息处理和数据挖掘等技术的发展,私家车为城市计算、智能交通系统等应用提供了大规模的轨迹数据。准确采集及获取私家车轨迹数据并对其特有的移动模式和轨迹特征进行分析和挖掘,对研究居民出行特征和交通流演变具有重要意义。本文基于城市私家车轨迹,对城市私家车有规律出行行为及其出行模式进行研究,主要工作如下:针对获取的私家车轨迹存在数据冗余、漂移等问题,为了消除数据质量问题对后续各技术环节的不利影响,本文对私家车原始轨迹进行数据清洗。首先,为了减小数据存储空间,本文对冗余和无效的GPS(Global Positioning System)数据进行去除。然后,为了提高轨迹数据分析和挖掘的性能,本文通过阈值检验法对发生漂移的GPS数据进行检测和剔除。基于城市私家车的历史轨迹数据,提出一种挖掘私家车有规律出行行为的方法。由于轨迹的相似度可以反映轨迹的规律性,首先提出了IERP(Improved Edit Distance with Real Penalty)方法来度量轨迹之间的距离,进而得到车辆的轨迹相似度矩阵。然后利用核主成分分析(Kernel Principal Component Analysis,KPCA)方法降低特征维数,提高模型的性能和计算速度。最后,基于迁移学习方法对私家车的有规律出行行为进行挖掘以解决少量标记样本数据难以学习的问题。本文基于真实城市环境下私家车轨迹进行有规律出行行为的挖掘实验。基于规律出行私家车工作日出行轨迹,提出一种挖掘规律出行私家车主要出行模式的方法,即私家车对不同地点的时间分配方式。为了利于对出行时间特征的表示,首先,利用I-DBSCAN(Improved Density-Based Spatial Clustering of Applications with Noise)算法提取私家车的出行停留信息。然后根据停留信息利用条形时间块对出行时间特征进行表示。最后,本文将ED引入DBSCAN对样本距离进行度量,利用ED-DBSCAN算法对规律出行私家车主要出行模式进行挖掘。本文基于深圳市规律出行私家车进行主要出行模式挖掘实验。