论文部分内容阅读
城市居民的活动与出行行为是城市活动-移动系统的重要组成部分,对城市居民出行行为特征的分析有助于科学地进行城市规划和交通管理,然而,通过传统人工调查和统计分析方式获取居民出行活动信息已无法满足城市化进程快速发展的需要。另一方面,随着通讯、定位及存储等信息技术的应用与发展,城市居民出行的大量移动轨迹数据可以被搜集和存储,这些轨迹数据中包含丰富的时空语义信息,通过挖掘和分析可以从中获取很多有价值的出行信息,进而发现个体用户的日常行为规律和群体用户移动的空间分布特征,其结果能有效服务于智能交通和城市规划等领域。本文致力于时空轨迹数据挖掘方法及其在城市居民出行行为模式分析中的应用研究。首先构建时空轨迹数据模型,提出一种基于公共分片子序列的轨迹离群点检测方法,并结合北京市居民个人出行轨迹数据分析异常路线;其次,设计基于多特征相似性度量模型的轨迹聚类方法,并通过居民常规出行路线的分析进行实例验证;然后,提出基于信息熵和多层BP神经网络的轨迹分类方法,用于识别居民出行路线中所采用的交通方式;最后,基于北京市出租车轨迹数据集,从热点分布和移动模式等多个角度对城市居民的出行空间特征进行分析,提出基于邻域关联质量聚类的热点位置挖掘方法,并通过居民出行通勤分析和出租车上下客热点区域检测进行了实例验证。主要工作与创新点如下:(1)针对居民出行路线中局部异常轨迹识别困难的问题,提出了一种基于公共分片子序列的轨迹离群点检测方法。首先提取轨迹方向码序列和轨迹分片序列,通过识别两条轨迹之间的公共分片子序列测量CSS(Common Slices Sub-sequence)距离,再根据CSS距离的计算结果检测出离群分片和离群轨迹。在带分类标记的合成轨迹数据集上进行对比实验,结果表明该方法适用于轨迹分片划分和轨迹离群点检测,且检测率优于现有方法。最后,将所提方法应用于GeoLife项目提供的真实用户日常出行轨迹数据集上,检测居民的异常出行轨迹并分析其产生的可能原因。(2)传统轨迹聚类方法未充分考虑轨迹数据内外在特征,无法有效分析居民出行的常规路线。为此,提出了一种基于多特征相似性度量的轨迹聚类方法。该方法利用轨迹的时间、方向、速度、形状、位置和连续性等特征来实现轨迹之间的相似性度量,并基于轨迹时长对轨迹簇的初始中心选择进行优化,提高了聚类结果的准确性和稳定性。最后,将该方法应用于城市居民出行常规路线的分析中,验证了其实用性,为城市管理和交通规划提供了辅助决策依据。(3)出行交通方式是居民出行行为特征的主要构成部分,以居民出行交通方式识别为应用背景,提出了一种基于信息熵和多层BP神经网络的轨迹分类方法。该方法综合考虑时间戳、经纬度、所在路段等地理信息,提取每个位置点运动特征,利用信息熵对特征进行筛选和加权,构建多层神经网络结构进行轨迹分类,并结合识别后处理机制进一步提高交通方式识别的准确率、优化识别结果。与传统的机器学习方法和相关算法进行比较的实验结果表明,本文提出的分类方法具有高精确度,可以有效识别城市居民出行采用的交通方式,弥补和解决传统出行调查工作的困难和不足。(4)以北京市出租车轨迹数据集为数据源,从多个角度对城市居民出行的时空特征进行分析,有效发现城市热点及区域移动模式。首先,提取出租车载客出行轨迹及上下客位置数据,提出了基于邻域关联质量聚类的城市居民出行热点区域检测算法,从出租车轨迹数据中挖掘出有效、合理的城市热点;然后,从上下客位置的空间分布特征、载客出行轨迹区域移动模式、城市居民出行热点区域分布等方面进行了实验验证和可视化分析。结果表明,对出租车运行轨迹数据的深入挖掘结果有助于城市居民出行空间特征分析,轨迹热点区域检测结果可以为交通管理系统提供有价值的服务。