论文部分内容阅读
近年来全球定位技术、无线通信技术与移动互联网技术的不断发展,促进了各种可定位设备(如卫星电话、移动电话、GPS接收器)的广泛应用,在提高了移动对象时空轨迹数据获取便捷性的同时,也大大的降低了获取成本。与普通时空数据挖掘不同,时空轨迹数据中隐含着被研究对象的移动特征,时空轨迹挖掘目的是发现个体或群体的行为模式。轨迹记录了对象随时间变化的移动情况,由众多的采样点按时间顺序组成,每个采样点都包含有时间、空间、速度、语义等属性。传统挖掘方法以点间距离判断对象间的相似性,时空轨迹则是由多个数据点有序排列组成的,两条轨迹中采样点间的距离有的比较近,有的比较远,所以在判断轨迹相似时,单纯考虑点间距离已无法满足需要,需要判断点序列的相似性。由此可见研究时空轨迹挖掘比传统数据挖掘的复杂程度要高。时空轨迹数据研究有很高的应用价值,可应用到多个领域,如动物迁徙规律发现、基于位置的服务、交通管理与规划、移动对象行为模式发现等。本文主要围绕轨迹聚类框架、轨迹的相似性度量以及轨迹聚类算法展开研究。并在此研究的基础上,首先提出一种新的基于路网感知的时空轨迹聚类框架。其次在改进了基于路网的轨迹划分方法的基础上,提出一种新的时空轨迹相似度量方法。最后,提出一种基于路网感知的时空轨迹聚类算法,NEASTT算法。考虑到以整条轨迹聚类和依据特征点划分轨迹片段的聚类方法中存在的不足,和移动对象在特定路网空间移动的特点以及轨迹数据包含的时间、空间、速度等属性特征,首先在路网空间内分割原始轨迹为轨迹片段,以轨迹片段为单位根据时空轨迹相似性度量方法度量轨迹片段间的时空距离,同路段内的时空相似轨迹片段聚集为聚类单元,再运用基于路网感知的时空轨迹聚类算法(NEASST算法)以聚类单元为单位,选择最优的相邻聚类单元进行时空流聚类。最终得到的流聚类即为移动对象在一定时间范围内的高流量、强连续的运动路径。从实验结果可以得知,本文提出的基于路网的时空聚类框架及算法可以对时空轨迹进行有效的聚类,而且可以发现移动对象在某个时间范围内的运动代表路径。