论文部分内容阅读
移动通信技术发展带动各行各业产生了海量的时空轨迹数据,也催生了大量对时空轨迹的数据挖掘研究,但目前对轨迹的挖掘研究多聚集于道路交通等领域,对开放空间轨迹的研究较少。本文以提取开放空间中目标运动轨迹下所蕴含的语义信息为动机,针对开放空间轨迹标注信息少、数据量大、不确定性高的特点,设计了轨迹向量化方法,将开放空间中的轨迹坐标转化为包含语义信息的轨迹向量,以完成其他轨迹挖掘任务。本文首先针对基于密度的聚类算法时间复杂度较高的问题,对DPC算法进行了基于网格的改进,提出DPSCGNS算法,可以有效地提取任意形状的聚类,并且对参数具有鲁棒性,比其他基于密度的算法时间复杂度更低。其次提出轨迹动作的概念,设计了基于热点区域的轨迹区域序列化方法和基于轨迹动作的动作序列化方法,利用得到可以进行向量化分析的标注序列。使用一个简化的神经网络模型,词向量模型Word2vec对离散化的轨迹序列进行向量化分析,得到包含语义信息的轨迹向量。最后使用AIS船舶数据集设计轨迹向量聚类分析实验和轨迹目标分类实验,验证了使用轨迹向量进行轨迹数据挖掘任务的可行性,证明轨迹向量方法是有效的。