论文部分内容阅读
随着移动通信技术的发展和移动设备的普及,关于人们日常移动行为的轨迹数据记录愈发的丰富起来。海量的轨迹数据背后隐藏着关于人及人类社会的有价值的知识模式。各界的学者利用数据挖掘和机器学习的方法对这些数据进行了多种角度的挖掘分析,旨在实现数据到信息再到价值的转化。在轨迹挖据领域中,轨迹预测作为其中的一个重要子课题近来越来越受到广泛关注。如果能够较为准确的对每个用户的未来位置进行预测。从微观上来说,生活服务App可以提前向用户推送未来位置周边的项目,提升用户体验。从宏观上说,我们可以根据历史的多张人口分布热力图,推演未来一段时间的分布热力图,这能够在交通领域,城市管理等发面发挥重要作用。目前,对于轨迹预测研究所普遍采用的数据是GPS定位数据且基于个人的历史轨迹,这个数据集的形态及预测方式可以认为是纵向的。而相对于GPS定位数据,更为丰富的数据是来自于蜂窝通信系统基站定位的数据,虽然这部分定位数据数据质量相对较差,但与GPS数据相比,手机信令数据具有数据量大,覆盖人群广,获取成本低等优点,因此研究基于蜂窝网移动信令数据的移动轨迹清洗和预测方法具有重要的理论和应用价值。论文首先在基站数据清洗方面展开相关研究,以有效地消除因为蜂窝网定位偏差和错误,以及定位数据间隔时间不均匀等非理想因素对用户移动轨迹预处理的不利影响,基于滤波算法使处理后用户轨迹尽量逼近真实的用户移动轨迹。接下来,论文在前人研究的基础上,整合并提出了一个纵向的预测方法及其框架。该方法首先分析用户每日停留区域及其停留时刻特征,计算确定相似度指标,并采用凝聚式的层次聚类算法对用户进行聚类分组,从而在纵向数据与横向经典方法之间建立联系。此外,论文还提出了停留区域扩展算法对停留点的异同性进行判别等。论文针对真实的TDOA基站定位数据的实验与验证结果表示,该方法与稀疏历史数据下的传统纵向方法相比,准确性有所提升。这表明基于横向的基站定位数据的轨迹预测在一定程度上是具有可行性和潜力。