轨迹数据分析与挖掘关键技术研究

来源 :清华大学 | 被引量 : 2次 | 上传用户:InsideCSharp
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
定位技术在移动终端上的广泛使用以及基于位置的服务和移动社交网络的发展和普及,产生了大量的轨迹数据,包括车辆轨迹数据和用户轨迹数据。越来越多的应用(如基于热度路线的导航、信息推送和广告推荐以及车辆共享等)对轨迹数据进行分析和挖掘,以实现更好的服务质量。在此过程中的研究重点和挑战包括:(1)轨迹相似度分析,如何定义合理的轨迹相似度函数,并实现大数据集上高效的相似度连接算法。(2)用户轨迹发现问题,如何从大量非标准化的用户社交媒体内容中识别出用户的轨迹,并保证较高的准确度。(3)轨迹匹配问题,采用某种相似度度量标准,如何高效地匹配具有相似出行需求的用户轨迹,实现资源利用的最大化。具体地,本文的主要研究内容和贡献包括:1.基于相似度连接的轨迹分析:论文研究车辆轨迹的相似度连接问题,目的是实现相似轨迹的高效查找。针对现有方法不能较好地度量轨迹相似程度的问题,论文提出一种有效的双向轨迹相似度函数。为轨迹设计基于网格和阈值感知的两种签名,将签名相似作为轨迹相似的充要条件。论文提出高效的基于签名的“过滤-验证”算法框架。在“过滤”阶段,使用基于上下文和基于代价的策略,通过代价较低的签名相似度判定,实现不相似轨迹的快速剪枝。在“验证”阶段,提出了基于签名、基于扩展顺序以及基于上下界的候选集验证策略,进一步提高效率。2.基于微博的轨迹发现:用户在社交媒体发布的内容中包含位置信息,对其进行时间、空间维度的组织和分析可以得出用户轨迹。传统的轨迹发现方法对非标准化用户内容的容错性能欠佳,轨迹识别识别精度较低。本文将位置参考数据组织为位置索引树,进行逐层递进的位置发现。利用模糊匹配方法解决微博内容不规范的问题,发现微博的top-k位置;将多条微博的top-k位置聚合形成用户top-k位置,得出用户轨迹,并反馈优化微博top-k位置的质量。此外,对微博内容和位置参考数据的动态更新也提出了增量式算法,支持数据更新。3.资源利用最大化的轨迹匹配:在研究了车辆轨迹相似度连接和用户轨迹发现的基础上,论文进一步探讨将用户行驶活动形成的轨迹按照某种相似度标准(共享路径百分比)进行匹配,实现资源利用最大化。在基于连接的模型中,将问题转化为二分图最大匹配问题,并设计了高效的保证质量的近似算法。在基于搜索的模型中,提出了基于扩展的策略和最优者最先的策略,实现top-k匹配的最快查找。
其他文献
《长江经济带发展规划纲要》设立了长江经济带两大战略目标:即到2020年,使生态环境得到明显改善,并推进区域创新驱动,逐渐形成战略性新兴产业规模,培育形成一批世界级的企业
关于轻声的历时研究,成果尚不多见。本文从跨方言的研究视角对三种与轻声有关的连读变调以及存在于一些方言中的轻声分类现象进行了初步的分析,在此基础上探讨了汉语轻声的历
畜牧业是农业经济的重要组成部分,它直接关乎老百姓餐桌上的食品构成与食品安全,关乎老百姓的健康.如何提高畜牧兽医技术管理水平,提高兽医技术服务能力已成为关注的焦点.本
教育过程是教师与学生之间的信息交流过程。本文从教育活动中双向式信息流动、信息流动的质量互变、信息传递的有形和无形等三方面,探讨了师生间信息交流的机制问题,着重强调师
介绍变电站母线电量不平衡的原因,如果母线平衡率达不到要求,会严重影响到供电局对变电站变损和线损率的统计考核。
以鲜切青笋为原料,分别采用单因素试验与正交试验方法确定不同护色剂的最佳浓度。试验结果表明,鲜切青笋经4%柠檬酸,5%抗坏血酸,0.07%苯甲酸钠混合溶液处理10min,再利用真空
堵漏是舰船破损进水后保持浮性的主要方法,对舰船生命力的保障起着至关重要的作用。本文对国内外舰船堵漏的基础理论研究成果、堵漏器材与堵漏方法的研究现状进行了综述,在此
食品安全是维护人们健康和社会稳定的基础。随着监管和处罚力度的加大,我国危害食品安全犯罪得到有效控制,但是食品专业的复杂性致使针对危害食品安全行为的刑事惩罚面临很大
目的:探究半夏泻心汤联合血液透析治疗尿毒症的临床效果。方法:选取我科在2017年3月--2018年9月收治的92例尿毒症患者,采用随机数字表法分为两组,对参照组(n=46)予以血液透析
首先阐述了空间分析和应用模型的基本概念,进而从地理信息处理系统的功能入手,分析了空间分析、应用模型和GIS的关系,最后指出加强应用模型与GIS的结合以及增强GIS的基本空间分