论文部分内容阅读
信息技术的发展给人们的现代生活带来了更多的便利,随着互联网技术的进步,特别是Web2.0技术如博客、社交网络、微博的发展,互联网的使用者——人类的角色也在发生着转变。互联网的用户从单一的消费者开始慢慢变成生产者,与之前单向的获取网络编辑生成的资源不同,贡献和分享成为潮流。全世界分享者的经验汇集起来组成一个巨大的知识库。如何利用互联网上海量的信息为人们生活服务,是一个很有价值的研究问题。本论文从互联网用户分享的海量图片数据入手,从中挖掘出用户的路线,建立搜索引擎对路线进行检索,通过挖掘用户信息和行为从而为用户提供个性化的路线推荐服务。具体说来,论文的主要研究内容和创新点如下:1.对时空数据研究背景和现状进行了分析。总结了GPS系统的发展,特别是我国“北斗系统”的进展,分析了用户生成的带位置信息多媒体数据的发展,对海量时空数据管理中面临的问题进行了归纳和总结;2.提出了一种快速高效的从海量图片中挖掘用户路线的算法。该算法充分挖掘海量图片背后的元数据如时间和空间信息,根据相机生成图片的准确时间和所处位置,恢复拍摄者所处位置,由一系列的位置恢复拍摄者的路线;在恢复路线的过程中,针对部分用户上传照片数量不足导致路线质量不高的问题,提出了基于检索的路线增强算法。实验验证了路线挖掘算法的有效性以及增强过的路线能提高用户的体验;3.提出了针对用户路线的索引算法、快速的路线相似度计算方法以及带重启的随机游走路线排序算法,用于构建路线检索原型系统。针对路线这种特殊的资源,为了向用户提供位置相关的服务(LBS),提出一种路线的空间索引算法:有向稀疏倒角距离可以快速高效地在线性时间内计算路线之间的相似度,使得构建一个真实的路线检索系统成为可能;带重启的随机游走算法既考虑了路线的质量又考虑了路线的流行程度,从而能更好的排序。实验验证了整个路线检索系统的有效性;4.提出了一种基于用户历史信息的个性化路线推荐算法。该算法针对用户自发查询路线有诸多不便这一问题,从用户的历史信息中挖掘用户的兴趣和偏好,主动地为用户提供用户可能感兴趣的路线。该算法将有广阔的应用,特别是在智能手机都能收集用户地理位置信息的条件下,将能为用户提供即时的路线导引。实验表明基于用户历史轨迹的推荐比仅基于当前位置的推荐能更好地满足用户需求;5.构建了一个交互式的规划系统。用户可以方便地与系统交互,可视化地快速浏览系统挖掘得到的路线以及路线的多种相关信息,自由的改变原始规划,得到自定义的个性化路线方案。最后,对本文的主要工作和创新点进行了总结,并对接下来的研究工作做出了进一步展望。