基于前缀树的频繁行迹挖掘方法研究

来源 :西安理工大学 | 被引量 : 0次 | 上传用户:hongdou0219
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近年来,以智能手机等移动设备为载体的移动应用得到了广泛使用,并逐步影响人们的生活方式。人的移动性带来的位置行迹不仅记录了人的行为历史,也记录了人与社会的交互活动信息,这些位置轨迹数据的分析与利用,可以为基于位置的服务系统提供更好的帮助。本文通过分析典型行迹数据简化、聚类及挖掘方法,研究了基于线段的频繁行迹数据聚类方法,提出了一种基于前缀树的频繁行迹挖掘方法,并进行了实验分析和验证,表明本文方法具有较好的性能。本文主要工作包括:  (1)由于从移动设备中获取的GPs行迹具有数据量大、处理时间长,存在异常值等问题,因此需要进行预处理。本文首先介绍了行迹数据简化的主要依据,即垂直欧式距离和基于时问的垂直欧式距离概念,然后详细介绍了典型的行迹数据简化方法和行迹平滑方法,并对这些方法进行了实验分析和对比。  (2)针对移动对象行迹中的位置模糊性问题,在分析现有的基于行迹点聚类和线段聚类方法基础上,利用位置点的时间特性提出了一种基于DBsCAN的行迹聚类改进算法。该方法加入了时间邻域阈值以及合并限制条件,来避免生成过大的频繁区域,实验结果表明该方法具有良好的聚类效果。  (3)针对现有频繁行迹挖掘算法时间效率较低等问题,提出了一种基于前缀树的行迹挖掘方法,该方法首先构建行迹数据的完全前缀树,然后调整完全前缀树为相应的偏序前缀树,最后采用深度优先遍历算法挖掘频繁行迹。实验结果表明,基于前缀树的频繁行迹挖掘算法具有较好的时间效率。  
其他文献
随着信息化及多媒体技术的不断发展与提高,越来越多的数字产品进入互联网环境,人们获取信息也越来越容易。于是,网络上的多媒体信息的版权保护问题已成为一个迫切需要解决的问题
标点符号研究是篇章分析中最基本的一个研究任务。有效识别标点符号在句子中的作用,是篇章分析研究的一个关键。因此,标点符号识别是一项很有意义的研究工作。本文针对标点符号
图像修复指在计算机上通过一定的算法填补图像上缺损信息的过程,并要求填补结果达到人眼接受的程度。目前图像修复技术主要分为基于偏微分方程的结构部分修补和基于纹理合成的
在虚拟化桌面技术应用日益增加、功能愈发强大的情况下,其安全问题已然成为阻碍虚拟化桌面发展的一大瓶颈,无法满足客户对安全性的需求。如何确保虚拟化桌面的安全性、让用户可
近几年,基于位置的服务得到了广泛的关注,在诸如行车导航、位置查询、生活服务等领域有着广泛的应用。随着定位技术的不断发展,人们对于室内定位的需求同样与日俱增,并凸显出
近年来,随着互联网信息的迅速膨胀,数据的商业价值不断地被挖掘出来,以提供增值服务,例如评论分析、元搜索、比较购物、大数据应用等,这些都是建立在Deep Web数据获取与数据集成基
学位
传统的基于Web的应用系统中,开发者可能会将业务逻辑、数据逻辑和展示逻辑混在一起。这不利于代码调试和页面的设计,更不利于系统的可扩展性。MVC设计模式的出现解决了这些问题
医生对病人的诊断过程是利用临床医学知识加上多年的经验积累,并通过询问病情、化验、B-超、核磁共振等医疗手段获取相应数据后,判断推理该病人所患疾病、选取治疗方案。论文采
节点能量有限已成为制约无线传感器网络性能的主要瓶颈,在保障信息传输质量的前提下,如何充分利用有限的网络资源、减少网络节点能耗、延长网络生命周期等已成为无线传感器网