基于时空数据的挖掘算法研究

来源 :西安科技大学 | 被引量 : 0次 | 上传用户:sddmymj
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着移动互联网技术和数据采集技术的发展,产生了大量包含时间、空间等信息的时空数据。如何从这些时空数据中挖掘潜在有用的知识,用于指导决策、商业分析等社会服务,成为数据挖掘研究领域新的研究问题和热点。本文针对时空数据挖掘问题进行了研究,内容主要包括以下两个方面。(1)时空数据下兴趣区域发现方法的研究。针对现有空间聚类方法时间开销大,且不适应时空数据特性的问题,提出一种时空兴趣区域发现算法SPROI,该算法是一种基于网格和时空密度的聚类算法。一方面,结合访问频率和停留时间两个变量给出了时空密度的密度计算方法,充分考虑了时间、空间约束;另一方面,使用基于网格的聚类方法,在需多次、重复聚类的情况下提高了算法的运行效率。算法的主要过程包括:首先,将空间范围划分为单元格,计算数据所在单元格的时空密度,找出符合密度阈值的核心单元格。然后将核心单元格进行合并、过滤等操作,最后得到时空兴趣区域。实验表明该算法有效可行,效率较高。(2)时空数据下频繁模式挖掘方法的研究。由于时空数据的特殊性,现有的频繁模式挖掘算法不适应时空数据下的挖掘问题,提出一个时空数据的频繁模式挖掘算法SPMQT-mining。该算法考虑时空数据的动态性、序列性,采用滑动窗口模型,构建了基于矩阵、队列和前缀树的概要结构SPMQT压缩存储时空信息,基于Prefix Span方法递归地挖掘时空频繁序列模式。算法的主要过程包括:首先,将时空数据通过SPROI算法转换为兴趣区域序列。然后,针对时空数据的特性,通过构建概要结构SPMQT压缩存储时空信息来分离时空数据中的支持度信息、序列信息和挖掘所需索引信息。最后,基于Prefix Span方法递归地生成投影数据库完成挖掘。实验表明,该算法具有较好的时空效率。
其他文献
一、成本核算的目的和意义 疾病预防控制机构是纯公益性事业单位,在向社会提供卫生防疫、疾病预防与控制的同时,消耗大量的活劳动和物化劳动。疾控机构人员经费及专项业务服务
随着煤炭行业的科技进步和在煤矿中的广泛应用,无论是新建矿井还是老矿改扩建,运用带式输送机已经越来越普遍,所以带式输送机的安装技术亦应该普及,本文就输送机的安装程序和安装
随着经济社会的进步与发展,人们对能源的需求越来越多,并且逐渐把发展焦点转向了资源丰富的辽阔海域。在对海洋开发利用的过程中,以海洋平台为依托的离岸浮动式发电系统作为
针对液压挖掘机工作装置在下放过程中存在大量重力势能转化为热能的问题,提出了一种以蓄电池为储能元件的能量回收系统,利用已有的动臂势能回收实验台进行研究,分析了能量回
证券分析师是指专门向个人投资者或投资机构提供证券投资分析意见并指导其进行投资的专业人才,其职责是研究上市公司情况,向机构和个人投资者提供买卖股票的建议。由于证券分析
近年来,随着国民经济的高速增长,我国城镇化进程进一步加快,劳动力转移的规模和速度快速增加,大量农村劳动力脱离第一产业,转移到第二、三产业中去,导致农村劳动力数量急剧减
在钢结构设计的整个过程中都应该被强调的是“概念设计”,它在结构选型与布置阶段尤其重要,对一些难以作出精确理性分析或规范未规定的问题,可依据从整体结构体系与分体系之间的
直线度采样间距与测量误差的关系。在大多数的直线度测量中,人们所感兴趣的只有被测表面轮廓的极值点,即极大点和极小点,因为最终的直线度测量结果只取决于这些极值点的位置和大
《物业管理条例》已实施1年有余了,它是我国第一部关于物业管理的行政法规,标志着中国物业管理行业步入了法制化、规范化发展的新时期。但现实中的物业管理仍存在许多问题无法