基于混合聚类的空间索引算法研究及应用

来源 :河南大学 | 被引量 : 0次 | 上传用户:xu9865
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着Internet技术和GIS(Geographical Information System,地理信息系统)技术的发展,WebGIS成为GIS领域研究的热点。利用网络技术,依托空间数据库,通过与浏览器的交互,WebGIS使不同地区的客户端实现图形及属性数据的查询与检索。由于空间数据本身的复杂性和海量性,实现对海量空间数据快速查询必须使用索引技术,选择高效的索引技术是提高空间数据库和GIS性能的重要方法。R树的生成过程是个典型的空间聚类问题,利用混合聚类算法将相邻或相近的对象聚集在一起,将聚类后的数据使用Hilbert分形曲线进行线性排序,在此基础上生成Hilbert R树。根据这个思路,提出了一种基于混合聚类的高性能空间索引算法。实验证明,该算法虽然增加了存储开销,但是缩短了在空间数据库上执行空间查询的响应时间,明显加快了搜索速度,改善了查询性能。论文的主要内容如下:1.详细分析了R树和R树改进算法的结构,构造原理和查询过程,重点研究插入新的空间对象导致的结点分裂算法,以及分析了它们的适用范围和存在的问题;2.分析K-means聚类技术的缺陷,对经典的算法进行了部分扩充和改进,提出了面向Hilbert R树的混合聚类算法;3.提出对空间对象聚集的区域和稀疏的区域分别处理;4.将混合聚类技术引入R树的生成过程中,提出一种基于混合聚类的空间索引算法。在R树的生成过程中,采用混合聚类的思想对空间对象进行预处理,将相邻或相近的对象聚集在一起组成R-树的结点。它能获得比一般R树更小的结点覆盖区域,具有更高的检索效率以及与R树相差无几的建树时间,最后给出基于混合聚类的空间索引算法流程;5.实现基于混合聚类的空间索引,并给出实验数据和分析,并将研究成果应用于东莞市水资源管理系统中。
其他文献
索引是数据仓库查询优化的重要技术,主要包括树形索引和位图索引。其中位图索引因为其结构简单,并且硬件支持二进制位运算效率很高,被广泛应用在数据仓库中。在属性的基数(该
企业联盟一般是两个或两个以上有对等经营实力的企业,各自贡献出企业价值链优势环节,实现资源共享、知识的双向或多向流动、优势互补、风险共担等战略目标,而自愿达成的一种能使联盟伙伴共同受益的长期联盟方式。在企业联盟中,企业为了应对日趋激烈的全球化竞争,开始整合产品、技术、市场等资源,与相近或互补的其他企业组成各种联盟,如技术研发联盟、市场销售联盟等,将技术专利、市场营销网络、产品知识、商情、经验等各类信
在当今信息时代,通信、计算机和网络技术的快速发展让我们能捕获和存储大量的数据,导致数据出现了爆炸性增长。在这些数据中寻找模式、趋势和异常之处,并且以简单的数量模型
随着生产和自动化水平的不断提高,电机优化设计被广泛地应用到电机产品设计中。电机的优化设计是指从预定目标出发,在满足约束的前提下,根据电机的数学模型,并借助最优化方法来得
单核苷酸多态性(SNP)是人类基因组中普遍存在的一种分子标记,主要是指在基因组水平上由单个核苷酸的变异所引起的DNA序列多态性。做为一种新的遗传标记,SNP对于疾病的预测、诊
随着智能电网与能源互联网的发展建设,电力系统规模不断扩大,电力数据以惊人的速度、多样化结构迅猛增长,这些复杂的数据来源于智能电表、配电自动化、数字保护装置等,以及在
在软件测试的过程中,自动生成测试用例是软件测试的关键和难点。目前,虽然有一些自动生成测试用例的方法被提出并使用,但由于其局限性,在实际中还没有完善的解决方法,只能凭
Web服务由于其良好的异构性,能解决不同系统的数据的交互与重组,自问世之始,就受到了学术界和工业界的欢迎,成为了人们研究的热点。但由服务提供者发布的服务的功能是特定的,
科学技术的日新月异,带来了信息的飞速膨胀。人们无时无刻不被包围在信息的海洋之中。如何对这些复杂的信息进行有效管理成为影响个人生活秩序和生活质量的重要因素。数据空间
随着网络的普及和对人们日常生活的影响的不断深入,富于交互性、开放性、即时性的BBS论坛逐渐吸引了大批的网络用户,而且还呈现不断增长的趋势。作为一种互联网交互的重要形式,
学位