论文部分内容阅读
随着GIS技术的不断发展和广泛应用,人们对空间数据的需求日益增加。为了满足人们不尽相同的各类需求,测绘各部门纷纷采集、生产了数量巨大、种类多样的空间数据,这些数据受采集时间、采集手段、采集人员和比例尺等因素的影响,在数据精度、空间位置、几何形状、属性信息等方面均存在较大差异,这使得“多源异构的空间数据管理利用”成为一大难题,其中尤以空间数据集成与融合、数据共享、数据更新、质量不佳等问题最为突出。同名实体匹配技术作为解决上述问题的关键技术之一,已成为国内外学者研究的热点,具有极大的研究意义和应用价值。线要素作为空间数据的主要类型,要素信息丰富、特征容易提取和描述,已成为同名实体匹配研究中最为活跃的研究方向,本文以线要素为研究对象,全面具体地总结了国内外发展研究现状,找出了已有研究存在的不足,提出了一种基于节点相似度的线要素匹配新方法。该方法基于空间相似性原理,以线要素特征点为主要研究对象,选取了拓扑特征和几何特征作为相似性评价指标,利用评价指标的相似度进行层层约束,最后通过计算同名节点的空间相似值来获取最优匹配。为实现上述方法,本文主要进行了以下几方面内容的研究:(1)阐述了论文的研究背景和意义,详细分析了线要素匹配的国内外研究现状,并总结了现有研究存在的不足,制定了本文的研究内容和技术路线。(2)以同名实体的空间相似性原理为客观前提,详细介绍了同名实体匹配技术,总结了线要素匹配常用的方法和策略,并分析了各自的优缺点,同时将复杂网络理论引入到线要素匹配中,提出了一种基于节点相似度的线要素匹配方法。(3)设计了线要素相似性匹配模型。针对不同尺度数据构成差异但拓扑结构相似、且线要素在交点处具有较强稳定性的特点,本文选取了线要素节点的度为主要特征、节点连线方向夹角、节点连线距离等几何特征在内的相似性指标,构建了基于线要素拓扑关系和几何特征的相似性匹配模型,通过节点相似度、方向相似度和位置相似度3个约束进行候选匹配集的逐步筛选,并对节点连线方向夹角和节点连线距离进行加权归一化,计算总的空间相似值,以获得最终的同名节点,完成了线要素的节点匹配。(4)基于该模型,设计了线要素匹配算法,并对匹配算法进行了优化。其中,采用双向匹配策略,有效解决了线要素匹配中多种复杂匹配情形,提高了匹配算法的正确率;在候选匹配集获取中,采用了缓冲区优化法用以快速获取候选匹配集,提高了匹配算法的效率。(5)设计并实现了基于节点相似度的线要素匹配原型系统。基于Windows环境,利用面向对象的编程方法和相关组件技术,搭建了一个C/S架构的线要素匹配实验系统,并以同尺度和多尺度两组道路网数据为实验对象,验证了本文提出的线要素匹配方法的可行性。实验表明,本文提出的基于节点相似度的线要素匹配方法切实可行,此外,该方法已成功应用于《地质调查专用基础地理数据精度控制软件研发》项目中,辅助实现了全国范围的1:25万公开版基础地理数据的位置校正,极大地提高了数据生产效率,具有较强的实用价值。