论文部分内容阅读
空间地址提供一种关于人、构筑物及其他空间物体的定位实现,是用来唯一标识特定兴趣点、存取和投递到特定地点及基于地点定位地理数据的一种实现,具有地名的某一特定空间位置上自然或人文地理实体位置的结构化描述。 随着地理信息技术的广泛应用,智慧城市、物联网、地理信息云、Hadoop大数据等新概念新技术的不断涌现,跨部门、跨行业、整个城市基于可视化的资源整合服务共享的需求越来越迫切,而基于空间位置(空间地址)的可视化与共享正是资源整合共享的基础。标准化的空间位置能够提供一种更为规范的地址描述与精度更高的定位实现,是实现资源集成共享与智慧城市的基石。 但国内外对空间地址标准化的研究尚存在不足,无法满足当今的资源整合共享与智慧城市对地址标准化的要求。本文正是针对资源整合共享与智慧城市的核心问题,基于大数据处理、空间数据挖掘、动态地址建模、混合地理编码等关键技术,提出了一套标准化空间地址的技术与方法,实现了地理信息大数据快速处理、空间地址自动挖掘、标准地址动态建模、空间地址全覆盖、智能地理编码、正反向精准匹配应用等目标,大大降低了空间地址采集、社会经济数据、行业信息可视化成本,为部门、行业、智慧城市可视化资源整合共享提供了基础数据支撑和关键技术保障。主要研究内容与结论如下: (1)动态地址模型:在借鉴国家与行业分类标准基础上,对地址要素分类进行完善;在地址分类的基础上,通过统计方法分析地址要素的层级挂接关系,构建了一个适用范围广的动态地址模型,解决了地名描述要素和结构的规范化表达问题。 (2)混合地址编码:针对空间地址具有描述名称多样性与空间位置唯一性的特点,基于双重独立式编码方案与动态地址模型,融合传统的格网编码、随机无意义唯一码与地址描述编码三种编码方式,探索出一套混合地址编码方式,解决各传统编码方式的弊端,提供完善的标准编码体系。 (3)空间标准地址库:根据本文提出的动态地址模型与混合编码技术,为了实现动态地址模型中各层级地址要素的复杂挂接关系与混合地址编码,本文以广东省的地址数据为例,给出了空间标准地址库的设计方案。 (4)地址匹配算法:在借鉴传统分词算法的基础上,建立通名词库与字典词库,将基于通名词库的拆分算法、基于字典词库的分词算法相结合作为提高检索效率的预处理算法,并联合字符匹配算法(打靶算法与编辑距离算法组成)共同组成了本文的地址匹配算法。以广东省韶关市两区(浈江区与武江区)数据为例进行实验,对地址匹配算法进行定性与定量的评价。