地理编码的研究与实现

来源 :中国地质大学(武汉) | 被引量 : 0次 | 上传用户:greenhight
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
地理编码是建立地理位置坐标与给定地址对应关系的过程。地理编码数据库主要记录了各类地址的标准名称、空间坐标的唯一编码,它是沟通抽象数据与真实空间的桥梁。 目前国内地理编码主要存在三个问题: (1)国内目前还没有针对地址数据内容方面的标准和规范,地址数据内容描述不统一,造成标准地址数据库难以构建,地理编码技术的应用还仅仅局限于专业领域和部门内部,难以推广和普及。 (2)由于中国地名命名方法复杂,缺乏统一的标准,因此,地理编码的地址模型的确定就没有统一的规范,从而限制了地理编码软件的开发和应用。 (3)由于国内现有地址系统的无序性和混乱性,地址分词的准确率不高,匹配结果的准确性不够理想。 本文针对以上问题,对当前的地理编码应用做了较深入分析、研究,提出了地址规范化和地址模型的解决方案,在对中文自动分词研究的基础上,实现了地理编码的地址分词。并根据以上思路实现了地理编码系统。具体包括: (1)对当前国内外地址规范化的现状进行了分析,提出地址规范化的解决方案。 (2)分析了地址模型的国内外现状,采用固定地址模型和组合地址模型结合使用的方式完成地理编码的需求。 (3)为了提高地址分词的准确率,分析了地址通名库和地址词库两种地理编码分词技术,在中文自动分词技术的基础上,建立了地址词库的四层词库结构。 (4)实现了基于文件版本的地理编码系统,设计并实现了地理编码数据库,完成单个和批量地址的定位功能。 (5)为了提高编码的效率,本系统中实现了地址标准库索引的构建和查询的算法,包括探测算法、中拼转换算法、二分算法、相似度算法。 本文以国家“863”项目——“面向网络海量空间信息的大型GIS”的研究中mapgis7.1版本的有关地理编码的需求为研究内容,文中程序代码直接来自试运行中的项目。
其他文献
机器翻详是自然语言处理中研究的一个重要课题。近年来统计机器翻译的研究占据了机器翻译研究的主流地位。而且统计机器翻译经历了从词到短语,从使用表层字符串信息到使用句法
移动Ad Hoc网络的移动、自组织、无中心、多跳广播传输等特性,使它更容易受到各种不同的攻击。而在移动Ad Hoc网络的一些特定应用领域(如战场),除通信内容容易被截获、窃取外
在EAST托卡马克装置中,极向场线圈电流的变化确定等离子体的位形、电流和平衡,线圈电流控制的好坏对放电结果有着重要的影响。极向场控制系统采用PID控制的方法,控制参数直接影
网络计算机/服务器计算模式是一种新兴的计算模式。它利用远程显示机制将交互式桌面应用的计算任务与图形用户界面进行了分离,将计算任务集中在服务器端完成,而客户端仅负责处
为了提高移动终端的能量使用效率,支持无线宽带城域网的IEEE802.16e标准提出了三种休眠模式。本文基于现代网络中的UGS(Unsolicited Grant Service)和RT-VR(Real-Time Variabl
城市大数据是在城市管理、生活、建设、发展等过程中,由物理世界、信息空间和人类社会三元空间所产生的多源、多模态、异构海量数据。这些数据是人类活动、城市发展的忠实记录
近年来,为了加快钢铁行业的信息化进程,许多钢铁行业以先进的数据库技术、网络技术、计算机技术、管理信息系统等IT技术,投资建设了各种专业性管理信息系统,为钢铁各级部门提供了
随着经济的发展与人们收入水平的提高,越来越多的人希望进行投资金融产品。金融市场的活跃使得原先人工交易方式,特别是短线交易已经渐渐不能适应市场的发展趋势,程序化交易越来
由于HTTP天生的无状态性质,Web程序设计中产生了这样一个问题:在两个连续的用户交互之间会遗忘状态信息。一个交互性的Web应用程序由一组脚本构成,每个交互都包含两个脚本,一个脚
作为远程教育中极有发展前景以及最具代表性的一种学习模式,协作学习正在受到越来越广泛的重视,发展前景令人期待。但在发展过程中,协作学习面临着一些亟待解决的问题:学生缺乏在