中文地址编码关键技术的研究

来源 :南京师范大学 | 被引量 : 0次 | 上传用户:zsj1502
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
地址编码是联系空间地理信息与非空间地理信息的桥梁,是各种应用地理信息系统中必不可少的环节,也是数字城市的基础性组成部分。然而,由于中文地址自身的诸多原因,使得中文地址编码存在很多难点问题,以至于国外在地址编码方面的许多成熟技术不能直接应用于中文地址编码。本文在总结了国内外地址编码的相关研究进展的基础上,从地址规范化表达、地址解析、地址模型的构建、地址匹配等几个部分对地址编码的相关技术进行了研究,探讨相应的解决方案,设计原型系统并将其应用到相关的案例中,主要研究内容如下:   (1)中文地址规范化表达:分析中文地址的组成要素,研究不同概念粒度层次的地址要素类型及其等级关系,制定标注规范;提取地址通名,并按照地址要素分类体系对地址通名进行归类。   (2)中文地址解析:在确定中文地址要素分类体系的基础上,从规则和机器学习两个方面出发,设计了基于规则的地址解析算法流程和基于条件随机场的地址解析方法,实现了基于规则的地址解析与基于条件随机场的地址解析。实验证明两者的解析正确率分别达到93.6%与95.7%,符合大规模处理数据的要求。   (3)中文地址模型的自动化构建:在分析人工归纳地址模式优缺点的基础上,从地址要素间的二元关系出发,将数据挖掘中关联规则的方法首次运用到了地址模型的挖掘中,实现了基于关联规则挖掘的地址模型自动构建,对模型进行可视化显示,并探讨其在地址标准化方面的应用。   (4)中文地址匹配:在分析字符匹配相关算法的基础上,根据地址匹配的特点,设计了地址匹配的算法,实现了地址匹配的智能化。并在此基础上,设计了地址定位的相关策略,实现了地址的匹配定位。
其他文献
在信息工作中,我们注重在工作方法上继承创新,主要采取了以下5种方法来提高信息的实效。一是重点筛选法:即对每天收集到的大量信息,以“保证中心,突出重点”为原则,筛选出重
面对社会主义市场经济新形势,各级党委办公厅(室)如何围绕中心,争创一流,努力开创工作新局面,以崭新的面貌跨入21世纪,是目前所面临的一个重要课题。一、围绕服务党委科学决
请下载后查看,本文暂不支持在线获取查看简介。 Please download to view, this article does not support online access to view profile.
期刊
从土地综合承载力的角度研究区域耕地资源、空间资源、生态资源问题,是当今生态学、地理学等学科研究的主流之一。地理信息系统(GIS)、系统动力学(SD)等定量研究方法与新技术手段
准确的作物生长和产量品质动态监测预测对于保障粮食安全、促进农业可持续发展具有非常重要的意义。作物模型是作物生长及产量品质预测的强有力工具,然而作物模型由单点模式发展而来,在区域应用上由于区域分异、田块分异等导致作物模型运行要求的输入参数和初始条件难以获取,从而使作物模型的应用受到很大的限制,而遥感的引入将使这个问题得到有效解决。将遥感信息和作物模型相结合,利用遥感信息反演得到的状态变量优化作物模拟
土地适宜性评价就是评定土地对于某种用途是否适宜以及适宜的程度,它是进行土地利用决策,确定土地利用方向的基本依据,是近20年来土地资源研究的主要内容。农用地适宜性是土地适
含有三个未知数,并且每个含未知数的项的次数都是一次,一般来说含有三个方程(有时会有特例,但是所有的三元一次方程组都有三个未知数),这样的方程组叫做三元一次方程组 .解三元一次方程组,通常通过加减消元法或代入消元法先把三元一次方程组转化为二元一次方程组,进而再解出二元一次方程组,然后代入其中一个三元一次方程,最后得出三元一次方程组的解.但对于某些特殊的三元一次方程组,我们不能通过这种方法解出方程组的
为搞好兵团部、委、办、局的“三讲”教育,兵团党委“三讲”领导小组共组织了10个巡视组,并请一批党性强、思想政治水平高,经验丰富的老同志担任组长。这些同志以满腔的热忱,
我们正处在世纪之交的重要历史时期,在迈向新世纪的征途上,各级党委将根据党中央的总体部署,针对经济和社会发展过程中出现的新情况、新问题,不断对各项工作作出具体决策,提
时下网络盛行,电脑、平板、手机让我们的双手解放出来,短短几十年的时间曾经科幻电影和小说出现的镜头和情节变成了今天的现实。手机APP(应用软件)更是让手指执笔书写的功能