论文部分内容阅读
地理编码是将地理坐标(例如经纬度)赋予街道地址、点位和地理特征的过程。国外的地理编码研究从二十世纪70年代开始起步,至今已在很多的领域得到了广泛引用,为其经济社会的建设做出了相当的贡献。我国的地理编码研究起步较晚,目前的主要问题是缺乏一个标准的地理编码数据库。
北京大学数字地球工作室通过对北京市的地址进行研究,得出结论认为北京市的地址模型是一个复杂的层次模型,并且在该模型的基础上使用非关键字高效字符串匹配算法得到了北京市的地址要素词典,但是该地址要素词典在实际的应用当中要结合另外一个标准的地址树模型来使用,所以并没有能够解决我国地理编码缺乏标准地址模型的问题。
本文中我们在北京大学数字地球工作室研究的基础上,提出了地址关键字(词)和地址标点符号的概念,利用统计学的方法和原理,通过计算机程序的实现,成功建立了北京市的标准地址模型,并且对地址匹配的过程方法提出了一些见解。