网络POI数据增量更新技术研究

来源 :兰州交通大学 | 被引量 : 9次 | 上传用户:hetongzhixia
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
伴随着以位置服务为核心的“信息时代”的到来,位置服务成为学术界和产业界的研究热点;与此同时,位置服务的内容与模式正在产生深刻变化。利用互联网改变传统位置服务数据的更新模式已成为本学科发展的重要趋势,位置服务数据的更新技术也成为各大商家竞相争夺的技术阵地。位置服务中最重要的组成部分是兴趣点(POI),POI数据的现势性直接关系到位置服务的质量。互联网中存在大量的POI数据资源,因此利用互联网更新POI数据是一种切实可行的方法。但是,互联网中的POI存在结构多样化、类型繁杂、有效信息缺失等问题,给数据的更新带来很大的困难。有效地更新POI数据库,实现多源POI信息的在线获取、地址标准化以及匹配更新,可以满足公众对位置服务的多样化要求。这不仅为推动我国位置服务进入内容丰富、服务精准和便捷高效的新阶段提供了技术支持,也促进“信息时代”整体服务水平。针对网络POI数据增量的更新问题,研究内容主要包括以下几方面:(1)网络POI数据采集与预处理。在网页数据获取技术的基础上,从通用网络爬虫入手,通过分析垂直网页和各类地图服务应用的结构特点,设计了网络爬虫算法,对网络上的POI数据进行爬取。同时,对爬取下来的数据进行预处理,去除格式、内容有问题的数据,并对数据进行单元网格的划分,选取一定数量的控制点和检验点,纠正来源于不同网页数据的坐标,使其具有同一坐标系。(2)基于空间约束关系的POI地址标准化方法。为了提高POI数据增量更新时同名实体识别的准确性,需要首先对地址进行标准化处理,使新增的地址与已有POI数据的地址具有相同的数据结构。本文提出一种基于空间约束关系的地名地址标准化方法。通过分析POI作为点状地物与其他地物的空间约束关系,从而选取特定的参考地物对待标准化的数据进行地址标准化处理。(3)基于加权的多属性相似度匹配更新方法。针对地址标准化处理后的POI数据,本文提出一种加权的多属性相似度匹配方法,分析POI数据名称、地址、经纬度的匹配算法,计算相似度并分配权重,过滤掉相似度高的数据,将剩余数据更新至数据库,最终实现网络POI数据增量更新。实验结果表明,本文提出的地址标准化方法具有较高的地址标准化准确率,同时,基于加权的多属性相似度POI匹配方法也可以有效地完成POI数据增量的更新。
其他文献
分析了螯合树脂塔的再生周期和影响再生周期的因素,通过计算和再生经济分析,找到树脂塔的最佳再生周期,降低了生产成本,减少了环境污染。
利用多截面场-路耦合时步有限元计算感应电机损耗时,时空离散策略包括时间步长、斜槽分段数及剖分密度。上述参数的选择是否合理,会影响损耗计算精度及计算时间。针对上述问
自音乐产生以来,人们便用音乐来表达思想和情感。尤其是在声乐的演唱的过程中,情感的运用也体现了出了声乐演唱者的水平。民族声乐作为中国音乐历史上最值得标榜的、最典型的
以"课岗证对接"理念为引领,旨在解决"培养什么样的人"、"怎样培养人"、"谁来培养人"这些专业建设中的问题。通过对旅游行业深度调研,构建"课岗证对接"课程体系,在"课岗证对接
主要分析人防工程智能化系统结构,详细阐述人防工程设备自动化和智能化系统的工作内容、现场控制及系统集成。
目的:观察消食和胃冲剂对胃肠运动障碍小鼠胃肠动力的作用。方法:以L-精氨酸制造胃肠运动障碍小鼠模型,采用营养性半固体糊灌胃法观察服用莫沙必利﹑消食和胃冲剂前后模型小鼠
目的 :研究白花蛇舌草中β-谷甾醇的最佳提取工艺。 方法 :用 4种方法测定不同提取工艺所得的白花蛇舌草中β-谷甾醇含量。 结果 :以氯仿为溶剂索氏加热回流提取效率最高 ,超