基于Elasticsearch的地名和POI数据检索系统的设计与实现

来源 :西安电子科技大学 | 被引量 : 0次 | 上传用户:worthylifelv
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在大数据时代的背景下,人们对数据挖掘、数据分析和数据检索愈加重视。地名信息数据在移动互联网的助推下,具有特殊战略地位。从国家层面,地名信息是国家地理信息化建设的重要组成部分;从民生层面,随着移动互联网和全球定位系统持续升温,基于位置的服务技术在各行各业广泛应用。如今人们追求更加智能精准的、具有地理范围限制的结果。因此,如何有效结合传统搜索和地名信息检索显得格外重要。地名信息存储的传统方式采用关系型数据库,该方式存在很多弊端,如不支持海量数据存储,表模式缺乏灵活扩展性,提供的检索方式单一,针对关键字只支持模糊查询,匹配效率低下,不支持空间位置检索等,无法满足人们对地名检索的需求。新兴的NoSQL数据库HBase,具有分布式、高性能、存储模式灵活、支持海量存储等优点,可以解决地名数据的存储问题,但是HBase提供的检索服务单一、只有主键索引,本身不提供二级索引,且没有提供对空间数据存储和管理的直接支持。针对上述问题,本文基于HBase和Elasticsearch等核心技术设计实现了基于Web的地名和POI数据检索系统。该系统实现了关键字搜索、兴趣点类型搜索、自我推荐、范围搜索、区域搜索和组合查询等功能,具有快速检索、查询多样化的优点。本论文的主要工作如下:(1)研究地名数据和POI数据的结构特点。针对其非结构化、内含空间位置属性等特点,以NoSQL数据库HBase作为存储层,设计了一种适合地名数据检索和处理的HBase表模式。(2)研究基于HBase的二级索引方案,通过对比其优缺点,提出本文的构想方案,利用全文搜索引擎Elasticsearch为HBase建立二级索引,实现数据与索引分离。借助Elasticsearch提供的强大检索服务,为用户提供高效的检索效率和多样化的查询服务。同时,利用HBase的协处理机制,实现数据与索引的同步。(3)研究基于Lucene的全文搜索引擎Elasticsearch,分析其整体框架、运行机制、原理以及应用。部署ES集群,编译安装辅助插件,对集群进行监控、调度以及调参优化。最后,在单机和集群上部署该服务系统,基于500万条全国地名和126万条西安市POI数据,对系统进行服务器端和客户端的功能测试,并用测试工具模拟生成环境对系统进行性能测试。实验结果显示,该系统提供多样化的查询服务和毫秒级别的检索响应时间。同时,该系统具有良好的扩展性和较高的吞吐率。
其他文献
背景:自体外周血干细胞移植联合髓芯减压与单纯髓芯减压治疗系统性红斑狼疮合并股骨头缺血坏死的疗效是否不同,相关报道较少。目的:观察自体外周血干细胞移植联合髓芯减压治
背景:纳米羟基磷灰石在骨修复替代材料中有明显优势,但骨诱导活性低、力学性能差等缺陷限制了其临床应用。为克服弊端,国内外学者从仿生学等角度出发,以纳米羟基磷灰石为基础
在1991年以来的17年间,索马里几乎从未间断过内战,这种游离于无政府状态下的国内秩序无疑是滋生海盗团伙的温床。索马里海盗仅仅在2008年就制造了近40起劫持外国船只事件,收
企业征信机构与信贷市场评级机构作为征信市场的主体,在业务拓展与机构管理方面,存在较多相似之处。在信贷领域,征信机构和评级机构功能及定位趋同,但评级机构未能与市场需求紧密
风格学、修辞学、情感研究,以及文体学,这四个术语指称的学科,研究的范畴非常相近,在学术著作与普通文字中有相当大的重叠,在很多人的用法中四者几乎是同义词。通过研究可以发现,提
移动医疗是医疗服务和互联网的深度融合。本文调查广西区内医院常用的随访方式,分析广西的三级甲等医院患者服务和患者满意度信息化情况,并借助"健康广西"政策导向以及2016年
目的研究在恶性肿瘤放化疗患者中自我效能干预对癌痛及生活质量的应用效果。方法在河南省人民医院收治的所有恶性肿瘤放化疗患者中(2017年9月—2018年9月)选出78例作为此次研
目的了解我国基层医疗机构中医药服务的开展情况。方法通过对《中国卫生和计划生育统计年鉴》和《全国中医药统计摘编》的回顾,收集和整理2010-2016年相关基层中医药服务的数
近年来随着我国经济与技术的发展,国内对于电力的需求越来越大,因此促进供电系统的安全稳定便越来越受到行业的重视。对于大型的光伏电站来说,其输电端并网时,会影响电网的潮
<正>吉林地区中药材资源丰富,为中药材产业发展奠定了基础。目前,主要栽培品种有平贝母、桔梗、黄芪、龙胆草、五味子、人参等20余种。现就吉林地区中药产业发展现状及发展策