【摘 要】
:
在互联网与大数据的环境下,搜索引擎逐步成为人们认识世界的主要途径。但是随着旅游领域数据的不断激增,游客通常需要花费大量时间和精力进行多次筛选才能获得所需信息,因此提供一个完备的、可以帮助用户迅速准确地了解景点信息的系统是非常有意义的。知识图谱可以大幅度提高搜索引擎效率,故本文针对河北省旅游行业的需求,通过整合多源异构数据构建了旅游景点知识图谱,且在此基础上设计并实现了基于知识图谱的景点信息可视化系
论文部分内容阅读
在互联网与大数据的环境下,搜索引擎逐步成为人们认识世界的主要途径。但是随着旅游领域数据的不断激增,游客通常需要花费大量时间和精力进行多次筛选才能获得所需信息,因此提供一个完备的、可以帮助用户迅速准确地了解景点信息的系统是非常有意义的。知识图谱可以大幅度提高搜索引擎效率,故本文针对河北省旅游行业的需求,通过整合多源异构数据构建了旅游景点知识图谱,且在此基础上设计并实现了基于知识图谱的景点信息可视化系统。主要工作包含以下方面:(1)语料的获取及预处理。首先对相关网站进行分析对比,确定语料的来源网站;然后将Phantom JS和Selenium结合搭建爬虫框架并通过该框架实现初始语料的爬取;最后利用NLPIR工具实现初始语料的中文分词、词性标注等预处理工作。(2)河北省旅游景点知识图谱的构建研究。首先通过训练Bi-LSMT-CRF命名实体识别模型和SVM关系预测模型实现景点属性和属性关系的抽取工作;然后利用Levenshtein距离算法和Word2vec模型通过计算属性的相似度将属性进行融合,通过学习排序法和多值合并法进行属性值的融合;又依据河北省旅游景点的实际特点制定改进的本体构建方法,即:将循环思想融入七步法,增加迭代更新过程。并根据改进的七步法,在Protégé本体编辑软件实现本体的构建;最后将所有知识导入Neo4j图数据库进行存储,完成旅游景点知识图谱的构建。(3)旅游景点知识图谱的应用。本文基于构建的知识图谱设计实现了一个集景点信息管理、景点信息搜索和搜索结果可视化为一体的应用系统。系统直接与图数据库进行连接,可以迅速高效的完成景点信息搜索和对景点信息的增删改查操作;并通过D3技术实现了将知识图谱中的景点信息全面直观的向用户可视化展示。本研究有助于用户更高效快捷地搜索信息、并直观简洁地了解景点,进而促进河北省旅游业的发展,还有助于领域知识图谱构建工作的进一步研究。
其他文献
信息安全是当今时代的主旋律,国际上在信息安全领域,美国一直处于领先地位以及集成电路IP知识产权的垄断地位,2018、2019与2020年的“中兴”、“华为”事件,再次让全世界关注到在芯片处理器等信息安全领域。随着加州大学伯克利分校对RISC-V指令集的开源,一个降低门槛的精简指令集的CPU设计,势必会在5G高速通信领域、AI(人工智能)、工业机器人、IOT(物联网)、智能自动化、甚至国防等领域大面
工业机器人是面向工业领域的多关节机械手或多自由度的机器人,主要从事于焊接、搬运、码垛等工作,广泛的应用于汽车、电子、石油、化学等行业,同时也是衡量一个国家制造也水
历史“周期率”是历史学家对人类历史发展进程中一种客观历史现象的描述和概括。对于无产阶级政党来说,所谓跳出历史“周期率”的问题,从实质上说,就是执政后如何防止腐化变
科技园推动着城市经济的发展,体现着城市的精神面貌。本文基于场所精神的理念,以科技园中心绿地场所精神的体现作为着重点,打造特色鲜明的科技园景观。以保定东润科技园为例,
以硅通孔(TSV)技术为核心的三维封装集成是半导体产业的研发热点之一,特别是硅通孔转接板技术的出现,为实现低成本、低功耗、高性能、高密度、小尺寸芯片系统封装集成提供了解决方案。有机聚合物介质例如聚酰亚胺等,具有绝缘性能好、过程简单、工艺难度低、台阶覆盖性好等优点,可作为硅转接板上再分布线的绝缘介质层。但是有机介质存在热导率低、热膨胀系数大、机械强度不足、易溶胀等问题,可能造成硅转接板散热不佳、产生
在国际国内环境和条件发生重大变化的形势下,影响中国共产党的执政合法性和执政地位的因素尽管纷繁复杂,但有四个方面具有决定性的作用。思想整合功能的发挥和提高,执政绩效
锂离子电池(LIBs)因其较高的功率和能量密度已成功应用于较多储能设备中。但是,他们的性能远远不能令人满意。大多数的商用LIBs使用理论容量较低的石墨(~360 mAh g-1)作为负极
磴口县荒漠化治理产业的良好发展,推动着地区的社会经济稳定,本文主要采用SWOT分析法、熵权法、因子分析法、生态足迹与生态承载力分析法,对磴口县荒漠化治理产业业态和地区
本文通过介绍西方心理学的弊端和中西文化的巨大差异,提出发展中国本土心理学是中国心理学发展的必然趋势和唯一出路。而发展中国本土心理学必须重视中国传统文化的研究,中医
目的探讨β2m-Linker-HLA A2蛋白和能被HLA A2识别提呈的Melan A短肽(ELAGIGILTV)联合刺激,能否诱导表达Melan A抗原肽特异性TCR(Melan A-specific TCR)的CD8+Jurkat细胞的活化,