基于知识图谱的广西旅游问答系统研究和实现

来源 :桂林理工大学 | 被引量 : 0次 | 上传用户:tb881011
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着互联网时代的飞速发展,生活质量也越来越高,对于旅游需求也日益增强。以旅游业来说,国家在“互联网+旅游”模式上投入了大量的资金,将前沿技术与旅游发展结合起来的策略,已经成为我国旅游业发展的不可缺少的部分。过去,人们通过搜索引擎输入相关的旅游问题后,返回的结果都是一些网页,并没有返回很准确直观的答案。现在,基于知识图谱的问答系统的出现,直接反馈给用户准确简洁的答案,能够让游客减少时间浪费,还可以提高检索的效率,弥补了以往搜索引擎的缺陷。本文以广西旅游为例,构建旅游问答系统,针对游客提出的相关问题予以回答。本文对构建广西知识图谱、问句分类和答案生成等进行了详细的研究。并且通过将自然语言所运用到的相关技术与知识图谱进行结合,实现了一个可满足游客问答需求的广西旅游问答系统。本文的主要工作包括如下几个方面:(1)考虑到从单个网站获取数据存在信息不全的情况,本文利用爬虫工具从百度百科、携程网、途牛网等多个数据源上获取数据。根据抓取到的数据经过处理后导入到Neo4j中,构建了基于广西旅游知识图谱。(2)为了解决翻译模型中的随机生成负样本的不足,以生成高质量的负样本,提高模型的训练效果,提出了一种改进的负样本采样的知识表示学习模型Trans E-KCB。该模型首先引入K-Means++聚类算法,形成不同种类的相似性实体簇,然后,在簇中随机挑选5个实体与被替换实体计算它们之间的相似度,选出排名最高的实体,与被替换的实体进行替换;最后,在此基础上,为了解决“假负例”问题,引入布隆过滤器,对“假负例”进行过滤。实验结果表明,与Trans E等模型相比较,Trans E-KCB模型具有更好的模型表达能力,知识表示的能力有了进一步提升,并利用Trans E-KCB算法对广西旅游知识图谱数据集进行嵌入式表示。(3)首先对现有的问句分类相关体系进行了分析,然后根据问答集知识库的问句特点,对问句分类进行了更为特殊的划分。同时根据知识图谱集中的关系构建了相关的问句分类。在分类算法上,使用朴素贝叶斯算法进行分类。通过问句分类,更快的将问句分配到问答集知识库中的问句上,也更容易匹配到查询语言Cypher上,提高查询的速度。(4)在广西旅游知识图谱基础上,实现了基于知识图谱的问答系统。将传统的问答系统和Trans E-KCB结合起来,使得系统具有更强的推理能力,从而使得问答系统具有智能性。
其他文献
木聚糖及其衍生物在材料领域的研究已经有了较高程度的发展,但是在食品、保健品和药物方面的研究和应用尚待发掘。本文采用络合锌和羧甲基化方法修饰木聚糖(XY),制备了木聚糖锌(XY-Zn)、羧甲基木聚糖(CXY)和羧甲基木聚糖锌(CXY-Zn)。研究了它们的结构和性质以及体外、体内益生作用。成分分析结果表明,XY的总糖、糖醛酸和蛋白质含量分别为87.70%、4.32%和1.49%。原子吸收光谱表明XY和
学位
为了探究γ-氨基丁酸(γ-aminobutyric acid,GABA)处理对双孢蘑菇(Agaricus bisporus)采后褐变的调控作用,研究了5.0 mmol·L-1GABA溶液浸泡处理5 min对双孢蘑菇(AS2797)冷藏(4±1℃)过程中外观品质、酶促褐变、GABA代谢等生理生化变化的影响,并从基因水平揭示GABA处理对双孢蘑菇酶促褐变的调控机理。主要结果如下:1、GABA处理能够较
学位
近年来,人们对位置服务(Location Based Services,LBS)又称定位服务的需求呈增长态势。特别地,消防紧急救援、大型商场、地下停车场等面向室内的定位服务更是有着极大的需求。因此,室内定位引起了人们的广泛关注,并发展了多种室内定位技术,如WIFI定位、蓝牙定位、超宽带定位、超声波定位、惯性导航定位等。其中,基于智能手机的惯性导航定位,仅利用其内置传感器的数据,进行行人航迹推算(P
学位
近年来,随着世界各国能源危机的出现,科学家们逐渐把目光投到可再生新能源上。相对于已经商业化的硅基太阳能电池,具有很强互补性的有机太阳能电池(OSCs)逐渐受到学术界的广泛关注。相对于富勒烯衍生物电子受体材料,非富勒烯小分子受体材料发展迅速,归因于分子设计多样,合成方法简便,以及薄膜形貌易调控等。随着一系列窄带隙明星分子材料ITIC,IDIC,IT-4F,COi8DFIC,Y6的成功开发,OSCs的
学位
随着全球经济的快速发展,由于化石燃料的大量使用,环境污染问题日益严重,人们对发展高效、清洁、可持续能源以及电化学能量存储与转换装置的需求在快速增加。超级电容器由于其充放电速度快、功率密度高、循环寿命长、绿色环保的优点,而被广泛研究。基于电池型电极材料和赝电容型电极材料的混合超级电容器相较于传统的超级电容器拥有能量密度高的优点。本论文设计了四种不同的超级电容器电极,并将它们耦合成两种储能机制不同的混
学位
光气被广泛应用于各个领域,但光气会导致人体各种机体功能受损甚至死亡。肼(N2H4)是一种无色的油性液体,由于N2H4的高毒性和高用量,N2H4已经对环境安全和人类健康造成了巨大的危害。HSO3-是一种常见的阴离子,虽然HSO3-对人体生理过程具有重要作用,但过量的HSO3-会危害环境安全和生物健康。因此,实现光气、肼、HSO3-的检测具有巨大的价值。在众多的分析检测方法中,光学探针技术成本低,易操
学位
随着工业的发展和资源的开采,重金属污染越来越严重。由于重金属离子难以被生物降解,它们会在人体内蓄积,对人体健康造成严重威胁。纳米材料增强的适配体生物传感方法被广泛用于重金属离子的检测。然而,传统方法在不同程度上依然存在分析时间冗长、操作复杂、灵敏度较低、仪器昂贵且缺乏便携性等带共性科学问题。针对这些问题,本论文以二价汞离子(Hg2+)和二价铅离子(Pb2+)为模型分析物,着重利用金纳米颗粒(Au
学位
高分辨率图像可以承载更多的信息量和提升用户的主观视觉感受。受限于成像时的环境干扰、成像设备更迭的成本消耗、图像传输带宽损耗和本地存储的硬件限制等客观条件,人们对于使用软件技术提升图像分辨率,即图像超分辨率(Super-resolution,SR)重建技术的关注与研究日渐提升。SR技术克服了诸多硬件获取高分辨率图像的限制,在医疗影像、城市安防、气象检测和影视娱乐等方面都有着广泛的应用。深度学习在近几
学位
在航空器的运营过程中,后勤维护是飞机安全运营的重要环节,直接关系到飞机的飞行安全和航空公司的运营成本。现代飞行器是一个涉及到多学科的交叉领域,其维护过程的复杂程度比较高,对维护人员和辅助的维护系统都提出了较高的要求。随着市场的发展,航空部门在保障安全的前提下,需要做到对维护任务的快速反应。传统的维护方案一般是基于以可靠性为中心的方法制定维护大纲,但是基于该方法制定的大纲存在缺省处理缺失、故障模式不
学位
准确地获取陶瓷材料显微结构中的晶粒形状、分布等信息对进一步认识和研究陶瓷材料的性能至关重要。利用陶瓷晶粒扫描电子显微镜(Scanning Electron Microscope,SEM)图像对晶粒的形状、分布和数量等进行分析是提高陶瓷材料性能的重要手段。较为准确的陶瓷晶粒图像分割是提高晶粒分析质量的关键。传统的基于深度卷积神经网络(Convolutional Neural Network,CNN)
学位