面向孔子世家谱的知识问答模型研究与应用

来源 :曲阜师范大学 | 被引量 : 0次 | 上传用户:myhome1202
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
我国是一个统一的多民族国家,悠久的历史积累下了很多光辉灿烂的优秀文化,家谱就是其中不可替代的一部分。家谱不仅记载了一个家族的兴衰成败,还反应了当时社会的历史文化背景,是一种具有独特功能的人文资料。孔子世家谱记载了以孔子为始祖的孔氏族人的世系繁衍信息,承载了中华儒家文化的精神与灵魂,因此,深入探索孔子世家谱内容的语义表示、语义推理及其应用具有至关重要的研究价值和现实意义。知识问答系统是融合结构化与非结构化的知识提取、表示、存储、检索,实现基于知识的语义分析与认知推理,并以简单对话模式解决用户认知、决策问题的智能平台。针对孔子世家谱问答系统,本文应用知识图谱、深度学习和图数据库等技术与架构,主要在知识图谱构建、知识问答模型设计和问答系统研发三个方面做了以下研究工作:(1)提出世家谱本体构造方法,构建基于本体的孔子世家谱知识图谱。首先,在分析孔子世家谱原始数据的基础上,提出改进的本体构造方法并构建初始的世家谱本体结构。然后,根据本体约束条件,为不同结构的文本数据制定针对性的信息抽取方法。最后,整合抽取的有效信息,并将之存储于Neo4j图数据库,为知识问答模型与系统的构建和应用奠定了知识基础。(2)提出融合深度学习与模板的知识问答模型,设计基于语义解析的世家谱知识问答策略。首先,为了减少用户等待时间,在语义解析模块中增加了问题判断子模块;其次,为了提高语义解析的准确率,提出引入预训练语言模型的ALBERT-Text CNN模型和ALBERT-BLSTM-CRF模型对问句分别进行问题判断和实体抽取。实验表明,与传统模型相比,问题判断和实体识别的准确率分别提高了1.34%和2.01%,知识问答模型的准确率达到了92%。(3)设计与开发了孔子世家谱问答系统。为了能够有效面向孔子世家谱知识图谱开展研究,广泛推广孔氏家谱文化和儒家文化,基于孔子世家谱知识图谱和知识问答模型实现了问答系统。该系统按照软件工程开发流程,在完成需求分析、系统设计的基础上,使用Flask作为开发框架,利用cytoscape.js库进行图谱的Web可视化,实现了面向孔子世家谱初集内容的可视化检索和知识问答功能。总之,孔子世家谱的知识图谱化为儒家文化的研究提供了新方法、新思路,基于知识图谱的问答系统为中华儒家文化的传承与弘扬探索了新形式、新途径。
其他文献
当今社会科技发展迅速,移动机器人在人类日常生活中扮演越来越重要角色,受到人们的广泛关注。移动机器人导航设计涉及环境感知、即时定位与建图(Simultaneous Localization and Mapping,SLAM)和路径规划等方面的研究。本文以机器人操作系统(Robot Operating System,ROS)作为开发平台,分别从SLAM与路径规划方面对移动机器人导航进行研究。在SLAM
2018年4月,教育部印发了《教育信息化2.0行动计划》,计划指出要在教育领域引入“平台+教育”的服务模式,同时智慧教育创新发展行动是该计划的重要举措之一,标志着教育领域已经着手开展“智慧化”建设。以此为风向标,高校对教育、科研进行信息化、数据化改革势在必行。高校是教学、科研的重要机构,高校图书馆作为高校的文化中心,应对师生教学以及科研工作提供有力的支持服务。在教育大数据视域下建设智慧服务模式是高
四旋翼目前在军用以及民用领域愈发普及,但由于其在飞行过程中容易受到外界干扰以及自身系统不确定性因素的原因,因此对四旋翼的扰动抑制研究具有重要意义。一方面四旋翼飞行器属于欠驱动系统,其六个自由度不能全部获得输入激励;另一方面,四旋翼飞行器还属于非线性、多变量、强耦合性和不确定性系统,因此对四旋翼飞行器控制器的研究具有重要意义。滑模控制是一种广泛应用在非线性领域的控制算法,通过设计滑模面,最终使误差收
带式输送机因其具有运输量大、运输距离长、持续性运输等优点,在港口煤炭运输行业成为了不可替代的运输工具。随着对煤炭需求量的逐渐增加,带式输送机将长时间高负荷生产工作,一旦设备发生故障,产生的经济损失将不可估量。目前基于带式输送机故障诊断主要是依靠人工巡检方式,该巡检方式因其工作量大、诊断效率低等缺点已不再适合当前生产现状。由于发现带式输送机在发生故障时产生的声音信号中包含了大量的故障信息,本文将通过
随着国内外老龄化程度的不断加深,老年人的健康问题得到广泛的关注。脑卒中作为发病率最高、危害较大的疾病,其后遗症所引起的上肢运动功能缺失的问题成为国内外研究的热点。目前,针对患者单侧上肢运动功能缺失的问题,一种方法是通过康复师辅助患者进行康复训练,但这种方法康复师的劳动强度过大;另一种方法是通过康复机器人进行辅助训练,但传统康复机器人只能带动患者进行单一、重复的运动训练,患者参与感低,人机交互能力差
随着人口老龄化的加剧,由于“脑卒中”等原因造成下肢运动障碍的患者逐渐增多,对患者本身造成不便的同时也增加了患者家庭和社会的负担。目前,使用下肢康复机器人对患者进行康复训练成为一种趋势,然而现有步态规划方法忽视了关节运动的协调性,所设计的步态轨迹会导致步行稳定性弱;一些不合理的控制器设计导致轨迹跟踪误差大,收敛速度慢,影响康复训练效果。为解决以上问题,提出一种基于莱维飞行粒子群算法的归一型步态规划法
随着科学技术的发展,人工智能开始逐渐深入我们生活的各个领域。为便于我国读者更好了解国外人工智能发展状况,相关翻译也成为一个重要手段。本实践报告的作者选取由Ronald Ashri所著的《人工智能工作场所》一书的三个章节作为翻译材料进行汉英翻译,并撰写了本翻译实践报告。书中详细介绍了人工智能的发展以及在工作场所中的应用,对于我国未来开发更加智能化的工作场所有一定的借鉴意义。本翻译实践报告首先对本翻译
运煤敞车的粘煤附着现象给煤矿的生产和运输带来了诸多不便,严重影响了煤炭企业、用煤企业的生产和效益,寻求一种安全高效、成本低廉、实时智能的方法来解决运煤敞车卸煤中的粘附问题成为煤炭运输行业亟待解决的关键问题。目前国内外对敞车卸煤存在的余煤残留问题主要的处理方式为人工清理或使用振动器进行清理,前者耗时耗力,清理效率很低;后者虽然能做到实时清理,但清理时噪音很大,且振动力量无法实时控制,容易对运煤车厢造
数字经济是指以数字化信息和知识为关键生产要素的广泛的经济活动。在新冠肺炎疫情肆虐的背景下,数字技术提高了现有产业的生产力,数字经济成为推动各国经济发展的重要动力。因此,需要为数字经济提供一套更为完善的治理体系来加快促进经济复苏和产业转型。译者选取了中国通信院于2019年12月发布的《数字经济治理白皮书(2019)》作为翻译任务的源文本,对其中三章进行翻译。所选部分全面概述了数字经济治理的现状和挑战
知识图谱是对实体间丰富关系的结构化信息编码,它旨在以三元组的形式将真实世界的事实组织成计算机可阅读的结构。其中三元组的具体表示形式为(h,r,t),h表示头实体,t表示尾实体,h和t之间的关系表示为r。可以看出,这种组织形式使知识图谱表现出严格的逻辑规则和分散的符号特征,在众多领域的应用中受到限制。为此人们提出了面向知识图谱的表示学习方法,将知识图谱中的每个元素(实体和关系)编码到一个连续的低维向