医疗知识图谱构建和智能问答研究

来源 :吉林大学 | 被引量 : 0次 | 上传用户:apenggejiayou
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着时代的进步,科技的发展,科技正在逐步改变我们的生活。如今,机器学习和深度学习等人工智能技术正在不断更新并且迅速发展。表示实体之间结构关系的知识图谱和能够准确、快速地获取信息并给出答案的智能问答系统已成为人工智能越来越热门的研究方向。现实生活中包含着各种各样的关系,如何充分利用知识图谱来挖掘和表示信息之间的关系变的尤为重要。知识图谱本质上是一个语义网络,可以揭示实体间的关系。本文研究的主要目的,是使构建的知识图谱更有效、快捷、准确并形成一定规模。智能问答系统本质上是一种高级形式的信息检索系统。深度学习技术的出现为知识图谱与智能问答系统的建立和研究开辟了新的途径,大大促进了知识图谱和智能问答系统的研究与发展。本文主要根据医疗领域专业知识对其进行深度挖掘,针对医疗知识之间的信息关系构建大规模中文医疗知识图谱,并且在知识图谱之上实现智能问答。在知识图谱和智能问答系统上展开研究。本文主要研究内容包括以下三个方面:1、医疗知识图谱的构建:针对目前国内大型医疗知识图谱数量较少这一情况,本文对其开展研究,首先采用爬虫技术对国内流行的医疗知识网站进行爬虫,主要针对非结构化数据、半结构化数据和结构化数据的采集,并对其进行预处理,经过预处理之后的数据对其进行实体识别与关系抽取,本文采用的是基于Bi Lstm+Attention的联合抽取模型。经过对比实验表明本文的联合抽取器F1得分为86.2%远高其他模型。通过联合抽取器之后得到关于医学实体、实体间关系和实体的自身属性。对其进行词语相似性计算和多知识库的知识融合,得到三元组并形成知识图谱并存放在Neo4j和Mongo DB数据库中。最终形成一个中文医疗知识图谱,其中包括8807种疾病、4982种药品、3519个诊断和检查项目、6919种食品、54个医疗部门、15023种销售药品和4901种疾病症状,形成了一个总规模包含44205个医疗实体信息的知识图谱。2、智能问答模型:由于传统智能问答系统的方法大多基于规则匹配形式,针对传统的智能问答系统速度慢效果差等缺点,本文提出一种基于动态记忆网络结合注意力机制的模型,该模型能够准确把握用户提出的问题,并且模型可以实时更新内部信息,以此来提高模型的准确率,经实验表明该模型准确率可以达到88.7%,在与各项模型的对比实验中效果最好。3、医疗知识图谱和智能问答系统web开发:本文以构建的医疗知识图谱为基础将其应用在智能问答模型中,为了使用户得到良好的体验,本文对该系统进行web开发,主要实现两大功能,其一是实现与用户交互的智能问答功能,使得用户以聊天的方式即可获取准确的答案。其二是知识图谱的可视化研究,为用户呈现出结构化并且高度关联的知识图谱,用户只需要输入少量关键字就可直观看到以图片形式展出的知识图谱。开发采用的前后端分离技术,使用python语言的Flask框架进行开发,针对其测试后发现该系统具有良好的稳定性和准确性,可以达到用户的使用标准。
其他文献
从艺术表演形式上来讲,古筝演奏通过多种单音将艺术特有的魅力表达出来,同时在表演中将不同的艺术效果呈现给听众。就此,文章分别对古筝演奏艺术中的"气"和"韵"进行分析,然后就两者的统一与结合进行相应的探究,以此为相关人士提供参考。
智慧家庭等各类新型业务有对网络提速升级的需求,分析目前家庭内部组网的现状与瓶颈,研究各类场景下的FTTR(光纤到房间)解决方案。综合对比FTTR与传统组网方案的优缺点,得出结论:FTTR千兆全光纤化家庭组网方案具备超高带宽、超低时延、智能连接、绿色环保四大特点,能够提供超千兆带宽到每个房间,打造以人和终端为中心的超高速信息服务,提供高品质的宽带体验,构筑智慧家庭的全光底座。
<正>新冠肺炎疫情暴发后,影视行业受到较为严重的冲击,拍摄录制、播出放映、宣传发行等一度被按下了"暂停键",这让原本就已经面临重重冲击的影视行业遭遇到前所未有的挑战。面对行业困境,从中央到各地都积极出台了涉及影视行业的保障、扶持与调控政策,一方面服务防疫抗疫,确立防疫抗疫的信息保障,另一方面扶持、鼓励、激励影视行业渡过难关,规范行业秩序,促进行业健康发展。除了政策的积极推动,电视剧行业内部也积极地
期刊
作为当代文坛不可缺席的代表人物之一,刘心武以新时期文学的开路者、领跑者、奠基者而被关注。纵观刘心武的小说创作,他之所以能多次引起社会的关注,正是在于他的作品能够始终做到与时代同频共振,他直面现实,关怀现实,理解现实,带着冲破禁区的勇气去揭露社会问题,带着对生命价值的温情关怀去探索解决问题的途径。在现实主义视域下看刘心武的小说创作,其作品的价值和意义是为当代文学的发展提供了不可多得的“泛文本”案例。
随着经济和城市化的发展,自2014年以来政府对混凝土推广力度加大,以及对现拌混凝土的使用场景进一步限制,混凝土行业迎来了高速发展,多数资本纷纷投入混凝土行业,资本家通过设备、材料分期付款用少量的资金投入,利用自身资源优势纷纷投入混凝土企业生产中。正是预拌混凝土行业的高速发展给行业带来了很多矛盾和问题,发展门槛低,产能严重过剩,标准提升滞后,应收账款高,监管不足,行业向心力差。近期,受国家宏观调控叠
运用综合评价模型、超效率SBM模型、耦合协调度模型和灰色关联度模型等方法,对2007—2017年中国31个省市自治区基本公共服务供给与新型城镇化质量耦合协调度及其影响因素进行了研究。结果显示:基本公共服务均等化呈稳步上升趋势,基本公共服务效率呈波浪式上升趋势,基本公共服务供给和新型城镇化质量均呈上升态势;基本公共服务供给与新型城镇化质量耦合协调度呈逐步上升态势,省际差异逐渐缩小,空间上呈东部、东北
在长篇小说《小姨多鹤》中,严歌苓塑造了一系列以竹内多鹤为主的悲剧人物,从个人层面展现了个体的生存与命运悲剧。从家庭集体层面看,由个体建构的"畸形"集体仍是悲剧的事实存在,表现为混乱的家庭伦理关系及离散的家庭生存状况。由此见大至国家及民族层面,更是对时代的苦难与封建思想遗留的悲剧书写与深沉反思。
随着科学技术的发展,信息化成为当前全世界的发展趋势和潮流,各行各业都在积极的应对当前的现状做出改变,赶上时代发展的潮流,企业会计信息化建设正在进行当中。全面实施企业信息化成为整个行业的趋势,但是在这个过程中,企业信息化建设存在着一定的不足之处,针对这样的问题,下文将详细阐述如何进行调整,推动企业信息化建设不断完善。
<正>庞贝病(又称为糖原累积病Ⅱ型)是一种常染色体隐性遗传病,其特征是溶酶体酸性α-葡糖苷酶(ac-id alpha-glucosidase,GAA)基因突变导致GAA酶活性降低或缺乏,糖原不能分解而贮积在各种组织的溶酶体内,导致心肌、呼吸肌及骨骼肌等进行性损害,以及各种神经功能损害[1]。根据临床症状出现的时间,该病可分成婴儿型庞贝病(infantile-onset Pompe disease,
为了实时监测环氧树脂系统在固化过程中的黏度,建立了一种基于相似理论和落球法的动态黏度预测模型。首先,结合影响黏度的主要因素,利用量纲分析法,推导出无量纲的黏度方程;其次,通过分析实测黏度数据,得出不同粒径骨料在不同的反应时间条件下的黏度预测方程;最后,对比分析方程预测结果与实测黏度。研究结果表明:采用该方法能够在不同粒径骨料条件下预测树脂系统固化过程的实际黏度;预测黏度在树脂系统固化反应前期和后期