基于循环神经网络的中医问答模型研究

来源 :电子科技大学 | 被引量 : 0次 | 上传用户:slylzz
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
互联网的快速发展和广泛普及促进信息获取的快捷性,通过人机问答方式获取有效信息成为发展趋势。中医药是中国人民长期与疾病斗争知识和经验总结,对中国人民的医疗保健发挥着至关重要的作用。目前,大量中医药领域知识存在于非结构化的医案文本中,无法得到有效利用;医师在学习现有的诊疗经验时,只能通过分析医案暗语获取诊疗思路,无法精准获取对应的诊疗知识。针对上述问题,本文通过知识图谱将中医药领域多种知识源进行整合和统一,并通过人机问答的方式帮助获取诊疗经验,论文从中医知识图谱构建、问题生成和问句意图分类等方面开展关键技术研究。主要工作如下:1.针对中医知识缺乏统一体系描述问题,分析中医领域知识体系结构,构建中医领域知识本体层,利用多种数据源构建一个中医领域的知识图谱,其中数据源包括结构化的知识库数据、半结构化的网页数据和非结构化的医案文本数据。医案文本进行实体识别时,针对现有实体识别模型未能充分利用句子特征的问题,提出融合字词信息的命名实体识别模型(Named Entity Recognition by Fusing Character and Word Information,NER-CW),NER-CW通过带上下文语境的注意力机制引入每个字的词信息,然后结合字词信息作为输入特征进行实体识别。在构建的中医医案数据集上的实验结果表明,NEW-CW模型的F1分值达97.16%。2.针对中医问答领域语料库缺失问题,通过中医领域知识图谱,提出基于三元组描述特征和复制机制的问题生成模型(Question Generation Model based on Triplet Description Features and Copy Mechanism,QG-TC),QG-TC模型在编码器引入三元组的描述特征以丰富特征输入,在解码器引入复制机制以生成未出现在训练数据的词语。在NLPCC-2018-KBQG、Simple Question和构建的TCM-KBQG数据集上的实验结果表明,QG-TC模型的三个评价指标BLUE-4、METEOR和ROUGE-L优于未改进的Encoder-Decoder架构。3.针对问句的长度较短造成的语义稀疏性问题,提出融合语料库特征与图注意力网络的意图分类模型(Intention Classification Model by Fusing Corpus Features and Graph Attention Networks,CF-GAT),CF-GAT通过引力模型和点互信息分别计算语料库中词的权值和词之间的边权值,然后将其融入到图注意力网络中指导节点更新。实验结果表明,CF-GAT模型在6个短文本分类数据集上平均准确率达到75.48%,在构建的TCM-QA问答数据集上的准确率达到92.41%。4.设计并实现基于中医知识图谱的中医问答系统,采取Springboot框架作为服务器后台框架,Flask作为算法模型部署框架,图数据库Neo4j为三元组存储框架。平台功能包括用户权限管理、实体识别、中医知识图谱管理、中医知识图谱可视化、意图分类、智能问答等。系统通过实体识别功能对非结构化文本进行知识抽取,然后将提取的知识存入知识图谱,同时能够可视化显示知识图谱子图,并根据知识图谱回答用户输入的问句。
其他文献
在当今社会和环境问题日益严重的背景下,人们越来越迫切地需要企业积极开展CSR活动,以期实现各利益相关方的和谐共处及可持续发展。这就是所谓的企业社会责任。这一趋势从2020年初起变得尤为明显。随着新型冠状病毒疫情的愈演愈烈,社会各方都在期待企业积极参与CSR活动,参与解决疫情下出现的各类问题,以期尽快缓解疫情,减少损失。然而,公司是由利润驱动的组织。所谓的“社会责任”概念有时只是道德层面的企业自愿行
学位
在现实世界中包含有复杂的语义信息,而计算机视觉这一学科,所研究的主要内容就是使计算机从现实世界中感知到语义信息,并进行学习,利用这些信息去认识世界。目标检测是计算机视觉研究中的热点问题,其主要任务是对图像中的目标进行精准的分类和定位,可用于自动驾驶、辅助医疗、军事领域的异常目标检测等场景。由于场景复杂且变化繁多,现有的目标检测算法很难满足真实场景下的需求,即泛化性和鲁棒性差,本文的研究着眼于目标检
学位
最大冻结深度是季节冻土的重要指标,预测第三极地区未来最大冻结深度的变化,对于理解该区域的环境变化,指导生态保护、农牧业生产、工程建设等都具有重要意义。本研究利用基准时期(2000s)良好训练的支持向量回归模型,使用集合模拟策略,预测了2050s和2090s第三极地区在4种SSP情景下最大冻结深度的变化。结果表明,在可持续路径(SSP126)、中间路径(SSP245)、区域竞争路径(SSP370)和
期刊
边防巡检因道路遥远情况复杂,使得站岗、巡逻等传统人工监控方式存在难走到、难深入、难看明、难查清等问题。现普遍使用的“人工巡视+摄像头监控”这一巡检方式,也仍然面临设备多、数据多、监控范围受限、工作重复等挑战。本文将结合计算机视觉技术,对边防巡检这一空中观测应用进行研究,以实现零风险地获取高风险目标的类别、位置、运动轨迹等重要信息。本文的主要工作如下:1.采集并制作包含9类边防巡检目标共计13920
学位
多接入边缘计算(MEC)是5G及未来网络中一种新兴的、重要的云计算架构,旨在将云服务扩展到网络边缘。终端用户设备可以把应用任务卸载到MEC进行计算,以减少应用服务延迟和能耗,带来较好的服务质量(Qo S)。因此,为了尽可能地降低应用任务的延迟和能耗,对MEC任务卸载策略进行优化是至关重要的。然而,MEC系统环境和终端应用任务的复杂、多变性导致优化MEC任务卸载并非易事。本论文对现有的相关研究调研发
学位
报纸
目的:研究西药临床合理用药安全性以及西药合理用药措施。方法:于我院西药房实施安全管理前后各随机抽取60例患者,分析西药合理用药情况,调查患者满意度以及药房管理不合格情况。结果:(1)合理使用情况:实施后重复给药1例(1.67%),用法用量不合理1例(1.67%),未见不合理联合用药及超说明书使用抗菌药物,合计2例(3.33%),少于实施前[重复给药3例(5.00%),不合理联合用药2例(3.33%
期刊
二战后初期至泡沫经济时期,以银行为中心的公司法人之间的相互持股成为了日本的大企业股权结构的一大特征。泡沫经济破灭后,众多银行开始大幅削减长期以来持有的股份,进入21世纪后,这种削减持股的势头逐渐减弱。然而,2010年修订的《关于企业公开信息等的内阁府令》明确要求上市企业在《有价证券报告书》中公开其持股信息。2019年该文件再次被修订,对于政策性持股的信息公开的要求变得更加严格。在这一背景下,承担着
学位
报纸
近年来,国内外无人机相关研究越来越多,随之而来的是无人机特点越来越鲜明、种类越来越繁多,导致不同无人机在质量、尺寸、速度、飞行高度和航程等多方面都有一定差异,为无人机关键点检测带来了困难。随着越来越多的学者开始关注深度学习和卷积神经网络,基于深度学习的关键点检测研究也越来越多。关键点检测作为计算机视觉领域中具有一定难度的课题,不仅需要关注物体本身姿态的多样性,从多视角多维度研究关键点,还需要考虑光
学位