基于知识库的医学智能问答系统设计与实现

来源 :北京协和医学院 | 被引量 : 0次 | 上传用户:woailzm002
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
目的:近年来,随着互联网医疗的兴起,出现了大量在线医疗健康类平台,患者在平台描述自己的症状和问题,医生根据患者的描述进行诊断、建议或进一步询问。这可以远程解决部分患者的问题,使其不用到院就诊,极大的方便了患者,也对医疗资源起到了一定的合理分配作用。但随着数据的积累,许多患者提出了相似的问题,造成医疗资源的浪费。因此本课题基于各种自然语言处理技术,依托公开可获取的医学问答等知识库构建问答模型,最后搭建智能问答系统,服务于患者。方法:首先构建医学领域问答知识库与药物相关知识图谱,并设计和搭建同义语料制备平台,以知识库中的中文医学问题为模板,制备医学相似问题数据集,然后使用该语料训练医学相似问题匹配模型,并使用该模型将患者问题和问答知识库中所有问题进行比较,寻找最相似问题,返回对应答案作为回答。对于患者提出的涉及到具体药物的问题,将基于药物知识库进行回答,最后整合医学相似问题深度匹配模型和药物问答模型,搭建医学智能问答系统。结果:本文使用了两个已有的公开同义文本数据库对同义语料制备平台进行验证,结果表明使用本平台制备的数据训练的相似文本匹配模型和使用原始数据训练的模型在测试集上表现相当,说明使用本平台制备同义语料可行。受限于问答数据库的大小,本文搭建的智能问答系统只能对患提出的问题中的69%进行回答,其中回答的可接受性P@1=0.47,P@3=0.6,对于患者提出的常见问题能够做出很好的回答。结论:以医学问答知识库为支撑,采用相似问题匹配的方法可以回答患者约69%的问题,当患者问题涉及到个性化药物时通过接入知识图谱可进一步提升问答效果。结果表明,在海量问答数据以及医学知识库的支持下,基于自然语言处理技术可以对患者的常见问题进行自动回答,在一定程度上减轻医生负担。
其他文献
目的通过遗传学分析及功能学研究发现新的大动脉转位候选基因。研究纤毛基因DYNC2LI1与大动脉转位发生的相关性,探讨该基因在心脏发育和流出道重塑过程中的关键作用。方法对381名散发大动脉转位患者进行全外显子组测序,与gnomAD数据库125748个个体构成病例-对照队列,利用基因负荷分析筛选候选基因。针对患者中发现的有害突变,进行突变功能分析:构建体外表达质粒并进行细胞转染,采用实时荧光定量PCR
目的本研究旨在探讨住院2型糖尿病患者血糖和血压对尿白蛋白/肌酐比值(Urinary albumin/creatinine ratio,UACR)的影响,分析处于不同尿白蛋白状态的患者的临床特征。方法 本研究连续纳入在北京医院内分泌科住院符合入组标准的2型糖尿病患者,收集基线临床资料,监测其在住院期间(连续5-10天)每日三餐前、后的指尖毛细血管血糖、收缩压、舒张压、脉搏和同时间点的UACR,根据观
背景:随着重症医学医疗技术水平的不断提高,虽然重症患者的生存率不断上升,但患者及其家属在重症加强治疗病房(Intensive care unit,ICU)期间和转出后极可能出现各种心理症状,包括创伤后应激障碍、焦虑和抑郁,严重影响了患者和家属的身心健康和生活质量。这一问题引起了重症医学界高度关注,以改善患者预后为观察终点对ICU照护模式进行研究成为了当前的热点。随着“生理—心理—社会”医学模式的发
雌激素在妊娠起始和维持妊娠过程中至关重要,正常的雌激素水平保证胎盘的生长发育。胎盘是孕妇和胎儿进行营养物质、激素和代谢废物等交换的重要场所,雌激素的缺乏导致胎盘结构和功能异常。血管生成素样蛋白8(ANGPTL8)是血管生成素样蛋白(ANGPTLs)家族的一个新颖且独特的成员,它是一种分泌蛋白,能够通过抑制脂蛋白脂酶(LPL)活性使甘油三脂(TG)的水解受到抑制,导致体内TG的积聚,它与多种代谢性疾
研究背景:骨盆带疼痛是妊娠期和产后妇女常见的疾病,会引起妇女的功能障碍。骨盆带疼痛在妊娠期发病率较高,产后虽然有部分妇女自行缓解,但仍然有部分妇女存在骨盆带疼痛,并持续数月到数年,影响妇女进行日常活动和社会活动,给妇女及其家庭带来负面影响,因此有必要增强对产后骨盆带疼痛的认识,从而对其进行有效管理。研究目的:(1)描述产后骨盆带疼痛的发生率和影响因素;(2)描述产后骨盆带疼痛的疼痛特点;(3)描述
第一部分肿瘤生长速率与神经内分泌肿瘤临床病理特征的相关性研究[目的]神经内分泌肿瘤(NEN)高度异质的特点为临床诊治带来了诸多挑战,肿瘤生长速率(TGR)表示每个月肿瘤体积的百分比变化(%/m),能够提供有关肿瘤大小随时间变化的定量信息而反映肿瘤生长动力学,本研究旨在分析NEN患者初次接受治疗3个月后的肿瘤生长速率(TGR3m)与NEN患者临床病理特征的相关性,讨论其潜在临床价值。[材料及方法]回
体感诱发电位(SEP)的波形成分包含了神经系统的生理信息,可以为临床评估神经功能和体感通路完整性提供客观依据,是脊髓型颈椎病(CSM)的早期诊断的常用手段。对体感诱发电位信号与神经功能关系的了解是精确诊断的基础,既往SEP研究主要基于动物实验模型,尚未系统分析动物与人类之间体感诱发电位信号的直接联系。此外,对动物模型的评价标准普遍基于SEP信号的时域分析方法,与之相比,时频分析可以提供更早、更敏感
本研究旨在探索一种基于光学定位引导的机械臂医用穿刺方法,探讨结构光视觉定位在机械臂穿刺引导中的精度,并建立一种基于术中需求的穿刺机构位姿约束方法,以及设计了一种规避部分奇异点的方法,并进行了实验验证和讨论。为了实现本研究中机械臂穿刺规划的目的,根据相关领域国内外研究现状分析,结合实验室条件,采用了六自由度的UR3机械臂为模型,利用D-H参数法对其建立数学模型,进行运动学分析,利用蒙特卡洛法分析机械
目的:研究单纯性高度近视眼黄斑区神经节细胞复合体(ganglion cell complex,GCC)厚度的特点及影响因素。方法:收集2019年3月至2019年5月期间在北京协和医院眼科就诊的单纯性高度近视患者40例(40眼)作为高度近视组,低度近视及正视健康志愿者40例(40眼)作为对照组。采用光学相干断层扫描血管成像测量黄斑区6mm×6mmGCC厚度,获取浅层视网膜、深层视网膜、脉络膜毛细血管
背景:主动脉夹层是一种严重危害人类生命健康的危重症心血管疾病,其病情凶险,死亡率高,急性主动脉夹层患者的死亡风险高于慢性期。急诊在急性主动脉夹层患者的初始管理中发挥着重要作用,在急诊留观期间,严密监测患者的病情变化、早期评估与识别高危患者、及时给予合理的医疗及护理干预,会使患者的存活率显著提高。目前在急诊留观期间对急性主动脉夹层患者实施的病情评估与临床响应主要基于传统经验,由于国内外相关护理研究的