基于知识图谱的人机交互智能问答方法研究

来源 :湖南大学 | 被引量 : 0次 | 上传用户:hccstarttttt
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着人工智能与机器人技术的发展,智能问答系统逐渐成为人机自然交互的重点研究内容,通过一问一答的形式为交互对象提供智能化服务。在智慧医疗领域,以知识图谱为基础的智能问答系统能够根据结构化的医疗知识生成简洁的答案,自动回复用户的自然语言问句,帮助用户更便捷地获取知识。传统的问答系统技术不能有效地处理包含多种意图的复杂问句,导致意图识别不全面或不准确,并且中文医疗领域缺乏适用于医疗咨询和导诊服务的知识图谱,难以生成高质量的回复语句,导致基于知识图谱的智能问答研究任务充满挑战和困难。针对以上问题,本文以深度学习和自然语言处理技术为基础,面向医疗导诊机器人开展基于知识图谱的人机交互智能问答方法研究,构建了医疗实体识别模型和医疗知识图谱,提出了一种复杂问句意图理解方法,并开发了导诊机器人智能医疗咨询问答系统。具体研究内容如下:1)针对医疗知识图谱构建中传统的命名实体识别模型在上下文语义信息表示方面存在不足的问题,本文提出了基于深度学习和结构先验的医疗知识图谱构建方法。开发网页数据解析软件获取医疗网站上开放的医疗知识数据,通过融合语言模型的命名实体识别模型抽取其中的医疗知识,以结构化形式存储到本地数据库,并构建了一个包含6类实体和8种关系共约14万个节点的医疗知识图谱。本文的命名实体识别方法在Bi LSTM-CRF模型和IDCNN-CRF模型的基础上,分别使用Word2Vec词向量和预训练语言模型提取文本语义特征信息进行对比实验,实验结果表明融合语言模型能显著提升医疗实体识别模型的性能。本文使用特定的关键词信息和人工制定的关系抽取规则完成医疗关系的抽取任务,然后使用Neo4j图数据库存储医疗知识数据完成医疗知识图谱的构建任务。2)针对多意图复杂问句理解问题,本文提出了一种基于深度学习和语义分析的复杂问句意图智能理解方法。该方法分为问句语法成分规范化和医疗意图识别两个部分。问句语法成分规范化首先通过医疗实体识别和依存句法分析得到输入问句的核心依存句法树以及实体之间的关联性,然后在此基础上通过问句语法成分规范化算法将多意图复杂问句分解成若干个属性类或关系类的简单问句组合。医疗意图识别对语法成分规范化之后的每个简单问句使用预训练语言模型提取特征信息,然后输入到Text CNN模型中对问句意图进行分类。实验结果表明,将多意图复杂问句分解之后再进行意图识别能够降低自然语言口语化表达对问句意图理解的影响,提高解析问句完整意图的能力。3)基于本文所提出的医疗知识图谱、医疗实体识别模型和复杂问句意图理解方法设计了一种新的智能问答系统框架,包括人机交互模块、问句语法分析、问句规范化、医疗意图识别、智能知识检索和自然语言答案生成6个处理模块,并开发了面向导诊机器人的医疗咨询智能问答系统。智能问答系统支持使用语音或文字等不同模态的交互方式输入自然语言问句,然后对输入的问句进行语义解析,获取医疗实体和关系谓词,并转化为检索语句在医疗知识图谱中检索相关知识,最后根据检索到的医疗知识生成自然语言答案反馈给用户。
其他文献
CRISPR/Cas是古生菌和细菌中的一种基于RNA引导的获得性免疫系统,能够赋予古生菌和细菌抵抗噬菌体入侵的能力。CRISPR/Cas系统能够对靶标DNA进行特定位点的识别与切割,因而广泛应用于基因编辑领域,为疾病治疗提供了一种极具潜力的发展方向。Cas12a(Cpf1)属于V型CRISPR/Cas系统,能够在单条RNA的引导下对特定序列的双链DNA进行识别与切割。随着相关研究的开展,Cas12
交通目标检测是智能驾驶领域以及智能交通系统中不可或缺的技术,高可靠性的交通目标检测可以为智慧交通和无人驾驶提供实时、可靠和准确的信息。但在复杂的交通环境中,目标识别在识别精度和鲁棒性方面表现的差强人意,加之交通系统作为一个安全性至上的系统关系到使用者的生命财产安全,对识别精度和鲁棒性的要求也更加严苛。因此,以实际应用为目标研究实时性好、准确性高、可扩展性强的目标识别系统很有必要。围绕实际问题,论文
基于已知地图的精确定位是移动机器人执行智能任务的前提。传统基于视觉的定位方法利用图像匹配技术快速识别机器人的全局位置,然而容易受光照、气候、低纹理影响,定位精度和鲁棒性受限。三维激光雷达可以获得精确的环境三维结构点云,对光照等变化天然鲁棒,然而由于环境结构的相似性,进行大范围全局定位时易感知混淆,需要一个良好的初始位姿来实现精确定位。由此,本文提出一种结合双目视觉相机和三维激光雷达的移动机器人定位
流域水环境状况与人类生活和社会发展密切相关,其优劣直接关系到人类的生存和发展。二十一世纪以来,随着我国经济发展水平日益提高,人们对水环境保护问题愈加重视。水质监测是水环境保护的前提与基础,其需求愈发迫切。然而,传统的水质监测手段成本高、耗时长,监测范围有限,无法满足对大范围水域全面监测的需求。近年来,遥感对地观测的空间和光谱分辨率都有了大幅提升,此外,机器学习理论方法为水质遥感监测中遥感图像解译问
最新的全球癌症统计数据显示,宫颈癌是全球第四大最常见的女性恶性肿瘤。2020年,全球宫颈癌新发病例超过60万,死亡患者超过34万,而这个数据每年都在增加。宫颈癌的治疗目前仍然以子宫切除术和放化疗为主,但是对于转移性或复发性宫颈癌患者,总体预后仍然较差。因此,深入研究宫颈癌的发病机制,寻找其关键的分子靶标,对于宫颈癌的诊治具有重要意义。MCPIP1是MCPIP蛋白家族中被研究得较多的成员,通过其核酸
工业互联网作为数字“新基建”的领头羊,是工业实现数字化、网络化和智能化的重要抓手。随着工业互联网的发展,“封闭式”工业环境与“开放式”网络环境不断融合,暴露出来了许多安全问题。其中,工业互联网数据安全问题首当其冲。工业网络环境变得更为复杂,目前已有的数据安全方案已无法完全适应未来工业数据安全防护的要求。鉴于区块链技术防篡改、可追溯和去中心化等优势适合于数据的安全防护,本文考虑将区块链技术赋能工业互
镁及镁合金因具有密度低、比强度和比刚度高等特点而在航空航天、军事、汽车和计算机电子等工业领域具有非常广阔的应用前景。然而,镁的标准电极电位只有-2.37V,导致镁及镁合金的耐蚀性相对较差。因此,提高镁合金的耐蚀性对于促进其大规模生产和应用具有极其重要的意义。合金化是改善镁合金耐蚀性的重要手段。本论文以Mg-Ga和Mg-Ga-Zn合金为研究对象,采用高应变速率轧制技术制备细晶板材,通过浸泡失重实验、
本文采用尿素沉淀法制备出ZnAl-LDHs及一系列的ZnAl M-LDHs作为催化剂的前驱体,并在一定温度下焙烧得到相应的复合金属氧化物Zn Al-LDO及Zn Al M-LDO作为催化剂,考察其催化MC与甲醇反应合成DMC催化性能。针对二元复合金属氧化物(ZnAl-LDO)催化体系,在之前的工作中已经考察并优化了其催化反应工艺条件,本文针对该催化反应体系做进一步的研究。对该反应体系进行碳平衡分析
近年来,基于硫酸根自由基(SO4·-)的高级氧化技术(SR-AOPs)去除难降解有机污染物受到广泛的关注。相较于传统的芬顿反应产生的羟基自由基(·OH)而言,SO4·-具有拥有更高的氧化还原电位,更长的存活时间,更强的矿化能力以及能够适应更广的p H范围等优势。SO4·-可由具有不对称结构的单过硫酸盐(PMS)和具有对称结构的过硫酸盐(PDS)通过活化产生,常用的活化方法包括光、热、碱、超声以及过
随着电力系统越来越多的清洁能源例如太阳能、风能等接入电网,电网电压暂降问题不断增加,电压暂降扰动源呈现出复合叠加情况愈发严重复合,给暂降源监测与治理带来挑战。暂降源识别与治理需以暂降源类型及暂降源位置作为指导,而传统针对单一暂降源识别方式无法满足复合暂降源识别要求,尤其考虑波形畸变影响下的复合暂降源识别未有成熟有效方案,同时,电力系统中电压暂降源故障类型确定并不能为暂降源的治理、责任的界定提供完整