基于深度神经网络的生物医学文本语义匹配研究

来源 :大连海洋大学 | 被引量 : 0次 | 上传用户:sddxfg
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在过去的几年里,生物医学领域所产生的数据海量增长。随着生活水平的提高,人们日渐关注自己的健康质量问题。由于现代科技的不断迭代更新,越来越多的人倾向于在互联网上搜寻医学信息和获取健康帮助。但是传统的搜索引擎存在许多不足,对于用户提出的偏口语化的医疗问句,有时会返回大量重复或者不相干的内容。面对庞大复杂的网页的相关信息,即便是医学领域专业人员也要花费大量时间去鉴别信息的准确性,而大多数使用者缺乏相关的领域知识,致使很难在搜索页面返回大量的结果中,准确搜寻到适用自己的有效信息。本文主要探索目前问答匹配模型无法充分获取到文本中所蕴含有用的医学信息,致使无法高效得到匹配结果,并通过借助当前计算机技术适当解决我国社会所存在的相关医疗资源不足等问题。为解决问答系统中文本匹配问题,本文采用基于深度学习的自然语言处理技术,结合医学领域相关知识分别针对基于有无常见问题集(Frequently-asked Questions,FAQ)标准库的自动问答展开了相关研究,具体工作如下:(1)基于FAQ问答系统提出了结合孪生循环网络和双重注意力机制的中文医学问句匹配研究,以更高效的捕获语义信息,明确使用者的提问意图,针对当前相关模型结构无法准确获取到问句文本所蕴含的丰富的上下文语义信息,为了获得更具体复杂的文本语义信息,首先利用预训练模型得到两种级别嵌入向量,然后再通过融合的神经网络模型来解决FQA医疗问答系统中问句匹配问题,有效消除因拼写错误、未识别同义词等给匹配结果带来的影响,并充分考虑前后句子重要性,优化权重分配,消除噪音,更高效准确的捕获问句语义信息。实验结果表明模型在医学文本匹配任务上性能相较于其他主流神经网络模型有较明显提升,有效的提高了中文医学文本匹配的效果。(2)对于非FAQ问答系统,需从海量医学信息中检索到与用户所提问题匹配的答案,提出了引入外部知识的医疗问答匹配方法。首先,采用预训练模型BERT学习文本的特征并输入到融合的双向GRU和注意力机制模块中,以更好地学习问答对中关键词蕴涵的信息。然后,尝试将知识图谱中的外部知识添加到数据中,实现数据集与医学知识图谱之间的实体链接。实验结果表明,加入注意力机制和外部知识的引入能有效提升模型的性能,对关键词的学习能够进一步降低知识噪声对模型的干扰。实验结果相较于基线模型获得了最高的实验成绩,证明提出的方法在解决中文医学问答匹配任务上是有效的。
其他文献
学位
智慧化养殖已成为我国鱼类养殖产业发展的核心动力,这种智能养殖模式将逐渐代替以往的传统养殖模式,使水产养殖业进入智慧时代。鱼类养殖密度是养殖过程中的关键因素,过小会影响鱼类产值和经济效益,过大会影响水体水质和鱼类生长性能。鱼类实例分割是实现精细化养殖的重要前提,可为鱼类体长、体质量以及生长状态评估提供依据。然而,现阶段养殖鱼类图像实例分割网络由于水下环境复杂、养殖密度不均匀,很难精准分割出图中不同尺
学位
劳动教育和思想政治教育作为中国特色社会主义教育制度的重要内容,是学校教育的中心任务,以立德树人作为根本目标和重要使命。思想政治教育在劳动教育过程中起到思想引领的作用,而劳动教育则能够具体实现思想政治教育的目标,推动学生思想政治教育与劳动获得感的互促提升。但随着社会的快速发展和科技的进步,特别是人工智能等新技术的崛起,劳动教育近年来在教育中受到的关注较少,尤其是在高校教育中劳动教育环节相对薄弱。这导
学位
在海洋生态环境中,海洋微藻是一种占据重要地位的光合自养型生物,能够进行光合作用,吸收二氧化碳。随着水体富营养化日益严重,水体中的某种藻类快速繁殖逐渐形成有害水华,破坏水体环境。因此,为了维持水体的生态健康,充分利用藻类资源,对藻类进行识别非常重要。在海洋微藻图像识别任务中,人工镜检识别劳动量大;传统的图像识别算法存在识别时间长、精度不高等问题;目前基于深度学习算法进行藻类识别广泛适用,虽然精度较高
学位
渔业标准化是数字渔业发展的主要趋势,实现渔业标准化需要渔业标准信息服务系统做支撑,完善渔业标准服务系统需要从渔业标准文本中抽取其蕴含的知识。信息抽取技术能够对渔业标准文本中的知识进行抽取,目前的渔业标准信息抽取主要针对粗粒度实体进行抽取,而完善渔业标准服务系统需抽取完备的渔业标准实体,因此需对渔业标准细粒度实体进行抽取。因渔业标准细粒度实体主要存在于渔业标准表格中,且细粒度实体存在重叠关系等问题,
学位
随着近年来数字化养殖技术的迅猛发展,海参养殖水体中的温度、盐度、p H值和氨氮浓度的在线监测和预测成为智慧养殖、促进海参健康生长的重要技术工作。其中氨氮浓度的监测面临检测技术复杂,耗费人力物力财力较大的问题,养殖产品的氨中毒会造成不可估量的经济损失。养殖水体中的温度、盐度、p H值等因素影响着海参生长环境中的氨氮浓度,因此使用软测量技术,通过温度、盐度、p H值来建模和预测海参生长环境的氨氮浓度,
学位
水产动物疾病是影响水产健康养殖的重要因素,有效的疾病防治需要完备的水产医学相关知识作为支撑,而知识图谱是水学产医学相关知识表示及应用、实现水产健康养殖的有效手段,图谱补全技术又是提升水产医学知识图谱构建质量的关键。然而在对水产医学知识图谱补全过程中,水产医学相关数据存在稀疏、关系复杂等特点,造成因水产医学知识图谱同类实体语义辨析度低、语义特征不显著等导致水产医学知识图谱复杂关系补全准确率不高的问题
学位
在水产养殖过程中,水质是影响养殖收益的最主要的因素。随着养殖技术的不断发展,养殖水质环境已经成为各国研究的热点,而氨氮浓度作为衡量水质的重要参数之一,在养殖水质监测中至关重要。氨氮浓度过高会对水生物生存的环境造成恶劣影响,对周围水质、生态等造成破坏。因此对水体氨氮浓度的实时监测尤为重要。对水质数据进行预测可以解决现有检测方法的缺陷,采用预测方法对养殖水体氨氮浓度数据进行分析和建模,建立氨氮浓度与其
学位
渔船轨迹大数据是促进现代海洋经济发展的重要资源,对这种资源的有效利用能够提升我国渔业生产的管理水平,对实现渔业现代化具有重要意义。对渔船航行轨迹数据的分析在航线冲突碰撞预警,捕捞强度预测等方面的运用对渔业资源生产的科学化,系统化管理具有重要作用。相较于拥有路网约束的道路交通轨迹数据,渔船航行轨迹数据具有区域数据点密度高、数据点分布随机、形状无规律、单条轨迹数据的轨迹点数量不统一等一系列特点,这使得
学位
随着水产养殖规模的不断扩大,传统的病害防治技术已经无法满足水产养殖业的需求。因此,亟需一种有效的方法来辅助病害防治技术的研究。事件知识图谱是一种利用人工智能技术赋能传统水产养殖产业的方法,可以转变病害防治技术的研究方式。事件抽取作为构建事件知识图谱的关键环节,有效的事件抽取方法可以提升图谱构建的质量。由于水产动物疾病防治事件含有大量的专有名词边界模糊、事件实体过长和长尾事件实体识别等问题,通用的事
学位