【摘 要】
:
近年来,随着生物医学发展的不断进步,数据规模也持续增长,这使得学者难以人工获取信息。为了更好地满足研究学者的信息需求,针对生物医学领域的信息检索技术应运而生。与传统
论文部分内容阅读
近年来,随着生物医学发展的不断进步,数据规模也持续增长,这使得学者难以人工获取信息。为了更好地满足研究学者的信息需求,针对生物医学领域的信息检索技术应运而生。与传统的信息检索不同,生物医学领域面临着一些特定的挑战,其中大部分是由于医学术语的复杂性和特殊性,可能导致检索不相关的文章。该领域研究通常有两部分亟待解决的问题:一是用户查询的理解,能够根据用户输入的查询检索到相似度最高的文档;二是检索模型的搭建,对查询与文档的相关性进行度量并给出排序结果。以上两方面的挑战相辅相成,充分理解的用户查询可以让检索系统更加准确地定位用户信息需求,本文针对上述问题从三个方面展开研究,具体内容包括:利用排序学习优化查询的技术研究,提出了一种查询改进和查询扩展相融合的模型。该方法在查询改进的基础上,利用排序学习对查询扩展词进行重排序,使得结合原查询能检索出准确率更高的文档。仅利用生物领域资源对查询词进行扩展虽然能得到理想的扩展词,但并不能准确描述扩展词与查询词的相关性程度,引入排序学习方法,可以充分考虑扩展词与原始查询的相关性,改善单一扩展加权不精准的问题。实验结果表明,基于排序学习的查询优化技术能有效提升生物医学领域信息检索效率。针对2017年TREC评测任务,搭建了面向治疗方案的临床医学检索系统。精准医学旨在利用基因组信息为患者寻找更有效的治疗方法。评测任务类似于为患者确定临床诊断的问题,评测重点在于为可能影响治疗选择的遗传变异的癌症患者提供临床决策支持。该方法根据任务的针对性,在对数据集和主题进行特殊处理的基础上提出了一种查询扩展的方法,并针对输出的结果进行过滤实现二次排序输出。实验结果表明,改进查询并过滤结果的方法能有效检索生物医学文献和临床试验。利用深度学习进行查询扩展的技术研究,提出了一种利用深度学习的分布式向量表达构造扩展词特征的方法。该方法在基于排序学习的基础上,改进扩展词相关性标注策略,利用词向量构造特征,加强文档与查询的相似度表达,用于扩展词排序模型的构建和优化。经过验证,该方法在TREC公开数据集上有着较高的准确率,对于深度学习在信息检索领域的研究有着重要意义。本文研究工作面向生物医学领域信息检索问题,主要针对查询进行优化,通过排序学习算法、深度学习模型、生物医学领域资源等条件对查询进行扩展,有助于更准确地理解用户意图,提高检索效率。
其他文献
向量优化理论在交通运输、经济金融、资源分配等领域均得到了广泛的应用.解的存在性问题是向量优化问题研究的基本问题.本文主要研究几类向量优化问题解的存在性.本文具体内
声强是表征声场的一个重要物理量,其方向向量含有声源的方位信息,在水声、室内定位、噪声控制中都有广泛应用。利用声强估计方法,通过麦克风阵列可以实现对目标声源方位的估
本文致力研究扇形微带腔体天线中分数阶谐振模式的性质,尝试利用单个腔体中的一个或多个分数阶谐振模式,综合设计具有不同辐射特性的天线,包括平面准各向同性天线和宽带贴片
本论文采用杂草样方法调查了辽宁省大豆田杂草的发生情况,采用田间小区试验法研究了播后苗前土壤处理除草剂对大豆田的防除效果和安全性,筛选出80%乙草胺·异噁草松乳油可有
背景:肿瘤内高间质压力严重阻碍了纳米药物在肿瘤血管处的对流及其在肿瘤间质内的转运,导致纳米药物通常只能到达肿瘤边缘的癌细胞,而肿瘤中心区域的大多数细胞得不到治疗。考布他汀A4磷酸酯(combretastatin A4 phosphate,CA4P)可以破坏肿瘤已存在的血管系统,导致肿瘤血管塌陷,从而引起肿瘤中心大面积坏死。二者联合有望起到内外协同抗肿瘤的作用。目的:在Walker 256乳腺癌荷瘤
本文旨在研究G-布朗运动与相关过程的二次变差及其相关问题.首先,在G-期望框架下,令L为G-布朗运动B的局部时.我们证明了积分(0.1)存在,其中f为有界p-变差函数且1≤p
教育是立国之本,强国必先强教育,一直以来,发展教育都是世界各国尤为重视的一项工作,随着互联网的不断普及,教育的信息化程度也在不断发展。网络是教育信息化的基本载体,教育
随着互联网各种新技术的飞速发展,网络用户的数量与日俱增,传统网络架构结构臃肿、业务敏感性差的缺点日益暴露。软件定义网络(Software Defined Networking,SDN)这一未来网
透明和参与被认为是开放政府的应有之义,是良好治理的关键组成部分。其中,政府透明度指与政府政策制定和执行的过程和结果相关信息的可获得性。人们普遍相信政府信息透明有助于改进政府和公众之间的沟通,促进公民参与,是提升政府的合法性,改善政府政策制定的质量,遏制腐败的非常有效的行政改革策略。因此,自2006年以来,国际知情权(Rights to Know)运动发展迅猛,席卷全球。到目前为止80多个国家和地区
网络化控制系统(Networked Control Systems,NCS)是一种以网络为介质,形成闭环反馈的控制系统,是控制技术与现代网络技术相互结合的产物,其拥有低成本,低功耗,安装简单,维护便