论文部分内容阅读
随着计算机应用的广泛普及以及互联网技术的飞速发展,人们可共享和利用的信息资源越来越丰富,目前面临的关键问题是如何帮助用户从这些丰富的信息资源中获取所需要的有用信息。自动问答是一种使得人们能够更加快速、准确地获取信息的新的手段。目前的问答系统大多是基于开放领域进行研究,效率和效果都不尽如人意,它只是单纯的对字符序列进行检索匹配,经常不能返回准确的答案,其根本原因在于它的技术仅仅停留在文字表面,没有对信息资源进行一定程度的语义理解。本体(ontology)作为一种能在语义和知识层次上描述信息系统的概念模型建模工具,能有效地表达领域知识深层次的语义信息,是跨越“语义鸿沟”的桥梁。因此,利用本体组织和描述特定领域知识,将原有的数字化信息资源作为重要的知识源,经过加工处理,构建特定领域本体,将领域信息资源组织成具有语义检索功能、提供知识服务的智能知识库,在此基础上建立受限领域的问答系统,是一种有效的解决途径。因此本文选择医学领域进行面向肝病问答系统的本体分析和构建技术研究工作。
本文建立的本体分为两部分:顶层语义框架和肝病应用本体。顶层语义框架在较高的层次上归纳了所有的医学概念语义类别和语义关系,它可以指导应用本体的构建,同时也为已有的不同应用本体之间的集成和映射提供了支持。应用本体结合问答系统的需求,用本体来描述和组织肝病相关的知识,以提供对医学常识问答库、信息抽取、答案匹配等应用系统的支持。
本文的主要工作概括为以下四个方面:
(1)总结、分析了国内外学者关于本体构建的相关理论和技术。包括:本体的定义、本体描述语言、本体的构建原则、本体的应用,以及本体在未来语义Web中的地位和作用等。
(2)分析了现有医学领域本体的概况,重点研究了两个大型医学领域本体UMLS和GALEN利用本体描述和组织医学知识的方式和特点。
(3)分析了医学领域知识的特点,提出了医学领域本体的项层语义框架,高度概括医学领域概念所属的语义类型,提取语义类型之间可能的语义关系,通过语义类型之间的语义关系来反映概念之间的语义关系。
(4)在分析肝病问答系统对本体中领域知识的检索需求的基础上,建立面向肝病问答系统的应用本体。在应用本体的构建中,对属性的描述借鉴了GALEN组合概念的思想,采用类似于GALEN元框架(Aspects)的结构来表达。该本体在Protégé-2000的平台上开发,并采用基于描述逻辑的OWL语言来表示,利用Protégé-2000的插件Queries来提供对本体知识的检索服务。