论文部分内容阅读
我国是人口数量庞大的国家,相伴而生的,我国也是医患关系数量庞大的国家。随着国家全面步入小康社会的步伐,随着国家保障和改善民生的脚步,随着人们生活越来越好,人们关注的目光已经从温饱转到了健康。但即便国家的扶持力度很强,还是基于人口众多的国情限制,医疗设施医疗服务的水平赶不上老百姓看病的需求。纵观我国各类疾病,处于发病率于患病率的角度,我们选择了消化系统疾病诊断领域来作为本文的研究对象。本文以本体的理论知识为指导,参考各类医学文献与医用字典为消化系统疾病诊断知识建立了一套本体框架,并进行了基本填充,技术上提出了消化系统疾病诊断知识文本检索的技术框架,包括消化系统疾病诊断知识本体模型,消化系统疾病诊断知识本体模型的表示方法,消化系统疾病诊断知识领域概念的扩展方法,文本库中文本的关键词的自动获取,以及结合关键词检索与检索词权重的检索排序方法,设计并实现了消化系统疾病诊断知识检索体统。借助消化系统疾病方向相关医学文献与医用字典利用本体理论对该领域归纳整理了消化系统疾病诊断知识本体模型、消化系统疾病诊断知识的知识分类本体模型和消化系统疾病诊断知识的知识用户本体模型,提供了消化系统疾病诊断知识方面完备的本体构建。用两种方式将构建的本体模型形式化表示出来,分别是OWL语言的方式和冯洛诺伊图的方式。分别以定性与定量的角度对领域概念进行推理。计算机在处理本体文件时用Jena解析本体文件不仅可以将与用户数输入的检索关键词匹配的资源提取出来,同时可以通过用概念间的距离计算概念相似度来保留相似度合理的领域概念,从而完成领域概念的纵向扩展。通过同义词词典WordNet来对经过纵向扩展的领域概念进行同义词扩展,找出领域概念的同义词,完成对领域概念的横向扩展。为了更好了进行检索,我们对扩展的领域概念赋予不同权重。为了更便捷的处理文本库中的文档,我们应用TF-IDF算法来对放入文本库中的文档进行关键词的自动提取,并将提取的关键词和其权重建立到倒排索引中。为了返回给用户更加契合需求的结果,我们将扩展的领域概念权重与关键词索引方法结合,更加合理化的提供检索结果的顺序。概括本文的检索过程,主要分为消化系统疾病诊断知识领域本体的建立,领域概念的扩展,文本库文本的处理和检索过程四个部分。本文的研究对消化系统疾病诊断知识的检索的开发设计具有一定得借鉴意义,通过构建不同的领域本体,还可以将检索的框架应用到其他的领域中去。