论文部分内容阅读
随着网络资源的爆炸式增长,如何从海量信息中快速准确的发现信息,成为迫切解决的问题。目前的搜索引擎采用基于传统关键词或文本内容的检索方式,不能充分表达语义信息,存在着“忠实表达”、“词汇孤岛”等弊端。为了解决该问题,应将搜索从关键词层面提升到语义层面,充分考虑信息间的语义关系,实现信息的语义搜索。本体(Ontology)即共享概念模型的明确形式化规范说明,具有良好的层次结构和逻辑推理能力,提供特定领域的公认概念及概念间的关联关系。本体支持知识重用、共享和建模,能够被计算机很好地理解。本体作为语义Web的核心技术,对语义搜索的研究与实现具有举足轻重的作用,备受关注。本文首先介绍本体的概念模型、描述语言、分类和功能,分析本体构建的准则、方法和工具,探讨了搜索引擎的概念、分类和工作原理,以及实现语义搜索的相关技术,提出以信息安全领域的文献为对象构建文献领域本体,即文献本体和概念语义词典本体,详细叙述这两个本体的构建过程,基于本体推理机制定义了相关文献的推理规则。最后,针对基于文献领域本体的语义搜索引擎构建,研究了中文分词、概念相似度的计算和网页解析等技术。以此为基础,设计实现了一个基于文献领域本体的语义搜索演示系统,给出了实验结果与分析。与传统搜索引擎相比,基于文献领域本体的语义搜索引擎系统在查询结果上具有更高的查准率和查全率,且能够获得更多相关的隐含信息。