论文部分内容阅读
作为信息管理的进一步发展,知识管理对于提升企业竞争力具有重要意义。企业中存在的非结构化信息是重要的知识源,具有数据量大、增长速度快等特点。如何获取、管理并应用海量的非结构化信息中所蕴含的知识,是企业信息管理中一个亟待解决的问题。非结构化信息管理架构(Unstructured Information Management Architecture,UIMA)虽然可以整合多种非结构化信息管理技术对非结构化信息中的关键信息进行标注,但标注结果以实体为主,缺乏实体之间的关系,且与应用程序高度耦合,难以重用和共享。针对上述问题,本文在对UIMA规范和OWL标准进行剖析的基础上,提出了一种基于UIMA的知识获取方法KAMU。该方法首先对UIMA规范定义的基本类型系统进行扩展,然后对UIMA类型系统与OWL中的类和属性建立映射关系。实体标注被转换为OWL中的个体,而关系标注被转换为OWL中的三元组。KAMU中提出了一种基于领域本体的关系抽取算法,该算法根据本体中定义的关系模型来抽取实体间的关系。KAMU还支持通过一致性验证来发现并剔除知识获取过程中所存在的语义冲突,支持通过推理来发现隐含的知识。以KAMU为基础,本文提出一种基于UIMA的知识管理系统方案,并设计与实现了一个原型系统。该系统包括非结构化知识源管理模块、基于UIMA的知识获取与推理模块、OWL知识库管理模块。非结构化知识源管理模块使用元数据来对异构、分布的知识源进行统一管理;基于UIMA的知识获取与推理模块可从非结构化知识源中获取知识并以OWL表示,该模块还提供了推理工具,支持对本体进行一致性验证和隐含知识获取;OWL知识库管理模块提供对OWL本体进行版本管理、分组管理、分布式编辑等功能。在具体场景中的应用表明该系统是可行及有效的。与传统的知识管理系统相比,本文具有以下特点:(1)提出了一种基于UIMA的知识获取方法KAMU。该方法通过从UIMA的基本类型系统扩展而来的知识级类型系统KLTS,可将利用UIMA对企业海量非结构化信息进行处理的标注结果转换为以OWL表示的知识,具有较好的可扩展性、灵活性和适应性;(2)在KAMU的基础上,设计并实现了一个企业知识管理系统EKMS。该系统将基于UIMA的信息抽取与基于OWL的知识库管理有机结合,可实现对企业内分布、异构、海量的非结构化信息源进行统一管理、分析和知识获取,并支持分布式的本体构建和编辑。