论文部分内容阅读
如今国内外许多学术团体都在进行Ontology的研究,然而大部分Ontology的构建是手工或半自动的,都需要人工参与Ontology的建立。如何自动构建一个Ontology系统是当今计算机科学领域的研究热点,也是难点。目前国内外关于Ontology自动生成的相关算法还不是十分成熟,为了进一步提高Ontology构建的自动化程度,本文选择了前沿性的研究课题——Ontology自动构建中实例学习和关系学习的研究。
Ontology自动构建中的实例学习是用算法学习出Ontology的组成元素——实例。通过阅读大量的相关文献,作者发现国内外还没有发表实例学习的相关文章,通过分析当前较流行的Ontology半自动构建平台text-to-onto的原型系统,发现该系统运用模式匹配方法学习实例,但是学习出的实例数量少、准确率低。因此,作者改进了该系统的实例学习算法,并命名为基于模式匹配的实例学习算法。实验表明,基于模式匹配的实例学习算法在学习出实例的数量和准确率方面均优于text-to-onto系统。基于模式匹配的实例学习算法中的实例模式必须人工定义,并且耗时耗力。为此,作者设计了一个基于模式自动学习的实例学习算法,该算法能够自动的学习出实例模式并运用模式匹配算法进行实例学习。实验表明,基于模式自动学习的实例学习算法在学习出实例的数量和准确率方面与基于模式匹配的实例学习算法效果一样。
关系学习是用算法学习出Ontology的组成元素——关系。通过调研发现关系学习在学习出关系的数量和准确率方面还有待于进一步的改进。本文设计的关系学习算法包括:基于WordNet的关系学习算法,基于模式匹配的关系学习算法,基于模式自动学习的关系学习算法和基于关联规则的关系学习算法。实验表明,基于模式匹配的关系学习算法比text-to-onto能学习出更多的关系,并且准确率更高;基于模式自动学习的关系学习算法克服了基于模式匹配的关系学习算法中关系模式需要人工定义的不足,并且能够比基于模式匹配的关系学习算法学习出更多的关系。基于WordNet的关系学习算法和基于关联规则的关系学习算法丰富了关系学习,并且使关系学习更具灵活性。
北京工业大学多媒体与智能软件技术北京市重点实验室与日本SORUN公司合作开发了一个Ontology自动构建平台——OntoAGS,本人作为该平台的核心设计和开发人员,完成了实例学习模块和关系学习模块等核心模块的研发。Ontology作为一种语义和知识层次上描述信息系统的概念模型建模工具,具有广阔的发展前景和应用价值。