论文部分内容阅读
Web已经成为当今网络信息的交换平台。随着Web上数据信息量的日益增加,如何让计算机能够理解数据的含义,帮助人们方便地查找“真正想要的数据”成为一个需要解决的重要问题。为此,Web创始人Tim Berners-Lee于1998年提出了语义Web的构想,它是当代Web的扩展,其中的信息被赋予确切定义(well-defined)的含义,使计算机可理解,从而更好的与人协作。为了实现这个构想,语义Web采用多层的表示框架,而本体位于文档描述和知识推理转折的层次上,因而本体的构建是实现语义Web的关键基础。本文在研究本体描述语言发展的基础上,进一步对本体建设的方法论进行深入研究,同时结合本体构建的三个基本方法,即人工构建、重用本体以及自动抽取的方法进行研究,尤其针对几种结构化半结构化数据的语义抽取方式进行分析,最后提出一种以人工方式为主,自动抽取方式为辅的混合方法。这种方法可普遍适用于目前的本体构建。本体构建的目的在于应用。在研究了本体构建方法之后,结合本体运用中的语义集成问题,阐述了语义集成的基本框架原理。在此基础上,针对嵌套的XML结构,在保持XML文档结构的前提下,设计了以XML为数据源,RDF作为本体模式的语义集成模型。语义网的研究正处于不断发展之中,期望本文的研究能够带来一点有益的经验。