论文部分内容阅读
云计算是一种新兴的计算模型,它的出现为教育信息化提供了新思路,对建立灵活的资源共享平台,解决我国高校计算机实验室建设中存在的资金重复投入大、资源利用率低、维护难度高等问题有着重要意义。本体是共享概念模型的形式化规范说明,随着语义Web的迅速发展,本体被越来越多地应用在很多新的领域,为领域间的实际应用提供便利。我们课题组主要是希望通过本体技术为底层来实现教育云资源在网络上的共享,搭建成一个智能的按需分配资源的虚拟计算机实验室。本文的研究是该课题的主要部分,主要是对领域规范化并带有语义信息的本体进行研究,研究内容为如何构建领域本体,以及如何计算这些领域本体间的相似度,从而达到预期的匹配目标,以便实现最大限度的利用教育云平台上存在的资源。 本文首先分析了国内外云计算在教育领域的应用研究现状,分析并指出当前我国高校计算机实验室建设所面临的问题,提出一种基于云环境的虚拟计算机实验室架构。同时,系统地介绍了有关本体的一些基础知识,包括本体的定义:RDF、OWL等本体描述语言;本体的构建方法以及如何使用Protég建立本体,使用Jena解析本体等,为本体匹配的研究打下了基础。 然后,系统介绍了与本体匹配相关的基本技术,列举了基于语言学、结构、实例等的本体匹配方法及其相应的匹配工具,分析得出本体匹配的关键在于实体间语义相似度的计算。同时,这些经典匹配工具基本上都采用了混合的匹配方法,使用了字符串匹配算法;在计算过程中还在一定程度上借助了Word Net等语义词典的支持。基于以上的思想,本文展开了针对教育云这个特定领域的本体匹配算法的研究,我们定义了一些需要使用的术语和公式,在此基础上提出了一种改进的本体匹配算法,并对算法给予了基于公式的形式化描述。在该算法中,首先,综合了字符串编辑距离思想和WordNet知识,从字形和字义两方面分别计算实体间的相似度,然后将它们的相似度加权综合得到本体间的语义相似度。包含的主要子算法如下: 1.本体预处理算法:使用Jena工具完成对OWL文档的解析,抽取出本体的所有实体,并根据本体预处理算法4.1对实体名称进行标准化处理。 2.基于字形的相似度计算:采用基于编辑距离的相似度算法计算实体间的字形相似度。 3.基于字义的相似度计算:采用基于WordNet的相似度算法来计算实体间的字义相似度。这个算法在Wu和Palmer算法的基础上,从改变WordNet定位因子和从合成词组中找出核心词汇方面对其进行了改进,提高了相似度计算的精准性。 4.相似度合并计算:通过定义的公式和领域专家给出的阈值来合并上述计算得出的字形相似度和字义相似度,从而计算得到两实体最后的相似度值。 最后,用原型化方法建立了两个简单的领域本体,并使用我们改进的算法对这两个本体进行匹配实验与分析,在此基础上就接下来在广州市萝岗区云教育平台上通过本体技术实现VCL资源配置的下一步研究工作做了简要说明。