基于概念上下文的本体匹配算法研究

来源 :哈尔滨工业大学 | 被引量 : 0次 | 上传用户:forsanwang
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着互联网的快速发展和人们对信息需求的迅速增加,语义网(Semantic Web,又称语义Web)作为研究和处理海量信息的先进技术成为Web信息研究领域的主要目标之一。语义Web改进了传统Web的信息获取和表现形式,更为广泛且具体地利用了知识库,突破了传统Web中过度依赖文本字符串匹配的挖掘方法造成的瓶颈。本体(ontology)是语义Web体系中建立语义信息模型的核心部分,是一种利用信息化手段描述人们对客观世界认识的方法。然而,由于单一的本体没有办法对事物进行全面描述,也没有任何描述方法得到领域内的一致认可,导致存在大量意义相近但表示语言和表示模型具有一定差异的本体,这称之为本体异构问题。解决该问题的最有效方法是本体映射,其核心过程是本体匹配,即寻找两个不同实体间语义关联的过程。目前本体匹配算法的主要研究成果大多基于文本或基于结构,在应用中具有一定的不足。本文综合了基于文本和基于结构的算法特点,提出一种基于概念上下文的本体匹配算法。该算法核心思想是:构建文档的概念上下文结构,利用概念自身的信息及其上下文环境信息(包括逻辑限制和解释信息)建立虚拟文档,然后计算文档间的相似度,得到概念的最佳匹配对信息。文章最后在Eclipse+Jena环境下用Java语言实现基于该算法的本体匹配系统,利用OAEI2009标准测试用例作为数据源进行实验测试,获得本体相似度、准确率、召回率和F-Measure等性能指标,并与其他已知算法的实验结果进行对比。对比结果表明,相比于单纯基于文本和基于结构的算法,本文提出的基于概念上下文的本体匹配算法在计算效率和准确度上均有一定的提高。
其他文献
随着信息化的深入发展,政务信息资源扮演着越来越重要的角色,而政务公文作为政务信息的载体,正在快速地向电子化,无纸化的方向发展。如何更好利用政务公文信息资源成为了一个
随着当今社会互联网技术的快速发展,以及图像多媒体等设备的流行,越来越多的人开始在网络上发表、下载和共享图像资源,以图像数据为代表的多媒体视觉信息量日益剧增。因此,如
随着计算机和自动数据收集工具的应用,大量的数据已经被持续地收集和存储在数据库中,由此产生了从大量数据库中挖掘令人关注的信息的巨大需求。关联规则是一种从大量数据仓库
背景建模和文本建模分别是计算机视觉和自然语言处理两个人工智能领域关注的重点基础问题。这两个方向都是现今人工智能发展的前沿。背景建模旨在为视频序列生成一组稳定的背
随着信息技术的飞速发展,地球信息科学的研究领域不断扩宽、深度不断增加,这有力地推动了资源环境科学的信息化。然而资源环境模型的复杂化、多元化、大规模化也同样迫切需要
当前,健康问题已成为世界各国人民普遍关注的热点问题,将计算机技术与医学相结合,利用智能算法可以提高疾病诊断的速度和准确性。因此,计算机医学诊断系统已成为计算机技术在
企业应用软件系统是企业在激烈的市场竞争中生存下来的关键因素,业务构件是企业应用系统的软件实现,其开发过程存在着大量重复劳动,庞大的代码量影响着自身的快速重构能力。
家庭影院电脑的无线遥控器是当前嵌入式多媒体系统中的研究热点之一,本文在了解当前国内家庭影院电脑遥控器的基础上,设计了一种2.4GHz频率的USB接口遥控器。通过开发的驱动
在电子商务快速发展的今天,要求电子商务交易的双方有智能性、分布性、安全保护措施、自主性等等特性。利用多Agent系统框架来搭建自动电子商务平台是一个很好的解决方案。分
我国汽车产业和交通事业的迅速发展和车辆的普及化以及无线传感器网络的快速发展,对车辆性能检测提出了更高的要求。目前,有些地方无法实现车辆检测设备的安装和检测网络的建设