基于参考点的大规模本体扩散映射算法研究

来源 :中南大学 | 被引量 : 0次 | 上传用户:miaoloveyun
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着异构本体的规模不断增大,当前的本体映射算法在处理大规模本体时会遭遇严重的效率问题。目前针对大规模本体映射大多采用先分块,再在分得的小块间进行块内映射。但是,对大本体进行分块,以及对相关小块的映射操作会增加很大的开销,并且分块比如会造成一定程度的语义缺失。本文将从参考点出发,充分利用已有映射信息,寻找一种高效的针对大本体的映射算法。   首先,论文简单介绍了课题的研究背景,总结了大规模本体映射相关技术的研究现状。   其次,采用概念类型技术,设计了参考点自动查找模块,通过该模块快速获得参考点(在名称上相似的概念)。利用访问局部性原理,设计了带冲突避免的扩散映射算法。该算法采用单边标记策略,选取待映射本体中的其中一个为基准,首先比较参考点附近的邻居概念,根据邻居概念的映射情况检查参考点是否为错误映射,且映射的邻居概念成为新的参考点并标记。然后对新的参考点迭代进行扩散映射,直到找不到新的参考点为止。   再次,在扩散映射过程中,参考点附近的邻居概念构成候选映射集合,设计集合内映射算法:以两个候选映射集合为向量空间,构建虚拟文档,把每个待映射的概念表示成向量形式,根据两待映射概念的向量夹角余弦计算二者的相似度。该方法能充分考虑概念所处的语义环境,去除形同义异的概念和发现义同形异的概念。   最后,设计实验,对比分析,显示本文算法拥有以下特点:1.本文支持参考点的自动生成;2.扩散算法把候选映射概念集始终限制在参考点附近,极大的减少了映射的时间复杂度;3.扩散算法支持1∶n映射;4.基于结构相似度的参考点检测算法能消除由自动搜索参考点模块产生的在名称上相似而实际不相似的错误参考点对;5.带冲突避免的映射操作能同时提高映射效率和质量。
其他文献
人脸识别是图像处理、模式识别和计算机视觉领域中极富挑战性的研究课题之一。现有的人脸识别系统在较好的采样条件下能够取得较好的识别精度。但是在条件不理想(图像分辨率
稳定电网电压和无功补偿是近几年电力系统研究的热点问题之一,如何将稳定电网电压与无功补偿相结合是其中重要的技术研发课题。当前,同时进行稳定电网电压与无功补偿的理论发展比较成熟,但实际应用尚需实践。本论文研究同时稳定电网电压和进行无功补偿的综合控制技术,设计和实现了一套既能控制磁阀式可控电抗器又能控制并联电容器组的磁阀式可控电抗器控制系统。该控制系统控制磁阀式可控电抗器产生感性无功功率,控制并联电容器
缺点和不足,即基于关键字的信息检索系统无法保证用户查询的高质量反馈的问题,本文通过对语义检索和本体技术进行研究,将它们引入到信息检索领域中,从而构建基于本体的语义检索系
在动态、开放和个性化的网络平台上,软件容易受到环境变化和用户需求改变的影响。系统管理人员为维持软件的正常运行,对软件系统进行的管理维护负担日趋繁重,如何使软件系统具有
汉语分词作为中文自然语言处理研究的基础性工作,在中文信息处理中扮演着重要的角色。随着中文信息处理的发展,特定领域汉语分词的需求增大。但是由于特定领域分词标注语料匮
随着互联网用户规模的不断增长和网络服务内容的急剧膨胀,内容加速技术得到了广泛应用。内容分发网络CDN(Content Delivery Network)技术作为内容加速技术中最为有效的方式之一
自2012以来,MOOCs(Massive Open Online courses)在全球范围内迅速发展,MOOCs为了适合人们在网上学习,把学校中的课堂碎片化,移植到互联网环境中。MOOCs改变了现代教育的方式
细胞代谢是一切生命活动的基础,代谢网络中的生物化学反应之间的相互作用维持了细胞的新陈代谢。生物代谢网络是一个动态的、有序的网络,代谢网络的失衡则会导致众多疾病的发
关系数据库用来存储结构化数据,并使用SQL语言对数据进行查询,这种方式需要用户掌握这种语言的语法以及数据库的模式知识,因此对用户来说门槛比较高。而互联网上信息检索常常
数字家庭是以计算机技术和网络技术为基础,通过有线网络或无线网络将家庭中的各种通信设备、计算机设备、家用电器、安防设备等连接在一起,提供集成的数据、语音、多媒体、控制