基于相似度与上下文偏好的RDF查询松驰方法研究

来源 :东北大学 | 被引量 : 0次 | 上传用户:gdtk88
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
语义Web是对下一代Web形态的新设想,作为当前互联网的延伸,语义Web的目标是使网络应用更加智能化和自动化,能够让机器“理解”Web上的信息,从而更加高效地检索信息。作为语义Web的知识载体,RDF(ResourceDescription Framework,资源描述框架)的出现使得语义检索成为可能。随着RDF数据规模和复杂程度的迅速增长,对于RDF查询的需求越来越多,同时难度也越来越大。  当前,在RDF本体查询中,一方面,异构的本体结构和复杂的本体查询语言往往造成用户的认知困难,即使用户明确自己的查询意图,常常由于不能为查询提供正确的查询模式而导致查询返回结果为空或少量的情况,此时用户希望系统能够修正查询模式或者自动放松查询限制条件(即查询松弛),以提供近似匹配的查询结果;另一方面,在松弛过程中可能面临多条松弛路径和经过查询松弛后的多查询结果问题,此时用户又希望系统能够对松弛路径以及查询结果自动排序,避免信息过载。  为此,本文提出基于相似度和上下文偏好的RDF本体松弛方法。首先,针对返回结果为空或少量的情况,提出RDF查询松弛的方法,通过基于RDFS蕴涵规则和领域偏好的松弛方法对初始查询模型进行松弛重写,在松弛过程中构建查询松弛树模型,根据不同的松弛路径得到更多查询结果。然后,针对多松弛路径以及松弛后的多查询结果问题,本文提出了面向RDF的语义相似度和上下文偏好的模型,通过对松弛查询模型语义相似度和松弛重写规则上下文偏好程度的定量表示,进而对松弛路径进行加权排序以提供多松弛路径和多查询结果排序方法。当查询到来时,根据对应元组的语义相似度以及对应松弛路径上松弛规则的上下文偏好,利用这些代表性排列为当前查询快速提供top-k个结果元组。最后在提出的查询松弛策略的基础上,给出了查询松弛算法设计,并且通过一个简单的原型系统,验证了本文所提出方法的可行性,同时通过与现有RDF查询松弛方法的比较,说明了本文所提方法在松弛步数、查询响应时间以及查全率方面具有优越性。
其他文献
近年来,云计算不论是在国内还是在国外都受到了越来越多的关注。而Hadoop则被认为是当前主流的、使用最广泛的云计算开源平台。作为Hadoop的首选底层存储系统,HDFS(Hadoop Di
面向服务的体系架构(Service-Oriented Architecture, SOA)已经成为分布式软件系统架构的主流趋势。Web服务(Web service, WS)是SOA的主要实现方式之一。由于Web服务存在于开
负载均衡是服务器集群化中最为重要的环节,与负载均衡技术发展早期相比,现代负载均衡所面临的外部环境发生了许多变化,其中最为重要的两个变化是:1)计算机处理器从单核变为多核;2
随着3G应用的逐步推广,应用软件的主流平台正在由个人电脑向手持智能终端转变,随之而来的是软件平台的移植,软件的功能没有发生大的变动,改变的只是较少的几个模块,针对新的
在数据中心和云计算架构中,虚拟化技术在资源管理,服务器整合,提高资源利用率等发挥了巨大的作用。在虚拟化环境中,如果要保证高资源利用率和系统性能,必须有一个高效的内存管理方
随着IT行业竞争的日益白热化,如何提供更好的互联网应用服务成为业界关注的重点。正是在这种背景下,出现了基于IMS多媒体通信终端系统,它不仅方便了企业的远程通信,而且极大
随着集成电路工艺特征尺寸的不断降低,工艺偏差、串扰和电源噪声等导致了电路中存在大量的小时延缺陷,如何选择出合适的测试通路集合检测出这些小时延缺陷导致的电路时延失效是
随着半导体技术的不断发展,越来越多的核将被集成到同一块芯片中,以获得更高的计算能力同时降低整体功耗。传统的点对点和基于总线的通信机制并不能满足迅速增长的多核芯片内
随着信息技术的发展,企业对IT服务的依赖日趋增强。在这种趋势下,英国政府在20世纪80年代末制订了ITIL标准。ITIL为企业的IT服务管理实践提供了一个客观、严谨、可量化的标准
近年来,国内电力企业纷纷对信息化管理系统进行了整合。在整合重塑的过程中,一个显著的特点是以国际套装软件代替了定制开发。套装软件进入中国市场较晚并且投资巨大,因此,国内的