RDF数据集上的why-not问答技术研究

来源 :东南大学 | 被引量 : 0次 | 上传用户:zzw200512168
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近年来,互联网上产生了大量的RDF数据,并且形成了许多以RDF数据为知识单元的大规模开放知识库或者垂直领域知识库。为了发挥RDF数据的实用价值,基于知识库的查询回答技术逐渐成为人工智能和数据库领域广泛的研究热点。然而,在人们热衷于提高查询回答技术的质量和效率时,很少有人针对查询回答系统在无法得出好的结果时给出合理的解释。特别地,当查询回答系统返回的查询结果中缺失了用户期望的结果时,系统自身无法提供一种解释机制来告诉用户为什么他们期望的答案没有出现在结果集中,因此用户只能通过修改查询条件进行不断的试错来探索原因。由于RDF数据具有和关系表不同的数据结构,并且具有更加丰富的结构和语义信息,导致现有的基于关系数据库的解释模型无法直接用来处理RDF数据上的why-not问题。针对上述问题,本文提出一种统一的基于图匹配的解释框架,并采用贪心搜索和模拟退火两种近似策略来计算解释,为处理用户在RDF数据上针对基本图模式的SPARQL查询提出的why-not问题提供了高效的求解算法,从而满足用户更高层次的信息需求。具体而言,本文的主要工作以及贡献包含如下几点内容:(1)提出了一种统一的基于图匹配的解释框架,将RDF数据上的why-not问题转换成一个图匹配的问题。并且根据查询分解方式的不同,分别提出星匹配和路径匹配两种方式来计算解释。此外,在匹配的过程中引入了一种相似度评分机制,充分考虑了查询和数据模式之间的结构和语义信息,从而保证生成尽可能合理的解释。(2)针对两种图匹配的算法分别提出了贪心搜索和模拟退火两种近似策略,从而避免在使用图匹配求解why-not问题所面临的指数级复杂度。虽然通过近似求解策略可能会降低问题的解的准确度,但在很大程度上可以提升算法的效率。(3)实现了本文提出的算法,并在大规模开放数据集上通过实验分析了图匹配算法的效率,以及计算出的解释的合理程度。实验结果表明,本文提出的算法相比现有最好的工作更加高效,并且能提供给用户更高质量的解释。
其他文献
流量工程算法在传统网络中已得到广泛应用,SDN的全局视图有利于实现更为高效的流量控制和网络管理策略,同时也面临着一些新挑战。控制器对数据流的集中管理可能成为网络性能
随着理论研究的不断深入和雷达信号处理技术的不断提升,目标各向异性散射中心参数估计成为了雷达信号处理领域的一个重要研究内容。提取并分析目标回波中的散射中心信息可以
随着LTE-A系统的广泛应用,支持LTE-A的终端也开始进入市场。为保证终端符合协议一致性,需对其进行RRM一致性测试。RRM 一致性测试依据空中接口协议栈规范实现。3GPP协议对每
目前,定增的重要性和使用频率日益增加。国内学界对此领域的讨论以定性分析为主,本文则使用回归分析和事件研究方法实证研究其市场影响及相关因素。本文首先阐述了定增的发展
在哲学与自然科学领域之中的一个非常重要的研究课题就是智能本质研究。这个课题对于机器再现及智能模拟来说,很可能标志着一种新兴产业即将问世。智能本质极其复杂的特性让
国民安全是国家安全之本,环境安全是国家安全的重要内容,重视人的安全是维护国家安全的必然要求,也是践行以人为本的总体国家安全观的基本要求。雾霾问题作为当前我国最为严
双结构新型网络以传统的TCP/IP网络为主结构,添加了物理广播和内容存储相结合的“播存环境”作为次结构。为了更为准确地刻画资源内容特征和用户兴趣偏好,并向用户提供个性化
随着移动通信技术的飞速发展,如今的无线通信网络系统已经表现出相当高的复杂性。如何有效地对通信网络性能进行研究和评估已经成为当下移动通信系统研究中需要解决的重要实
第三代合作伙伴计划(The 3rd Generation Partnership Project,3GPP)组织于10年前开启长期演进(Long Term Evolution,LTE)计划项目,该方案采用多种新技术,通过引入新型资源调
软件维护是软件演化过程中必不可少的阶段,软件演化是指在软件系统的生命周期内软件维护和更新的动态行为,包括新功能的开发与软件整体的测试,其中最基本的元素便是软件修改