跨存储平台的SPARQL执行引擎研究

来源 :南京大学 | 被引量 : 0次 | 上传用户:lizq06
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着LOD等项目的发展、各大商业公司的推动,语义网上的RDF数据爆发式增长,人们迫切需要可以提供高效存储、查询RDF数据服务的SPARQL执行引擎。于此同时,传统关系数据库经过近40年的研究和发展,性能优化、安全、事务等功能趋向于完善,完全可以应对工业级的应用需求;随着大数据概念的发展,越来越多的NoSQL数据库涌现,这些NoSQL数据库打破ACID的限制,易于对系统进行水平扩展,应对更为复杂的应用需求。本文构建了名为SPONSON的SPARQL执行引擎,该系统可以根据应用场景不同分别复用文档型NoSQL数据库或关系型数据库作为底层存储。为了使用文档型NoSQL数据库作为底层存储,本文提出了基于主语划分RDF数据集的概念以减少查询处理过程中涉及到的连接操作,同时提出了基于统计的专门针对RDF数据的查询优化策略。为了协调RDF数据模型与关系数据模型的不一致,本文提出了基于布尔矩阵分解的RDF数据集分析框架,该框架统一了属性表和垂直划分这两种存储策略,在优化目标的指导下,寻找贴合数据集的存储模式。最后,本文将SPONSON中复用NoSQL数据库与关系型数据库的两个子系统与两个著名的SPARQL执行引擎(Jena-TDB、Virtuoso)在多个标准测试集上进行了全面、详细的性能对比,验证了本文所提方法的有效性。
其他文献
构件系统的动态更新需要构件间的动态依赖信息来判断构件何时更新才可以保证更新的安全性,而且动态依赖信息越精确,动态更新对系统造成的干扰越小。最近的动态更新技术使用事
与此同时,随着计算机电话集成(CTI)的发展和未来三网(互联网,电信网,有线电视网)合一趋势,计算机产业已广泛地实现了与电话技术的结合,计算机电话语音控制技术也日趋成熟,这
该文就网络的瓶颈问题分别从SSP和邻接局(包括SCP和与E-Cube相连的端局)发生过负荷时,E-Cube程控交换机在版本FSR216.3中对大话务量的控制方法及改进.智能网技术是改变传统的
兵器光电仿真系统由红外目标/场景产生子系统,探测/跟踪模拟子系统,运动模拟平台,仿真分析/评估子系统,仿真控制与形象化显示子系统构成。这些子系统通过计算机网络连接起来,运行时需
机器人视觉伺服问题是国内外当前研究的热点问题之一。由于它涉及到机器人、计算机视觉、控制理论等多学科内容,目前无论是在理论上还是在应用方面仍然存在很多难题,如特征选择
该文分析了传统电子银行业务系统身份认证中存在的安全隐患和可能带来的重大安全问题.为了解决这一问题,该文提出了一个安全模型,根据安全模型我们设计出了一个基于令牌的安
本文在分析目前该领域研究状况的前提下,结合数据安全和密码学的相关技术,提出了一系列算法和策略,尤其是针对FGS可扩展压缩视频流的具体特点。设计的目标是满足目前的网络多媒
该文在国内外相关研究的基础上,重点探讨了多代理协同体系结构、协同控制策略、协同设计的方法,并基于AutoCAD实现了一个协同设计系统.该论文的主要研究工作有以下几个部分:
该论文首先分析了NO.7信令如何与IP网进行互通,其次对信令网关作了详细的论述.然后,论文对设计的信令网关仿真器作了详尽的分析与解释,包括SIGTRAN协议栈、硬件配置等.SCTP是
该文是基于应用在战役后勤指挥作业车组中的综合业务信息系统的具体要求未讨论的.系统要求满足训战一致,平战结合的要求,需要整合大量的数据,因此需要解决数据一体化的问题.