基于列数据库和图缓存的海量RDF管理

来源 :武汉科技大学 | 被引量 : 0次 | 上传用户:hgs26
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
Linked Data的发展带动了各领域以RDF格式开放领域知识库,由此带来了如何高效组织和管理海量RDF数据的问题。目前,基于关系数据库或NoSQL图数据库的存储模型,都不同程度地暴露了查询效率的问题。综合以上两种主流存储模型,本文提出了底层磁盘采用基于列的关系存储模式,并且在内存中构建RDF图模式的分布式存储方案。论文首先列举目前常见的RDF存储方式,分析了各自的优缺点,并论述了基于列数据库MonetDB和图模式缓存管理大规模RDF数据集的可行性,然后提出了系统架构:在磁盘上,基于MonetDB采用列式划分算法存储RDF数据集,同时,将部分RDF数据以图模式缓存在内存中;查询时,会优先查找内存,然后查找数据库,减少磁盘访问,提高查询效率。主要实现了以下几点:(1)基于列式数据库的RDF分布式存储;(2)内存中构建RDF图模型;(3)存储节点处理SPARQL查询的机制,包括缓存查找和数据库查询;(4)合并最终的结果集,并且提取出需要的数据;(5)通过开放数据集,验证了该模型在数据存储、查询方面的性能优势。
其他文献
随着虚拟现实技术的不断发展,碰撞检测问题越来越受到人们的重视,因为实时而精确的碰撞检测对于提高虚拟环境的真实性及增强其沉浸感具有重要的作用。虚拟手术仿真是虚拟现实技
列车轮对作为重要的可互换行走部件,对列车安全行驶起着关键性的作用。目前,我国列车轮对的参数检测仍停留在手工测量阶段,技术落后、工作效率低。而日本、美国等国在轮对自动检
企业为了在激烈的市场竞争中获得竞争利益,需要不断优化其生产、经营过程。企业过程的建模与优化是提高企业效益、增强企业竞争力的重要手段;企业资源是企业过程运行最重要的物
近年来,VoIP(Voice over IP)技术及其业务的迅速发展,对传统的电信业务造成了巨大的冲击。VoIP网络通过网关等设备,以PSTN作为用户的接入设备,用IP网络代替昂贵的传统传输网络,从
学位
H.264是ITU-T和ISO/IEC联合制订的最新国际视频编码标准,其中众多新颖的算法特性大幅度提高了编码性能,同时运算复杂度也较其他视频标准有巨大增长。如何尽量在保持H.264编码性
Internet网络的产生是一面双刃剑,一方面它使得人们可以更加自由地进行信息、知识甚至计算能力等资源的共享,另一方面,这也使得计算机系统安全问题日趋严重。基于网络的攻击行为
信息安全是信息化建设过程中不可回避的话题,在现代信息社会中,随着计算机技术和计算机网络的广泛应用,尤其是随着电子政务、电子商务应用及其平台的发展,这一问题也就显得更加迫
本课题的研究利用现场可编程门阵列( FPGA , Field Programmable Gate Array )集成度高,体积小,低功耗,高可靠性,可以在线调试等特点,和VHDL语言层次化的程序设计方法,设计灵
随着电子技术的发展,现代战争已由陆、海、空的三维立体战发展到陆、海、空、天、电磁多维的网络中心战。网络中心战通过传感器、决策制定者和射手的网络化,获取共享感知,增加指
供应链通过价值增值过程和分销渠道控制从供应商的供应商到用户的用户的整个过程,它始于供应的源点,终于消费的终点。采购过程是供应链中的重要活动。在采购过程中如何选择合适