RDF图的关键词查询算法研究与实现

来源 :郑州大学 | 被引量 : 0次 | 上传用户:qmhnfi77206
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
目前RDF数据集被广泛应用于各个领域,用户对于RDF数据的查询需求也再不断增加。然而目前已提出的基于RDF图的关键词查询方法无法实现对边上关键词的查询,而将RDF图转化为RDF二分图虽然实现边上关键词的查询但是增加图中顶点的个数从而影响查询效率;同时面对海量的RDF数据集,在集中式环境下查询存在存储空间不足和查询效率低下的问题。为了解决上述问题,本文对已有的关键词查询和图分割的方法进行研究,并提出基于索引的关键词查询方法,从而实现RDF数据的高效查询。本论文的主要工作包括:(1)为了同时实现RDF数据图中顶点和边的查询,提出双索引机制的RDF数据图查询方法。该方法首先将RDF数据转化为RDF图,利用RDF图的邻接标签矩阵,构建一个顶点索引和边索引,提高关键词的查询效率;其次通过字符串匹配方法确定关键词所在双索引的位置,根据两个索引的关系实现顶点和边的查询;最后采用相关性评测函数对查询结果子图进行相关性排序,并输出top-k个查询结果。(2)为了实现关键词的并行查询,提出RDF句子图的边分割算法,该算法采用多层次分割方法对RDF数据图进行分割。首先将RDF数据转化为RDF句子图,利用最小度数顶点算法对RDF句子图进行分割;其次,基于RDF句子图的边分割等价于对RDF图的顶点分割,从而获取分割后各个子图间的交集即为分割RDF图的点割集;最后,根据并行计算框架MapReduce实现关键词的并行查询。实验表明,本文提出的双索引机制的RDF数据图查询方法以及RDF句子图边分割算法的性能优于对比方法。
其他文献
随着科学技术的不断发展和进步,在最近十几年的时间里,计算机视觉和模式识别受到了更加广泛的关注,该学科的理论日臻完善,并且成功地应用到越来越多的领域。聚类分析是计算机
社会发展和科技创新离不开数学的应用,运算是运用数学的重要手段。数学运算作为一种基本能力在我国基础教育中历来备受重视。随着中国学生发展核心素养体系的确立以及数学课程改革的进一步推进,培养学生的“数学运算素养”被列入国家课程标准。运算素养的发展直接影响着学生数学学业水平的表现,并且对于其他学科的学习以及未来的职业表现也有着重要意义。然而,当前中学生在数学运算方面的表现却不尽人意。一线教师反馈学生在运算
本论文包含三个部分:源语文本、目标语文本和翻译报告。此次翻译实践的源语文本节选自《金融救火:危机与教训》由本·伯南克、蒂莫西·盖特纳和小亨利·保尔森三人合著。本书主要介绍了2008年金融危机的始末并详述了作者三人参与救市的过程。译者选取书中第二至四章作为此次翻译项目的源语文本,共包含16,664词。选定章节主要介绍了金融危机的大火如何蔓延至整个金融系统以及美国联邦政府出台的一系列援助几大金融巨头及
小电流接地系统在发生单相接地故障时,接地点残余电流较小,系统线电压仍保持对称,无需立即切除故障线路,使得系统供电可靠性大大提高。小电流接地系统以消弧线圈接地方式应用最为广泛,由于消弧线圈的存在,其产生的感性电流补偿故障线路的容性电流,使得故障点零序电流减小,甚至故障线路稳态信号幅值与方向发生改变,使得基于稳态信号的选线方法并不适用,这些都增加了故障线路识别的难度。若不能及时找到故障线路,排除故障,
自古以来,先辈们就已经知道了高下之势的重要性,如《孙子兵法》有云:“凡军好高而恶下……”朴素地言明高下位置对于军事战争的作用。实际上,在我们日常的商业活动中也有一些
教学优化算法(Teaching-learning-based optimization,TLBO)是一种基于群智能的现代启发式优化算法,该算法具有无特定参数、收敛速度快、易于实现且有效等优点。自2010年提出
随着LTE技术的飞速发展和4G网络的大规模部署,越来越高的运维支出使得运营商强烈希望用新技术来降低运营成本、提高系统性能,确保网络运行高效、安全、稳定。在此背景下,自组
近年来,有机半导体因其在场效应晶体管、发光二极管等方面的应用而备受关注。虽然基于此类材料的器件性能在不断提高,可是目前有机半导体无论在载流子迁移率,还是空气稳定性
英语写作是衡量语言输出的一项重要标准。对于大多数高中生来说写作既是重点也是难点。目前,他们的写作水平不甚理想。反馈是写作教学中不可或缺的一部分,在提高学生写作水平方面起着重要作用。对于学生而言,教师反馈是最常见且最易获得的反馈类型,近年来受到越来越多的关注。本研究旨在调查高中英语写作教学中教师反馈的实际情况,并探讨教师反馈对高中生英语写作的影响。有以下三个研究问题:(1)教师为学生的写作提供的反馈
当下网络已经成为人们生活的必要基础设施,随之而来的是海量的多样的个人数据被记录,例如个人资料,购买记录,评价评论信息,多种媒体形式的浏览历史等等。如何利用这些异构异