分布式RDF图查询方法研究

来源 :华中科技大学 | 被引量 : 0次 | 上传用户:skywateren
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着资源描述框架(Resource Description Framework,RDF)成为描述知识图谱、图数据等数据资源的统一描述标准,RDF数据的规模急剧增加。在单机上查询大规模RDF数据性能受限,难以满足用户的需求。因此,分布式处理大规模RDF数据成为研究的热点。分布式处理RDF数据首先面临的挑战是如何合理均衡地将数据分发到各计算节点上。广泛使用的集中式划分所能处理的图数据规模有限,不能处理RDF大图。其次,由于RDF图的强关联性,需要考虑在保证平衡划分的同时提升查询效率,从而高效地查询分布在各节点上的各RDF子图数据。针对集中式划分方法的性能瓶颈,提出一种基于随机游走的分布式图划分方法。首先,该方法通过本地进行分区状态更新,以交换不同分区之间顶点信息的方式代替边的实际转移,减少了划分过程中的通信开销。其次,针对不同的分区访问同一条边时会产生冲突的问题,提出通过计算顶点之间的近似随机游走值来确定边的最佳目标分区的方法,实现对分区的边界的动态调整,提升划分质量。针对查询优化的问题,提出了保证中间结果完整性的查询分解方法及面向中间结果削减的连接处理方法,减少了分布式查询中的网络通信开销,进而缩短查询处理时间。实验表明,基于随机游走的分布式图划分方法拥有良好的可扩展性。相较于已有的RDF划分方法,该算法在数据划分及查询方面都表现出更好的性能。在数据划分方面,在十亿规模的数据上相比其它算法划分速度提升了12.8%,并且数据冗余率不超过145%。在数据查询性能方面,就自动化构建的数据集LUBM而言,综合多个查询的时间与对比划分算法比较减少了5%以上。
其他文献
<正>数学概念一般都抽象难懂,对于以直观形象思维为主的小学生来说理解起来非常不容易。在教学中教师要基于学生的年龄特点和生活经验设计教学活动,引导学生亲历概念的建构过程,促使学生理解概念本质,使学习真正发生。“三角形的内角和”是人教版四年级下册的教学内容,是在学生认识了三角形的基础上进行教学的,是进一步研究平面图形性质的基础,是对三角形从感性认识到理性认识的一次提升,是对几何图形从外在特征认识到内在
期刊
文本分类是自然语言处理中的一个重要任务,在文本相似性分析、问句匹配以及自然语言推理等应用中都发挥着重要作用。新闻分类是文本分类中一个热点问题,受到了研究者们的广泛关注。新闻文本因其结构层次的差异性、标签种类的多样性以及高质量标注样本数量的有限性,相比于普通文本,在分类处理上更加具有挑战。通过分析新闻分类中的难点,以卷积神经网络文本分类模型与长短期记忆网络文本分类模型为基础,提出一种基于层次语义与先
学位
新课程改革背景下,要求教师发挥数学课堂育人价值,促进学生核心素养的发展。基于此,教师要重视数学活动、变式训练、思想点化的作用,创新课堂教学模式,发展学生的核心素养。
期刊
跌倒是全球第二大意外伤害死亡原因,在跌倒后及时进行救治,可以极大地减少由意外带来的伤害和损失。传统的跌倒检测方法主要基于可穿戴设备或光学设备,在使用场景或舒适性上受到了很多的限制,而利用无线信号的信道状态信息(Channel State Information,CSI)可以实现无接触的跌倒检测。近年来,虽有许多工作提出了基于CSI的无接触跌倒检测方法,但是这些方法容易受到环境变化的影响,在部署至新
学位
脊柱生理曲度和侧弯是脊柱畸形评估的关键指标,在临床诊断中往往需要对受检者进行X光片拍摄后由医生手动进行指标测量,具有一定的危害性和不确定性。使用深度相机捕获人体图像,并开发一套脊柱畸形检测系统,能够帮助医生快速、准确、无害、高效地诊断脊柱畸形。运用深度学习和图像处理相关技术,设计并实现了一套脊柱畸形检测系统。该系统使用Kinect相机采集人体背部表面的深度图像和彩色图像,采用区域生长的方法提取人体
学位
<正>《数学课程标准(2022年版)》指出:“数学在形成人的理性思维、科学精神和促进个人智力发展中发挥着不可替代的作用。数学素养是现代社会每一个公民应当具备的基本素养。”为有效地提升学生的数学素养,转变学生的学习方式,让学生进行审辩式学习是一种有效的途径。穆传慧老师对审辩式学习进行了系统研究,从一个中心、两个理念、三类素养、四种思维、五学课堂、六项评价等维度进行有理念、有工具、有正确价值观的结构性
期刊
信息物理系统是一种以传感器作为终端设备,感知外部坏境变换,并针对外部环境变化做出响应的计算机系统。在一些特殊场景中,系统所监视的外部对象具有可容忍响应时间属性。一旦所监视对象的状态发生了改变,系统需要在可容忍响应时间内,完成对于此变化的响应。例如,一旦高压电线路中的电压超过额定值,高压电监控系统需要在10毫秒内完成断电操作。现有信息物理系统响应时间控制策略均以降低系统平均响应时间为设计目标,不支持
学位
随着互联网时代信息体量的爆炸式增长,投资者难以快速从海量的金融新闻文本中获取有价值的投资信息。论文以金融新闻文本为研究对象,对事件抽取技术展开了深入地研究,构建了一个面向金融领域的新闻事件抽取系统,以便帮助投资者从海量的新闻文本中快速获取上市公司事件信息。主要的研究工作如下:提出了基于注意力机制的联合事件抽取算法。该算法使用ERNIE与BiGRU作为共享编码层,通过序列标注的方式识别出触发词之后,
学位
近年来,图神经网络由于其强大的表征提取能力在包括推荐系统在内的许多领域得到了广泛应用。目前,一些基于图神经网络的推荐算法利用评论等辅助信息在一定程度上改善了评分稀疏的问题。但是,现有算法很少关注评论中多方面的评价信息,通常从文档级别的文本中提取用户和物品的表征,难以准确捕获细粒度的特征。仅使用标点符号对评论进行分割无法准确提取不同方面的评价信息。一方面,使用标点符号粗分后的短句中仍可能存在不同方面
学位
随着操作系统国产化的不断推进,依托开源生态,涌现出了大批以Linux为内核的国产操作系统。而目前Linux上的图形用户系统基本都是以X架构为主,由于X架构上的一些缺陷,导致国产操作系统中基于X的图形显示系统存在系统占用资源高、渲染效率低下等问题。为提升国产平台的人机交互显示能力和系统整机效能,以国产嵌入式Linux操作系统和龙芯3A系列处理器为平台,设计并实现了一个基于Wayland协议的轻量级图
学位