基于通用部分求值的分布式知识图谱正则路径查询研究

来源 :天津大学 | 被引量 : 0次 | 上传用户:zhufutao2
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
目前,知识图谱已经成为人工智能技术的重要组成部分,拥有强大的语义处理能力和数据关联能力。作为知识图谱上最常见的导航式查询,正则路径查询在近些年被广泛研究和讨论,已经成为一个焦点问题。随着互联网的发展,知识图谱规模日益激增,采用分布式技术成为面对大规模数据的必然选择。部分求值技术已经应用于图数据查询的分布式处理方案,然而,基于部分求值的方法一方面会计算很多无效的部分中间结果;另一方面容易导致计算和通信的瓶颈问题。基于部分求值的思想,本文提出一种通用部分求值模型GPE,该模型采用一主多从的架构,包括分布式计算和集中计算两个阶段。进一步地,通用部分求值模型将分布式计算过程分为局部计算和从节点之间消息传递的一个交替序列,所有从节点并行执行,与此同时,通过模型参数k调控从节点间的通信次数。基于通用部分求值模型,本文设计了一种分布式正则路径查询算法GPERPQ,将正则路径查询转换为k(10)1次局部计算和k次消息传递的过程。进一步地,主节点与客户端相连,负责接收查询、查询解析、任务分发和集中计算;从节点之间基于Actor模型完成消息的接收、局部路径匹配和消息的发送。相比于部分求值,通用部分求值模型一方面缓解了集中计算时主节点的计算和通信瓶颈问题;另一方面通过带有通信的多次局部计算避免生成很多无效部分中间结果。同时,依据对算法代价的分析提出三种优化策略,包括顶点映射、边界点出边标签预判和中间结果选择,分别减少了本文所提算法的通信开销和计算代价。根据设计的正则路径查询,分别在标准数据集和真实数据集上进行大量实验,结果验证了本文所提方法GPERPQ在分布式知识图谱上进行正则路径查询的有效性。通过调整模型参数k可以使得查询效率提高一个数量级,达到通用部分求值模型通过增加少量节点间通信开销换取大量计算代价的目标,最终形成适合分布式知识图谱正则路径查询的有效方法。
其他文献
虽然深度神经网络模型在大量的应用场景中取得了引人瞩目的成果,但是这些高性能的模型却存在一个常见的问题,即过拟合问题。为了防止神经网络中出现的过拟合问题,研究者们提出了很多正则方法,如L1正则,L2正则,Dropout等等。受集成学习的启发,本文把神经网络中的隐藏层看成是若干个基学习器的集成。基于集成学习中评估和传统均方误差的偏差-方差-协方差分解理论,我们证明了评估均方误差中的方差项在防止模型过拟
19世纪中期,沙俄通过与满清政府签订《北京条约》,拿下了原属中国的海参崴,改名为符拉迪沃斯托克,俄语意思是"统治东方"。这是俄罗斯太平洋沿岸的深水不冻港。2019年2月,作者行走在这里,想寻找一点中国痕迹,却连最简单的"中国制造"都难觅踪影。
期刊
知识图谱近年来越发引人关注,在智能搜索、问答和推荐系统等领域广泛应用。作为其中的重点研究方向,知识图谱推理是根据目前知识图谱中已有信息进行推断,既可以推理出知识图谱中不存在的事实,也可以判断现有事实的正确性,有很大的研究意义和应用价值。目前主要的知识图谱推理模型中,基于翻译表示的模型无法很好地解决语义多样性地问题,基于随机游走的模型又在时间和空间上开销较大。论文提出了基于深度强化学习的多元奖励结构
甲状腺结节是临床十分常见的一类甲状腺疾病,以良性居多,但甲状腺结节潜在的恶性时刻危害着患者的健康,早期的诊断治疗至关重要。超声检查是诊断甲状腺结节的首选成像方法。近年来,有很多机器学习的方法被用于计算机辅助诊断(CAD)中,计算机辅助诊断需具备高精度和高实时性,才能有效提高医生的诊断效率。现有的基于深度学习的语义分割算法虽然精度较高但实时性不足。论文提出了一种能够实时运行并兼具高精度的语义分割网络
随着无线通信技术和嵌入式技术的成熟,无线传感网得到了飞速的发展,并成为物联网的核心技术之一。大量的传感器以无线通信的方式,构成了以多跳、自组织为主要特点的无线传感网络,并应用于军事、医疗健康、智能制造、智能电网和车联网等多个领域。节点复制攻击是无线传感网中常见的攻击方式。在这种攻击之中,攻击者利用被捕获的诚实节点的信息来伪造网络节点,这些伪造的恶意节点被注入网络之后,可以进行传递虚假消息、更改路由
本论文的研究目标是利用一段简短的说话人语音从中生成与说话人真实面孔相似的人脸图像。为了解决该跨模态学习任务,本论文设计了一个端到端的深度神经网络以自监督的方式学习从语音到人脸的抽象映射,论文将模型分为两个部分,在第一部分中通过语音特征提取网络从说话人的语音频谱中提取低维的人脸特征,在第二部分中通过人脸特征解码网络将人脸特征还原为人脸RGB像素图像。由于说话人视频形式的数据自带有说话人语音以及对应的
网络表征学习旨在将网络中的节点表示成低维向量,从而利用这些向量去完成一些网络分析任务,例如节点分类、节点聚类、链接预测和物品推荐。现有的一些基于生成对抗网络的方法通常使用生成对抗网络来对抗学习节点表征分布和某一个特定的分布,从而使节点表征分布具有某一个特定的分布作为先验分布,比如高斯分布。但是,这种对抗学习策略一是无法学习更加丰富的节点表征信息,二是没有充分利用生成对抗网络的本质优势,即对抗地学习
数字水印是保护信息安全的一种有效手段,且音频作为经常使用的媒体类型之一,认证音频水印的研究具有极大潜力。目前的认证水印大多为静态信息,缺乏足够的安全性,且结合深度学习方案的音频水印研究也有待挖掘。论文主要研究基于深度学习的身份认证音频水印算法。对于水印信息生成,论文借鉴语音侧写领域关于人声画像的思想,探讨从音频中获取身份特征作为水印信息的可行性,并提出了基于生成对抗网络的身份水印生成模型。该模型利
随着我国经济的快速发展,人们的生活质量显著提高,食品质量安全问题逐渐引起了人们的关注。胶体金免疫层析技术是层析与免疫分析技术相结合的一种技术,能对现场食品开展快速免疫检测,有效地确认食品的质量安全,从而保证人们日常饮食的健康和安全。本文分析了胶体金免疫层析技术及其在食品检测中的应用,以期为食品检测工作提供参考。
近些年来,大规模视频处理在监控分析、交通管理、在线视频内容检索等方面发挥着愈来愈加重要的作用。同时,借助于深度学习的发展,图像分析的精度逐步得到提高,应用深度学习模型例如目标检测模型以及目标识别模型进行视频处理已经变得十分高效。在视频处理过程中,对于同一个视频,会有来自多个不同用户的多个请求。当这些的请求在查询内容或区间等方面存在重叠时,便会为数据共享带来可能性。由此,通过对多个请求间的重叠部分进