基于MapReduce的数据图检索算法研究

来源 :大连海事大学 | 被引量 : 2次 | 上传用户:yyyypolo
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
关系数据库关键字检索面临许多问题,如相关结果丢失、结果语义难以理解、结果排序不理想及结果存在重复等。为此,许多研究提出把数据库转换成一个带权重的数据图,然后对数据图进行检索。数据图以边和节点的形式存储数据,它能还原数据本来的存在形式和数据间存在的关系,能有效解决关系数据库关键字查询的弊端。然而,随着数据量爆炸式的增长,数据图的规模也变得越来越大,如何存储和高效地检索大规模数据图还是一个值得研究的问题。首先,为了解决大规模数据图的存储问题,本文利用Neo4j图数据库把关系数据库中的数据构建成数据图并对其存储。Neo4j图数据库把数据以图形的结构存储在外存中,能有效的节约内存资源。Neo4j还提供了许多调用接口,外部检索算法可以方便地对其访问。其次,为了解决大规模数据图检索时间效率低的问题,本文引入MapReduce分布式计算模型,把STAR算法MapReduce化,提出了一个基于MapReduce的数据图检索算法MRSTAR(MapReduce-based Steiner-Tree Approximation in Relationship graphs)。由于借鉴了MapReduce的并行计算的思想,该算法实现了对数据图并行检索,提高了大规模数据图检索的时间效率。最后,本文实现了基于MapReduce的数据图检索系统,包括数据图的构建和基于MapReduce的数据图检索两个模块。实验结果表明,与以前的数据图检索算法STAR相比,MapRedcue化的数据图检索算法具有良好的时间效率,特别是对大规模数据图检索时间效率提升更加显著。
其他文献
猪瘟是由猪瘟病毒引起的猪的一种急性或慢性和高度接触性传染病。其特征为发病急、高热稽留和细小血管壁变性,引起广泛性小点出血,脾梗死。随着规模化养殖业的发展,养猪数量
脂肪来源干细胞(Adipose-DerivedStemCells,ADSCs)作为组织工程的种子细胞正受到越来越多的关注。本实验采用一次消化多次收集与差速贴壁法分离小鼠腹股沟及附睾脂肪组织中的A
1日常工作(1)打扫卫生,清除残余旧饲料,要求当餐饲喂饲料当餐处理,饲喂后1h料槽不能剩料,尤其是在夏季。(2)保温、通风换气以及供水系统的管理。①仔猪出生后,要确保保温箱完整,
狂犬病是一种古老的传染病,世界各地均有发生.它是一种高度接触性传染病,致死率高达100%,对人类危害相当严重.据当前有关报道,健康犬的带毒率为3.9%.因此,对犬进行狂犬病疫苗接
公牛去势是兽医临床外科手术中比较常见的一种。本文作者结合多年工作经历,在此介绍有血去势的一种方法,并阐述了手术对象、用具、技术要点以及术前、术中、术后的注意事项等。
风湿病主要侵犯关节、肌肉、骨骼及关节周围的软组织,如肌腱、韧带、滑囊、筋膜等部位。马风湿病在辽宁省常有发生,据2004年门诊病例统计,此病占马外科疾病的30%,多发生于春冬两季
驴肉属典型的高蛋白、低脂肪肉食品。驴肉还具有补血、益气补虚等保健功能。对驴进行饲养及育肥.要实施以下四项措施。
2013年7月,三江县某养殖户饲养的生猪和某村的散养猪发生以高热、急性死亡和神经症状为主要特征的传染病,发病率10.68%,致死率31.8%.经流行病学调查、临床检查、病理剖检、细菌
1调理母猪确保正常发情、排卵、受胎、产仔。1.1加抗生素后备母猪配种前10d、经产母猪断奶后至配种后3d,在饲料中加土霉素或其他抗菌素,抑制母猪体内可导致疾病的微生物生长,改善
本实验所研究的主要内容可概述为:目的:胡超伟根据现代人对疼痛的耐受度,将针设计成现代毫针样式而成为新圆利针,他的圆利针疗法对于软组织疾病的治疗已取得较好临床疗效,本研究在