面向大数据流的分布式B+树索引构建

来源 :浙江工业大学 | 被引量 : 0次 | 上传用户:cyfzyzclwhzy
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着大数据时代的到来,数据的产生及其应用方式更加多元化。数据流是一种特殊的大数据形态,具有实时性、无限性、突发性等特点,在众多领域有着广泛的应用,具有很高的价值。然而,数据流的流速快且数据量巨大,其在实时处理、存储和查询等方面都存在很大的挑战。对此,本文提出了一种适用于数据流场景的分布式索引结构,其能支持数据流的高效存储与查询。本文贡献如下:1.提出了一种适用于大数据流场景的分布式B+树索引结构:WB-Index。WB-Index是一种双层的主从索引结构,其利用时间窗口机制切分数据流。在每个时间窗口内,根据流元组内容构建B+树索引作为底层索引,针对各连续时间窗口,以时间窗口起始时间戳作为“Key”值,时间窗口对应底层索引元信息作为“Value”值构建顶层B+树索引。WB-Index将底层索引分发到多个节点来减轻索引维护压力。WB-Index系统架构中,通过多种节点类型将流元组存储、索引构建和查询请求分离,从而满足数据流的高效存储与查询。2.针对WB-Index索引结构,提出了高效的索引构建方法。由于数据流流速快,索引的构建效率至关重要。针对底层索引,提出基于并行排序的预装载B+树批量构建法,提高底层索引构建效率;针对顶层索引,提出预分配节点空间的不分裂B+树更新方法,保证更新效率,提高空间利用率。所提索引构建方法构建速度快、时延低,能够支撑高速数据流的索引构建。3.针对WB-Index索引结构,提出了高效的持久化方法。由于数据流具有无限性,本文利用分布式文件系统存储数据流以及WB-Index索引结构,设计了紧凑的存储格式来减少存储开销。为了提高索引持久化后的查询效率,底层索引中添加辅助索引结构来过滤不必要的查询请求,并通过缓存新数据和热点数据来进一步提高查询效率。WB-Index能支持数据流的高效存储和查询,通过理论评估和实验分析证明了WB-Index的有效性。
其他文献
青年红色记忆的稳定延续关乎国运兴衰。历史虚无主义以红色历史本体为消解核心,红色符号为"靶子",媒介为渗透途径,对青年红色记忆的文化传递、符号唤醒与媒介互动塑造环节造
随着移动智能机器人的广泛应用,移动机器人同时自我定位与地图构建(Simultaneous Localization and Mapping,SLAM)成为了研究者研究的热点话题。其中的闭环检测部分可以为后端的位姿图优化带来强约束,从而有效地减少位姿估计的累积误差,是所有SLAM系统只中不可或缺的一环。主成分分析网络(PCANet)能够高效的提取场景图片的特征向量,但没有利用到样本数据的类区分性;线
伴随着航空航天工业和计算机信息技术的高速发展,航电系统逐渐向分布式综合模块化体系结构演变。该体系结构对网络通信的实时性、可靠性、兼容性和数据传输速率等带来了越来越高的要求。传统以太网已无法满足这些新的需求,于是时间触发以太网(Time-Triggered Ethernet,TTE)应运而生。TTE引入了时间触发机制、时间同步机制和容错机制,并兼容传统以太网技术,有望成为未来理想的互联基础设施。但T
随着合成孔径雷达(SAR,Synthetic Aperture Radar)成像技术的快速发展,高分辨SAR图像处理在军事等各领域应用越发广泛,通过成像获得的高分辨SAR图像数据信息也越来越多,处理大量图像数据需要的时间往往很长,不能满足高分辨SAR图像处理实时性、准确性的要求,尤其是战场环境瞬息万变的军事领域。异构计算是当下处理海量数据的高速手段,CPU+GPU是目前最常见的异构计算架构,GPU
布哈林是苏联早期杰出的马克思主义理论家和经济学家。20世纪初期,布哈林基于列宁关于新经济政策的理论和实践,结合俄国的实际,认真分析了当时国民经济发展中出现的一系列问题,总结国内经济建设出现的正反两方面的经验教训,形成了自己独特的关于国民经济动态平衡发展的理论。随着我国经济发展进入新阶段,布哈林的国民经济动态平衡发展思想越来越凸显其时代价值。但遗憾的是,迄今为止,学界关于布哈林国民经济平衡发展的研究
延安是中国民主革命的圣地。抗日战争时期,中国共产党在陕甘宁边区推行民主选举成为新中国民主政治建设的摇篮和典范,研究陕甘宁边区民主选举对完善我国社会主义民主政治具有
研究目的:应用高糖高脂膳食联合注射链脲佐菌素(STZ)建立2型糖尿病(T2DM)大鼠模型,并在模型建立过程中施加不同强度的运动干预,探讨其在2型糖尿病大鼠造模过程中对成模率、血
在低频段时,有源微波组件中传输线间转换互联点仅仅起电连通作用,相当于短路,传输性能几乎与互联点无关;然而到了高频段(微波毫米波频段),电路结构尺寸与传输线工作波长可比拟,其寄生效应(寄生电容与寄生电感等)将造成信号幅度和相位的改变,导致传输性能变差,互联工艺形态对传输性能的耦合影响愈加突出,特别是在金带互联工艺表现尤为显著,因此互联工艺形态与信号传输性能耦合关系和影响机理的研究成为了微波组件设计阶
现代通信系统快速发展,对器件的要求越来越高,滤波器作为通信系统中一类重要器件,和通信系统的发展相辅相成。现如今对于滤波器小型化、高性能以及易于集成等特性的要求越来越高。与其它传输线结构相比,共面波导具有易集成、电磁屏蔽性能好、色散性好且加工简单等优点;此外,悬置结构能减小电路的插入损耗、增加机械强度,同时可设计集成化电路,实现自封装。本文提出了新型接地悬置共面波导结构,并以此平台为基础设计了几个滤
作为计算机视觉领域重要研究方向和人工智能产品的核心技术,行人检测受到了学术界和工业界的广泛关注。行人检测是指使用计算机视觉技术对图像或视频中的行人进行识别和定位的过程,在智能视频监控、智能机器人、人机交互等领域具有巨大的研究价值和应用前景。尺度和视角变化一直是行人检测领域的难点问题,传统的行人检测方法在处理这两类目标时效果不理想并且检测速度远远达不到实时性要求。论文针对行人检测领域中的多尺度、姿态