面向大数据流的分布式索引构建

来源 :软件学报 | 被引量 : 0次 | 上传用户:wgm740821
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
大数据流的高效存储与索引是当今数据领域的一大难点.面向带有时间属性的数据流,根据其时间属性,将数据流划分为连续的时间窗口,提出了基于双层B+树的分布式索引结构WB-Index.下层B+树索引基于窗口内流数据构建,索引构建过程结合基于排序的批量构建技术,进一步对时间窗口分片,将数据流接收、分片数据排序以及B+树构建并行化,提高了构建性能.上层B+树索引基于各时间窗口构建,结合时间窗口时间戳的递增性和无限性,提出了避免节点分裂的构建方法,减少了 B+树分裂移动开销,提高了空间利用率和更新效率.WB-Index架构中,将流数据和索引分离,同时利用内存缓存尽可能多的双层B+索引和热点数据来提高查询性能.理论和实验结果表明,该分布式索引架构能够支持高效的实时数据流写入以及流数据查询,能够很好地应用于具有时间属性的数据流场景.
其他文献
安徽省萧县养羊历史达数千年之久,经过历代劳动人民的精心培育,萧县生产的白山羊已成为黄淮山羊的重要品系,成羊体重达37千克左右,屠宰率45%.萧县位于江苏省、安徽省、山东省、河南省4省交界处,是全国山羊饲养较为集中的地区,具有明显的区位优势,已成为全国肉用山羊的主要集散地.
期刊
表约束在约束程序(constraint programming,简称CP)中被广泛研究.目前,求解表约束问题效率最高的算法是 CT(compact-table)和 STRbit(simple tabular reduction bit).它们在搜索过程中维持广义弧相容(generalized arc consistency,简称GAC).完全成对相容(full pairwise consistency,简称fPWC)是一种强于GAC的相容性关系,目前,实现fPWC效率最高的算法是PW-CT,但是它无法直接
目的 分析重庆市九龙坡区人民医院2018-2020年共587株铜绿假单胞菌感染的标本主要来源部位,年龄分布情况,并根据其临床科室分布及3年耐药率比较,为临床医生合理使用药物及院感防控提供临床依据.方法 对送检样本进行培养鉴定和药敏试验,并通过WHONET5.6软件进行统计.结果 铜绿假单胞菌主要来源于痰液(72.06%)、伤口分泌物(14.99%)、尿液(9.2%)、血液(1.19%)等标本,患者以老年人居多,科室分布以呼吸内科(33.73%)、重症医学科(10.22%)、肝胆脑外科(8.69%)、肿瘤科
目的 分析血清脂蛋白相关磷脂酶A2(Lp-PLA2)活性与冠心病患者冠脉狭窄程度及主要不良心血管事件(MACE)发生的关系.方法 选取2019年10月至2020年1月吉林大学中日联谊医院新民院区心血管内科住院患者作为研究对象,对怀疑患有冠心病(CHD)患者进行了冠状动脉造影(CAG)检查,以确定冠状动脉病变严重程度.根据CAG结果、心肌损伤标志物、心电图以及患者的临床表现,将48例急性冠脉综合征(ACS)患者列为观察组,将37例稳定型心绞痛(SA)患者列为对照组,并对所有研究对象通过电话随访至2021年5
目的 探讨血栓弹力图对脓毒症诱发凝血病(SIC)的诊断及预后评估作用.方法 连续收集2018年12月至2020年9月中国康复研究中心急诊科收治的脓毒症患者150例,根据SIC评分系统将患者分为SIC组(64例)和非SIC(86例)组,根据SIC患者的预后分为存活组(21例)和死亡组(43例),分别比较两组间血栓弹力图R值、K值、α角、MA值及CI值,采用受试者工作特征(ROC)曲线评价血栓弹力图各指标对SIC的诊断及预后评估的临床价值.结果 与非SIC组相比,SIC组R值、K值显著延长,α角、MA值及CI
美姑山羊在前期的生长过程中,发育较快,而且肉质细嫩、膻味不重,因而是一种优良特性较好的山羊肉类,它主要生长在四川省凉山彝族美姑县,平均海拔在700~2800米之间.在其特性和市场需求的作用下,周边的城市也逐渐开始养殖美姑山羊,目前主要以黑色和黑白两种为主,还有一些白色美姑山羊.美姑山羊颜色光亮,胸上和腿部的毛较长,其他部位较短,公、母山羊均有触角,且呈现外八字形状,头部一般大,四肢较为粗壮,胸和肚子较为平直,母羊相对比较好看,而且乳房发育较好.在养殖过程中,应加强对其饲养管理、提高产量,同时采取一定的防疫
期刊
突发性耳聋是指突然发生的、原因尚未明确的感音神经性听力损失,临床多表现为单侧听力下降,严重者会引起耳鸣、恶心呕吐及眩晕等[1].目前,对于突发性耳聋发病机制尚未阐明,获得广泛认可的主要有病毒感染学说、自身免疫学说及循环障碍学说等[2].既往研究表明[3]:突发性耳聋的发生不仅局限于耳蜗局部改变,亦可引起体内生理、病理变化.而下丘脑-垂体-肾上腺轴(HPA 轴)功能异常及机体炎性反应等,均会造成机体免疫系统异常,直接参与疾病的发生、发展[4].
期刊
单幅图像的超分辨率重建(singleimagesuper-resolution,简称SR)是一项重要的图像合成任务.目前,在基于神经网络的SR任务中,常用的损失函数包括基于内容的重构损失和基于生成对抗网络(generativeadversarial network,简称GAN)的对抗损失.但是,基于传统的GAN的超分辨率重建模型(SRGAN)在判别器接收高分辨率图像作为输入时,输出判别信号不稳定.
信息通过公共链路进行传输时极易遭受窃听、篡改等形式的网络攻击,因此有必要保障信息在传输过程中的机密性和完整性,而签密技术能够有效地实现上述目的.基于椭圆曲线,提出一种多接收者多消息签密方案,能够有效地适配到广播系统中.采用多密钥分发中心管理系统主密钥信息,且能够周期地更新各自的秘密信息,以抵抗对应的APT攻击.不同更新周期注册的用户相互之间能够通信,不会影响系统的可用性.提出了一种基于区块链的周期更新策略,根据公有链中区块高度和时间戳触发密钥更新动作,基于区块链不可篡改特性确保方案的安全性,且该过程不需要
目的 探讨长链非编码RNA(lncRNA)PROX1反义RNA1(PROX1-AS1)是否靶向miR-206影响鼻咽癌细胞SUNE1的增殖、迁移和侵袭.方法 采用实时定量PCR(RT-qPCR)检测鼻咽癌组织和癌旁组织中PROX1-AS1和miR-206表达.双荧光素酶报告实验和RT-qPCR分析PROX1-AS1和miR-206靶向关系.细胞计数试剂盒(CCK-8)法、克隆形成实验、Transwell实验检测PROX1-AS1和miR-206表达对SUNE1细胞增殖活力、克隆形成数、迁移和侵袭细胞数的影