【摘 要】
:
现实中的图不仅规模巨大,而且图的拓扑结构随着时间发展而不断变化,原始的静态图演化成带有时间属性的时序图。如何有效地存储大规模时序图并对其进行高效地检索查询,成为时序图研究的一个重要问题。现有的时序图存储模型主要分为三类:基于快照的存储模型、基于日志的存储模型以及基于二者组合的混合存储模型。快照模型支持高效地查询检索,但存储开销太大。日志模型虽然降低了存储开销,但查询时间成本太高。混合模型一般采用偏
论文部分内容阅读
现实中的图不仅规模巨大,而且图的拓扑结构随着时间发展而不断变化,原始的静态图演化成带有时间属性的时序图。如何有效地存储大规模时序图并对其进行高效地检索查询,成为时序图研究的一个重要问题。现有的时序图存储模型主要分为三类:基于快照的存储模型、基于日志的存储模型以及基于二者组合的混合存储模型。快照模型支持高效地查询检索,但存储开销太大。日志模型虽然降低了存储开销,但查询时间成本太高。混合模型一般采用偏斜性感知或者相关性感知的策略将两种模型组合使用,但是这些策略仍存在着挑战:度的偏斜性会随着时间变化而发生演化;访问频率偏斜性不能完全体现时序图的重要性;快照之间的相关性带来较大的更新开销。基于日志结构合并子图的时序图存储模型(Log-Structured Merge-Subgraph,LSM-Subgraph)主要包含LSM-Subgraph数据结构以及更新查询引擎。LSM-Subgraph数据结构将所有日志划分成多个数据段,每个数据段由日志数组和基于压缩内存的邻接数组(Packed-Memory Array,PMA)构成。基于PMA的邻接数组通过预留适当的空间,避免了快照在更新合并过程中的重构问题。更新查询引擎用来辅助LSMSubgraph完成更新和查询过程中的相关操作。更新过程中,通过基于差异度感知的选取方法来完成数据段序列的合理划分;查询过程中,通过日志预合并方案来降低数据合并规模,提高检索效率。实验结果表明,LSM-Subgraph在真实数据集上的总体性能优于现有的时序图存储模型Chronos和Graph Pool,其中,查询效率提升39%~94%,存储开销降低9%~81%。此外,各个优化方案的实验结果表明,基于PMA的邻接数组的更新开销远小于现有的快照模型CSR和邻接表;基于差异度感知方法在动态时序图上的总体性能优于基于度偏斜性感知方法,其中,查询时间减少9.8%~25%,内存开销降低12.8%~48.7%;差异度感知的总体开销比基于随机性和基于周期性小,其中,查询时间减少2%~80%,内存开销降低24%~63%。
其他文献
一直以来,水电被视为一种清洁绿色的能源。不过,有研究表明,水库的建设会极大改变原有生境的生态功能,进而对整个库区温室气体的排放产生较大的影响。三峡水库作为目前世界上最大的水电工程,其“反季节”的运行方式形成了水位落差近30米的消落带。消落带周期性地处于淹没/落干的循环中,物质迁移和能量交换更为复杂,碳循环也与自然生境有较大的不同,其对温室气体排放的贡献既来自于岸边沼泽又来自于水域。因此,基于三峡库
肺癌是目前世界上发病率和死亡率最高的恶性肿瘤之一。大部分患者难以察觉早期的肺部病变,当出现临床症状时,基本上都了病程的中晚期,治疗效果受限。肺结节是肺癌的早期表现形式,肺结节检测对降低肺癌死亡率和提高患者生存率及生活质量具有重要的意义。肺部计算机断层扫描(Computed Tomography,CT)影像是当前早期肺癌诊断的主要手段,但人工判读主观性强、一致性低,容易引起漏诊和误诊。深度学习能获取
近年来,随着深度学习的发展,场景文本检测方法在实际应用中取得了很大的进步。然而,由于自然场景中文本形状各异、大小不一、背景复杂、语言种类多等诸多难点,许多算法研究依然面临着巨大的挑战。早期的深度学习检测算法大多基于Anchor直接进行边界框预测,并没有关注文本的区域变化特性,这使它们很难分离彼此接近的文本。此外,基于Anchor的边界框预测也很难检测形状各异的文本,如四边形文本、曲线文本等。针对这
近年来,纳米材料凭借优异的物理、化学性质,在各个研究领域得到长足的发展。尤其是纳米材料的比表面积大,表面活性高等特性,使得纳米材料表面反应活跃,倾向于将小分子吸附在表面,基于这种表面吸附特性的研究可用于表面修饰、催化、扩散、传感等领域。表面吸附是一种常用的纳米颗粒的表面改性方法。纳米铜颗粒由于自身极佳的热电性能和低廉的价格被视为潜在的先进封装材料,但因其易氧化的特点而难以大规模应用。因此研究纳米铜
Shell煤气化技术因其煤种适应性广、有效气含量高、能耗低等优点被国内外广泛关注,但其运行中也存在着一些问题。如Shell煤气化炉的运行过程中,少量的飞灰被合成气夹带出气化炉进入激冷段,并沉降和附着于换热器表面,导致合成气冷却器传热效率下降、生产负荷降低,严重时还堵塞输气管线,这已成为制约Shell煤气化炉长期稳定运行的主要障碍之一。因此,提高气化炉内煤灰颗粒的捕获量以降低出口处的飞灰夹带量具有重
近年来,基于微流控芯片的即时检测设备(Point-of-care test,POCT)有着成本低廉、操作简便、灵敏性高等优势,在生物医学领域显示出了良好的发展前景,而驱动其正常运行的微型电源研发就成了关键的问题。目前市场上最常见的微型电源是锂离子电池,虽然其能够稳定供电,但锂离子电池存在理论能量密度低、电解质不环保、锂金属需要专业复杂的后续处理等不足。为了替代锂离子电池或与锂离子电池组合使用,研究
随着我国经济的飞速发展,城市化进程不断加速,与此同时,先进的工程建造技术快速进步,包括轻质高强材料的广泛应用,精细化的建筑结构设计方法以及自动化智能化的建筑施工技术,这使得全世界各地涌现出越来越多的超高层建筑。该类建筑具有高柔、轻质和低阻尼等结构特点,是典型的风敏感建筑,风荷载在其结构设计中为主要控制荷载之一。受地球偏转力(科氏力)和山地效应影响,风向会沿着距离地面的高度方向发生改变,也被称为偏转
分布式智能传感器是电网运行参量和设备状态信息感知的关键设备,随着智能传感器的广泛应用,在实际电力生产中的传感器供能问题日益凸显。现场环境能量收集提供了一种可行的分布式传感器移动电源解决方案,是目前电气与电子工程领域的研究热点之一。现场环境能量收集并为低功耗传感器供电具有重要意义,但单一的环境能量收集往往电能量小、稳定性差,因此,本文开展了对多源环境能量收集的阵列取能器件优化和能量融合与管理方法的研
随着航空、航天、国防、能源等高新技术领域的快速发展,金属材料在高温高压极端环境下的应用越来越广泛,为保证在实际工程应用中金属材料服役的安全性和可靠性,需充分认识金属材料的屈服强度和剪切模量,其对温度和压强都非常敏感。因此关于不同温度/压强下的金属材料屈服强度和剪切模量的研究成为当前活跃的研究领域之一。研究控制金属材料温度/压强相关性屈服强度和剪切模量的机制及其随温度的演化,建立温度/压强相关性屈服
党的十九届四中全会提出,坚持和完善党和国家监督体系,强化对权力运行的制约和监督,构建一体推进不敢腐、不能腐、不想腐体制机制。这一动态发展的反腐败目标体系揭示了标本兼治的基本规律,凝结着对腐败发生机理、管党治党规律和当前形势任务的深刻洞察,不仅是反腐败斗争的基本方针,也是适用于新时代全面从严治党的科学思路和有效方法。随着“三不”一体推进不断走向深入,各方面各环节的关联性、互动性越来越强,