【摘 要】
:
目前处理时态大数据连接操作多数运用分布式系统,但现有的分布式系统尚不能支持原生的时态连接查询,无法满足时态大数据低延迟和高吞吐量的处理需求。为此,提出一个基于Spark
【机 构】
:
上海交通大学计算机科学与工程系,中山大学数据科学与计算机学院
【基金项目】
:
国家自然科学基金(U1636210,61729202),广东省科技计划项目(2015A030401057,2016B030307002)
论文部分内容阅读
目前处理时态大数据连接操作多数运用分布式系统,但现有的分布式系统尚不能支持原生的时态连接查询,无法满足时态大数据低延迟和高吞吐量的处理需求。为此,提出一个基于Spark的二级索引内存解决方案。运用全局索引进行分布式分区的剪枝,使用局部时态索引进行分区内查询,提高数据检索效率。针对时态数据设计分区方法,以对全局剪枝进行优化。基于真实和合成数据集的实验结果表明,与基准方案相比,该方案可明显提高时态连接操作的处理效率。
其他文献
从中小型公共图书馆数字化建设的现状入手,分析了制约中小型公共图书馆数字化服务的影响因素,提出了提升其数字化服务水平的对策:构建先进的数字图书馆服务网络,加强和完善数
高校图书馆作为高等学校的文献信息中心,存在着诸多诱发安全危机的隐患,如文献信息资源安全危机、设备设施安全危机、网络系统安全危机、人员安全危机等。概述了高校图书馆安
为了探究液滴在通过圆形表面的运动过程中固体表面的润湿性对液滴运动的影响,基于S-C伪势模型的介观格子Boltzmann方法(LBM),课题组对重力场下液滴的运动过程进行了二维数值
分析了创新型城市的信息需求,运用SWOT分析法分析了我国高校图书馆面向创新型城市信息服务的优势、劣势、机会、威胁,提出了建立创新主体资料库、整合信息资源、加强与创新主体
知识组织已成为图书情报理论界关注的热点之一。根据CNKI期刊全文数据库中收录的1984—2014年关于知识组织研究的文献,综合利用NoteExpress文献管理软件和Excel软件对其从年份
尊敬的各位领导、各位代表,朋友们:大家上午好!在金秋送爽、硕果累累的美好时节,我们迎来了"河北省高职高专院校图书馆第三届工作交流暨学术研讨会"的召开,在此,我谨代表河北政