基于Fermi架构的Join算法

来源 :2012全国高性能计算学术年会 | 被引量 : 0次 | 上传用户:ken_008
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
  在列数据库中,连接操作依然是最核心和最耗时的操作,GPU 强大的计算能力可为此提供新的优化手段.基于Fermi 架构,文中提出了新的Hash Join 算法和Sort-merge Join 算法,基本思想是充分利用该架构新增的缓存结构,减少连接操作的cache缺失率.在此基础上,采用CUDA stream 技术,在输出结果较多时可以有效隐藏主存与显存间数据传输带来的延迟,进一步提升算法的执行效率.实验结果表明了基于Fermi 架构的Hash Join 算法处理偏斜数据的高效性及Sort-merge Join 算法的稳定性,并且通过比较,这两种算法的性能全面优于基于多核CPU 充分优化的Join 算法,最大加速2.4 倍,在外键分布高偏斜时新的Hash Join 算法的执行速度甚至达到217M 元组每秒.
其他文献
  随着信息资源爆炸性增长,云文件系统凭借高性能、高扩展、高可用、易管理等特点,成为云存储和大数据的基础和核心。由于硬件损坏和软件故障等原因,可能造成数据的损坏和丢失
会议
  近年来,高性能计算系统在性能不断增长的同时,其规模也日益庞大,所带来的高功耗问题已成为制约系统设计和运行的重要技术和经济因素。在系统低功耗设计的基础上,如何有效降低
会议
  并行AMG法是求解PDEs 离散化系统最为有效的迭代法之一,目前已被广泛应用于大规模科学与工程计算等众多领域。本文针对一类系数矩阵为稀疏带状结构的线性代数方程组,在Op
随着零售行业在国民经济中作用的日益增强,对国民经济增长贡献率的扩大,零售行业已开始成为引导生产和消费的先导型行业。此外,由于国家经济危机往往都通过零售行业销售危机
  为高效、充分的利用GPU,针对GPU的特点,结合虚拟化环境的安全、隔离等特性,借鉴已有的虚拟化技术,提出了一种可动态调度、支持多用户并发的GPU虚拟化技术.CUDA管理端采用
  水泥图像特征提取是水泥建模的重要基础。传统的水泥特征提取在处理大量水泥图像时耗时巨大,且需要大量内存资源。考虑到基于像素的图像特征提取有着可并行化程度高的特点
  文件访问流是一个连续的页面集合,其访问子序列在时间上连续,在空间上有顺序/逆序/跳步/固定点等IO特征的。基于此,遵循page cache 为中心的设计思想,在内核VFS 层构建软件框
  硅酸盐水泥水化反应的极端复杂性使得人工推导水化动力学方程的研究存在很高的难度。通过进化计算方法可以从观测到的硅酸盐水泥水化程度时间序列数据中自动萃取出水化动
  云环境中,借助瘦客户端技术提供软件远程执行服务成为解决移动终端资源局限性问题的有效途径.但移动网及广域网的固有延迟会严重影响交互应用程序远程执行的用户体验.本
会议
  SimK 是由中科院计算所体系结构国家重点实验室开发的一个并行离散时间模拟引擎.基于已经发布的SimK 1.0 版本,对任务划分及同步推进阻塞控制进行了功能扩展,开发了SimK
会议