异构多核集群编程模式初探

来源 :2010年全国高性能计算学术年会(HPC china2010) | 被引量 : 0次 | 上传用户:wy85396021
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
  本文首先介绍多核处理器的发展,多核处理器分为同构多核处理器和异构多核处理器,并简要介绍 过去几种常见的异构多核处理器,如TI的OMAP多媒体处理器、Cell 处理器、特别是由NVIDIA 公司推 出的支持CUDA 架构的GPU,使其作为CPU的协处理器,用于并行计算,解放了CPU 繁重的计算任务。接下来介绍集群的发展,集群也分为同构与异构两种,并重点介绍异构多核集群的发展,如美国橡 树岭国家实验室计算科学中心的“走鹃”和“美洲豹”和中国国防科技大学的“天河一号”。本文主要对 当前异构多核集群的各个分支和发展势态进行了综述,并对各种集群的架构进行了分析比较,展望了异构多核集群未来的发展方向。
其他文献
为了提高计算流体领域中复杂流动现象模拟计算的高效性和准确性,充分利用GPU的高峰值浮点计算性能和高存储器带宽,提出一种基于CUDA 架构的immersed boundary – lattice Boltzmann method (IB-LBM)的模拟算法.借助GPU 高度并行化,多线程特性,为每个网格分配一个线程,使多条线程并行 计算.在合理利用CUDA 存储层次架构中常量内存和纹理内存的同时,恰
国家气象局天气组网雷达定量估测降水系统实现了组网雷达基本反射率和组网估测 降水两类产品的处理和显示功能.本文综合使用Win32多线程和OpenMP 两种技术对该程 序在Intel 四核处理器平台上进行了并行化.该程序主要由单站处理和组网处理两部分组 成.由于计算资源的限制,并行后的单站处理程序只有大约15%的性能提升,而组网处理 程序则可以达到近似线性的性能提升.通过调整计算负载,并行化版本的加速
在vs2005 环境下,从程序的运行时间,通讯开销两方面来分别比较基于FFTW 库、CUFFT 库和MPI 三种方式实现FFT的差异,试验数据是四组二维数组。通过测试结果说 明,在FFT 应用领域,并行计算是FFTW 计算速度的30-80 倍,在大数据运算方面,GPU的计算速度略优于MPI,而且GPU的通信开销要少于基于MPI的并行计算。
为研究极端条件下金属材料的性能,在JASMIN 框架上研制了三维并行位错动力 学程序PDD3D.它集成了离散位错动力学模拟的物理方案和数值算法.通过设计实现高效的分布式数据结构、可扩展的快速多极子解法器以及基于影像区的拓扑操作通信方式,该 程序获得了较高的性能和较好的可扩展性.它在1024 个处理器上模拟包含3 千万条位错线的物理模型获得了81%的并行效率.
云计算的概念早已成为信息技术领域的热门话题。一些商业巨头都纷纷宣称应用它们 在云计算技术上的新型系统和架构,不仅能够为用户提供方便简洁的服务,而且可以大大节 约企业成本。那云计算在商业上的优势是否可以同样应用到教育领域当中?准对这问题,本 文提出了一个新的概念:云实验室。本文着重讨论了虚拟化技术在教育机构的一种新运用:云实验室。我们描述了云实验室的基本特点,分析了与传统实验室相比的优势,并设计出了
主要介绍了行星流体动力学大规模并行模拟中病态压力方程的预条件子和迭代算法的选取,并根据 强弱可扩展性的概念,对弱可扩展性的实验结果进行了分析。具体分析了在维持每核平均的浮点操作次数基 本不变的情况下,倍增处理器规模时,程序运行时间,MPI 消息传递的数量和大小对弱可扩展性的影响。
运行状态的实时监控是对超级计算机进行高效管理的基础.目前的状态监控都是作为作业调度及资 源管理的一个子系统,仅从软件监控的角度提供诸如节点、网络、IO 等部件的负载信息,缺乏更深层次的 状态数据.而随系统规模的扩大,系统包含的存储、通信、计算、散热、电源、监控等部件的数量急剧上 升,由此而来的系统稳定性问题需要多层次、更加全面的状态监控方法,以实现在线故障诊断、失效预测 能力.为了满足这种需求,结
AMR-FDTD 算法将AMR 方法与FDTD 方法相结合,仅在电磁场能量梯度较大区域细化 网格,通过网格细化或粗化动态调整计算资源,计算效率高.针对大规模电磁计算,基于SAMRAI,提出了一种新的AMR-FDTD 算法的并行求解方法.该方法基于分布式块结构的多级自适应网格,采用局部时间细化,以网格单元为最小计算单位,以网格块为数据分布和负载平衡的最小单位.通 过将多级自适应网格中各网格层上的网格
以超算中心为代表的高性能计算机的规模应用,其功率密 度高,且长期运行在高负荷率条件下,耗能极高。本文研究了上海 超算中心的“曙光500A”和“曙光400A”超算系统的基础设施设 计、运营和能耗结构,对各子系统的能效进行了分析,研究其PUE 构成和影响,以及主机运算性能能效PPW,并提出超算中心整体运 算性能能效SCCE 评价超算中心整体能效。上海超算中心两套不同系 统能效对比分析,对超级计算或高性
近年来,软件的网络化、服务化使用成为一种新的趋势。在虚拟化软件按需流式加载的执行过程中,程序会因请求缺失的数据而被阻塞直至数据被下载过来,从而影响用户的体验。针对这一问题提出了一种基 于N-Gram 预测模型和数据挖掘技术的面向软件流式加载的预取机制,通过收集用户使用软件所产生的软件 文件访问日志,进行数据挖掘分析,来动态更新、完善预取规则,然后根据最合理的预取规则进行预取。实 验结果表明,对于各