自动并行化相关论文
使用传统的问题解决方式来处理网络并行计算的问题是十分困难的,该论文中提出了一种新的解决方法,即把问题处理分为两个阶段,在第......
当前,计算机硬件系统正朝着并行化与异构化的趋势发展。继多核微处理器普及之后,图形处理器GPU、数字信号处理器DSP、FPGA等多种硬......
多核芯片结构需要解决的最具挑战性的问题之一是设计能够充分发挥这种结构优势的并行程序设计模型。在多核结构上采用由用户显式制......
自动并行化技术的研究是随着并行计算机的出现而开始的,如何用好并行处理系统以解决大规模科学计算问题是当前计算机科学面临的一......
随着并行计算机的大量涌现,如何开发并行程序以便充分有效利用并行计算机资源已成为非常重要但又十分困难的问题。在目前缺乏普遍......
计算需求日益增多的今天,人们普遍采用GPU(Graphics Processing Unit)作为运算加速设备,现在利用通用显示核心(General-Purpose GP......
多武器仿真平台、分布交互式仿真DIS和顶层结构仿真HLA,是军用仿真技术应用的发展趋势,本文介绍了自行研制的分布式并行仿真计算机系统CHY-Ⅲ。......
OpenMP是为在多处理机上编写并行程序而设计的一个应用编程接口,在串行程序中简单插入OpenMP编译指导语句,编译器就可自动将串行程......
传统数组数据流分析方法主要针对精确依赖测试、数组私有化等研究,无法为划分提供教组在循环间详细的定义-引用信息.本文提出了一......
针对CFD(computational fluid dynamics)问题中的点松弛和线松弛迭代算法,研究其帧内和帧间数据相关性,提出一种数据相关性分析算......
推测多线程(speculativemultithreading,简称SpMT)技术是一种实现非规则程序自动并行化的有效途径.然而,基于控制流图和分支预测技术的......
现有循环并行识别方法用于众核处理器时存在一定不足,当选择的循环并行维迭代数较少时可能导致严重的负载不均衡。针对这一问题,提......
推测多线程主要针对编译器生成的指令进行线程划分,在控制流和数据流分析基础上,实现串行程序的自动并行化.模拟器作为检验线程划......
多核处理器能够提升多线程程序的性能,但早已存在的诸多单线程程序无法从中获益,程序员也习惯于编写单线程程序.自动并行化技术是......
计算和数据自动划分是并行化编译中一种自动分配计算和数据到各个处理机的优化技术,划分的结果直接影响程序并行的性能。数组是划分......
本文面向计算流体力学(CFD)提出了数据自动迁移的并行计算模型(ADM模型),符合该模型的并行CFD程序能够根据计算节点的计算能力及负......
传统的面向MPI的自动并行化使用的依赖测试技术,只能确定代码中是否含有循环携带依赖,而不对循环携带依赖的类型进行判定。经研究......
许多大规模计算程序包含了不规则循环,但在面向分布存储的自动并行化中,以往的研究难以在编译时为不规则循环生成并行代码。针对一类......
多核处理器能够提升多线程程序的性能,但早已存在的诸多单线程程序无法从中获益,程序员也习惯于编写单线程程序。自动并行化技术是......
针对多核体系平台上充分、有效地发掘目标程序中各种可用并行性的需求,通过引入"层次关系"、"等价关系"和"特性权重"的支持,提出了一种扩......
面向计算流体力学(CFD)研究了交互式并行化技术,开发了并行化系统Paractive.介绍了CFD程序并行化的区域计算模型及区域相关的概念:......
支持程序自动并行化的本质是判定相互之间不存在相关的代码块,因此如何精确地获取包括控制流图和数据流图在内的程序运行时行为成为......
许多大规模计算程序包含了不规则问题。在面向分布存储的自动并行化中,以往的研究在编译时划分不规则问题的循环和数组较难。文章提......
由于异构多核处理器中加速设备内存有限,在进行加速计算时往往需要把主存中的数据分块传输到设备内存。Open ACC现有的数据拷贝子......
划分是一种自动分配计算和数据到各个处理器的编译技术,是分布存储结构下并行编译的核心问题.以往的划分研究较少从生命期的角度考......
有效的自动并行化能够帮助用户充分利用并行计算机的资源。本文介绍了我们自行设计的面向复杂连续系统仿真程序的自动并行化模型ASPM,并......
不规则计算在大规模并行应用中广泛存在。在面向分布存储结构的自动并行化过程中,较难在编译时为不规则循环生成并行代码。并行代......
针对当前大量遗产代码无法重复利用的问题,设计一种新的编译工具将C的串行代码转换为基于MPI+Open MP的混合并行编程代码,降低了并......
当计算划分层迭代数目较大,或是循环体单次迭代工作量较大,但可用的并行线程数目较小时,传统的基于循环分块的流水粒度优化方法无......
现有的并行代价模型大多是面向共享存储或分布存储结构设计的,不完全适合异构多核处理器。为解决这个问题,提出了面向异构多核处理......
针对循环结构的自动并行化处理,提出一种新的表图结合的中间表示IR(Intermediate Representation)设计方法,该算法具备较低的时间和空......
随着量子计算、光子计算、生物计算等新型计算,以及多种混合计算模式的出现,直接的并行程序设计工作将变得极为复杂且代价高昂,这......
多核处理器成为主流的通用处理器,具有计算能力强、功耗低和设计复杂度低等优点。不规则应用程序中含有大量复杂的控制流和数据流,......
程序自动并行化技术一直是并行处理领域的研究热点与难点,目前虽然已取得了长足进步,但实际应用效果还不理想。我们以计算流体力学CF......
网格技术是一种力图把整个Internet整合成一台超级虚拟计算机计算平台的支撑技术。网格计算做为高性能计算的一个重要分支,为解决......
伴随着并行体系结构和处理器芯片的发展,计算机系统提供的计算资源越来越多,结构越加复杂,程序员手工编写并行程序的难度也越来越......
采用Spec CPU2006基准测试程序,对Intel编译器、Open64编译器和GCC编译器3个典型编译器自动并行化的效果进行评估,同时对GCC编译器......
介绍一种可扩展的自动并行化编译系统Agassiz,研究其架构设计及关键特性。该系统可以把串行程序转换为并行程序,并为编译优化技术......
信息物理融合系统(Cyber-PhysicalSystems,CPS)是一种计算、通信、控制与物理过程深度融合的复杂工程系统,通过计算资源与物理世界的......
可重构处理器具有通用处理器处理各种应用的灵活性,同时也能像专用集成电路一样具有高效的处理能力,在科研技术领域已经成为十分热......