循环变换相关论文
近年来,结合了通用处理器的灵活性和专用集成电路的高效性优点的可重构计算技术获得了广泛深入的研究,它具有灵活高效的结构,非常......
该文在迭代空间变换的基础上,提出了一种利用循环变换增加循环并行粒度,改善循环数据访问局部性的方法.首先针对循环并行粒度的问......
近年来以机群为代表的分布式存储超级计算机系统逐渐成为超级计算机的的主流,与共享存储超级计算机相比,分布式存储机群系统最大的区......
当代的计算机应用程序大部分是多媒体应用,包括音视频处理,图像处理,3D绘图,语音识别等,这就对处理器提出了更加严格的实时性要求......
现代数字信号处理器经常采用超长指令字体系结构。与通用处理器普遍采用的超标量体系结构相比,超长指令字将调度任务交由编译器完成......
文章对MD5即"Message-Digest Algorithm 5(报文摘要算法)"算法进行了简要描述和分析,并利用目前流行的C#对MD5算法进行了具体的实......
在IA-64架构Itanium2处理器上,应用gprof和pfmon对二维非线性对流扩散方程求解程序源代码进行了性能测试。在分析给定程序的数据结......
在线性空间V中,对于V上的一个线性变换σ是否存在Зα∈V,使得α,σα,σ^2α,……σn-1α构成V的一组基?本文我们将给出上述α存在性的......
现代的计算机处理器和计算机系统实现了很多先进技术,要利用这些技术更需要编译器的支持以取得高性能。GCC中Tree-SSA优化框架提供......
文章[1]中提出了数组之间的数据融合优化方法,并以IA-32服务器为平台测试了数据融合优化的效果。测试结果表明,在IA-32机器上,数据融......
设计一种基于多面体模型的静态数据依赖分析方法,对程序中的循环体进行分析,将生存周期思想引入到数据的依赖分析中.数据的依赖关......
结点间流水是解决数据分布和计算分割不一致时的一种重要的并行发掘技术.结点间流水通过计算与通信的重叠获得并行度.精确的流水粒......
阐述了一种适用于核外计算程序的变换技术,它通过联合使用循环变换和数据变换这两种编译优化技术来增强程序的局部性,提高数据存取......
在IA-64架构Itanium2处理器上,应用gprof和pfmon对二维非线性对流扩散方程求解程序源代码进行了性能测试。在分析给定程序的数据结......
提出了一种利用循环变换增加循环并行粒度,改善循环数据访问局部性的方法.该方法利用了给定二重循环的相关向量集的某些性质,将外......
循环优化对于提高Cache性能、发掘程序的并行性以及减少执行循环的开销都有着重要的作用,证明带循环优化功能的现代编译器的正确性......
在并行编译中,循环变换是开发程序并行度的主要方法,但存在复杂控制流的非紧密嵌套循环往往无法得到有效的并行化。文章结合分析Benc......
为讨论Bent函数性质的需要,在研究了线性函数与Bent函数关系及e-偏导数的密码学性质的基础上,本文提出了一种判断布尔函数是否为Be......
由于很多嵌入式系统是主要由电池提供能量,存储器的容量有限,且有实时性要求,因此,设计有效算法以优化能耗、空间及时间性能对嵌入......
随着CPU芯片上集成的计算核心不断增加,计算机系统峰值性能不断攀升。近年来,多核处理器已经占据桌面,众核处理器即将普及。但是应......
SIMD (Single Instruction Multiple Data)扩展部件已广泛应用于现代高性能计算的并行处理架构中,它使用宽位SIMD寄存器对多个字符......
《千字文》作者为南朝周兴嗣。千字文,即由一千字组成的韵文(在隋唐之前,不押韵、不对仗的文字,被称为"笔",而非"文")。相传梁武帝......
随着工艺水平的进步和处理器体系结构的发展,处理器的速度已远远超过了存储器的速度,从而导致了“存储墙”的出现。为了解决“存储墙......
cache的使用缓解了CPU和主存储器之间速度差距太大的矛盾,同时,也使cache的命中率成为影响多处理机系统性能发挥的重要因素.人们对如何加强数据的局......