论文部分内容阅读
传统编程优化(Traditional Programming Optimization,TPO)在Intel Knights Corner (KNC)上收效甚微,因此提出内存访问优化(Memory Access Optimization,MAO).将MAO应用到已经过TPO的程序Diffusion 3D上,发现其性能仍然提高了39.1%.主要有2个贡献:1)提出MAO,认为TPO+MAO有助于在KNC上获取最优化性能;2)发现对于stencil代码,基于intrinsic的MAO比基于编译器的MAO更高效