论文部分内容阅读
基于以三星的 Exynos5250处理器为核心的 Arndale Board 嵌入式开发平台,对集成于处理器上的 Mali T604嵌入式 GPU 的 GPGPU(General-Purpose computation on GPU)技术进行研究,并对不同运算规模的浮点矩阵乘法进行并行加速优化,提供实际测试结果。Linux 操作系统上的实验结果显示,基于 Mali GPU 的并行浮点矩阵乘法方案相对原始串行算法而言,效率显著提高,并且运算规模的增大可以显著提高并行性。