基于FPGA的Cholesky分解细粒度并行结构与实现

来源 :计算机研究与发展 | 被引量 : 0次 | 上传用户:ccx1942
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
基于FPGA平台研究大规模矩阵Cholesky分解的细粒度并行结构与实现.首先在数据依赖关系分析的基础上,提出了Cholesky分解细粒度并行算法,然后提出了可扩展的一维线性阵列结构实现该并行算法.最后在设计的开发板上实现了单精度浮点Cholesky分解阵列处理器.综合结果表明,单个Xilinx Virtex5 XC5VLX330FF1760 FPGA芯片可集成32个处理单元.与运行在2.50GHz Pentium微处理器上的串行C代码相比,该阵列处理器取得最大104.413倍和平均78.789倍的性能加
其他文献
脑缺血是严重危害人类健康的重要疾病,脑缺血的动物实验研究是研究脑缺血性疾病的重要手段。近年开展脑缺血动物实验在方法学上不断更新并取得不少新发现,但脑缺血对脑细胞功能