论文部分内容阅读
在高性能计算等应用领域,FPGA器件的复杂程度越来越高,已经进入16核、500多万逻辑单元的级别,DSP也可以达到10TFLOPS的性能,但是,在实现高性能计算的路途上仍存在一个瓶颈,这就是数据的传输速率,虽然处理单元的性能和速度足够强大,但如果数据从存储器到处理单元的传输速度跟不上,运算性能也会大打折扣。