论文部分内容阅读
一个纹理粗糙的可配置的数组(CGRA ) 的计算能力能显著地由于数据和上下文存储器带宽瓶颈被制止。传统地,二个方法被用来解决这个问题。一个方法在跑时间把上下文装进 CGRA。这个方法占据很小的在薄片上记忆,但是导致很大的潜伏,它导致低计算效率。另外的方法采用多上下文结构。这个方法在靴子阶段把上下文装进在薄片上上下文记忆。广播一套上下文的指针在一个 cycle-by-cycle 基础上改变硬件配置。上下文存储器的尺寸在多上下文结构导致大区域开销,它在应用程序复杂性上导致主要限制。这份报纸建议可预言的上下文缓