论文部分内容阅读
随着云计算和大数据技术的发展演化,现代数据中心对数据的存储和计算提出了新的需求,内存计算技术成为大数据时代的重要技术手段。由于功耗和存储密度的限制,传统的基于动态随机存取技术(DRAM)的内存系统面临着扩展性瓶颈。以非易失性内存(NVM)为代表的新型内存技术,因其高存储密度和较低的静态功耗,为突破内存系统的扩展性瓶颈提供了新的契机。 然而,NVM的写操作的延时和功耗要远远高于读操作。写操作的低效性在形成写关键路径的同时也放大了写后读的时延,从而给内存子系统设计带来了严峻的挑战。传统的面向DRAM的末级高速缓存(LLC)替换算法,专注于提升缓存命中率,没有考虑读写操作的不对称性,无法适应基于NVM的内存系统的技术特点。 面向NVM的LLC替换算法研究,提出了基于时延的统一重用优先级URP模型,将提升缓存命中和减少写回流量作为统一的优化目标。基于URP模型,设计了面向写回的读写区段划分机制,提供了一种逻辑上的读写数据块分割机制,能够同时保障LLC的命中率和对NVM的写回流量,通过使用基于动态采样的分区预测器估算当前时间窗口内最佳的读写区段容量,支持访存类型感知的分区动态调整;设计了基于热度和写后重用的写分类预测算法,从写访问的频度及数据块的写后重用率两个维度进一步对写操作请求做了细粒度的区分,通过提升频繁写和写后重用度高的数据块的统一重用价值,降低了这类高价值数据块被替换的概率。 在基于时钟周期准确的微体系结构模拟器上实现了URP算法,基于访存密集型的微基准测试程序SPEC CPU2006和真实的图计算应用GraphBIG的评测分析表明,对于SPEC CPU2006,URP算法能平均改善性能约17.2%,对内存的读写流量分别降低约24.3%和43.5%,改善功耗约25.3%;对GraphBIG,URP算法能平均改善性能约12.3%,对内存的读写流量分别降低约14.6%和11.5%,改善功耗约3.9%。与同类的其他算法相比,基于全局时延优化目标的URP算法能以微弱的系统开销,有效地降低对内存系统的读写访问流量,改善系统功耗,提升系统整体性能。