高性能微处理器中自适应高速缓存管理策略研究

被引量 : 0次 | 上传用户:jary_chane
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
对主存储器的访问是制约高性能微处理器系统性能的主要因素之一。存储器的访问速度通常会比处理器速度慢两个数量级,为了缩小这一差距,当代处理器设计已经将一半以上的片上晶体管资源用于最后一级高速缓存。然而,针对小容量一级高速缓存的传统管理策略并不能有效地管理大容量最后一级高速缓存,由此引发了大量的高速缓存缺失,从而导致频繁的片外内存访问和处理器性能的严重下降。增加的访存延迟、有限的片外带宽、破坏性的线程间干扰、多样化的负载特性、扩大化的新兴应用工作集规模,单一芯片内所集成处理器核数目的增加,以及由此导致的每个处理器核所占有高速缓存空间的减少等诸多方面的因素都给高速缓存的设计带来了极大的挑战,也使得高速缓存管理策略的重要性变得越发关键。本文重点分析了高性能微处理器尤其是多核处理器中最后一级高速缓存管理的若干热点问题,并提出相应的开销合理的解决方案来提高系统性能。论文的主要研究内容与创新之处包括:1.同时多线程处理器中高速缓存公平划分技术研究。传统的LRU替换策略会根据线程的需要隐式地对共享高速缓存进行划分,不同负载时间重用行为的差异导致它们对高速缓存资源的竞争能力存在差别,这会对并发调度线程的推进速度造成不一致的影响。不公平高速缓存共享问题使得操作系统线程调度的效率遭到丧失,线程饿死、优先级反转等问题呈现。针对这一情况本文实现了一种自适应、运行时划分机制(ARP)来管理共享高速缓存,该机制以提高公平性为优化目标,在每个周期内使用基于动态组采样的硬件监控器电路来收集栈距离剖析信息,从而精确地估计每个线程公平性度量的数值,并利用划分与回滚相结合的贪心算法来确定最优的划分方案。实验结果表明,相比于LRU策略,ARP可以将一个2-路同时多线程处理器的公平性提高2.26倍,同时将吞吐量平均提高14.75%。2.多核处理器中高速缓存颠簸避免技术研究。随着最后一级高速缓存容量和相联度的增长,LRU策略和理论最优替换算法之间的性能差距日趋增大,引起这一问题的主要原因是LRU策略会导致大工作集访存密集型负载发生高速缓存颠簸,并且在选择替换块时仅仅考虑了高速缓存访问的临近信息而忽视了数据的访问频率。本文指出访存密集型负载的性能可以通过无用数据的及早替换和改变低使用频率数据的插入和提升位置而得到显著提升,基于这一思想本文提出无用块消除和低使用频率块过滤高速缓存管理策略,该策略利用活动时间预测器来预测数据块的使用频率,根据预测结果将无用数据提早替换,将低使用频率数据插入到低优先级位置以降低其驻留在缓存空间的时间,从而成功地避免工作集规模大于共享高速缓存容量的访存密集型负载发生颠簸,并考虑了程序中数据的临近性和使用频率信息。与LRU相比将4-路多核处理器的加权加速比平均提升14.5%。3.多核处理器中高速缓存混合管理策略研究。目前传统的单一高速缓存管理策略已经无法满足不同局部性特征负载的性能需要,当并发执行的线程间存在破坏性干扰或者负载的工作集超过可用高速缓存容量时,最后一级高速缓存的性能以及由此关联到的多核处理器的性能都会严重下降。针对这一问题,本文提出划分感知淘汰线程感知插入/提升(PAE-TIP)混合高速缓存管理策略,该策略采用低开销的锦标赛机制来确定每个线程缺失数据块的插入位置和命中数据块的提升位置,并且根据基于效用的高速缓存划分算法所提供的目标分配方案来选择被淘汰的数据块。能够同时对共享高速缓存实施包括容量管理、自适应插入和自适应提升在内的混合管理,在多种具有不同数据局部性特征的访存行为之间进行必要的折衷。实验表明,相比于传统的LRU策略, PAE-TIP能够将4-路多核处理器的加权加速比平均提高19.3%。
其他文献
<正> 宋家庄在大同城西北五里,同蒲铁路的南侧,北靠雷公山,南临十里河北岸之广阔平原。1958年,我们在宋家庄附近进行过钻探,发现古墓较多。冯道真墓是同年10月上旬发现的,位
研究表明,话语标记语在语言交流中扮演着重要的角色。因此,它们已成为语言学领域学者们所追捧的研究对象。本文首先回顾了话语标记语研究中一些最常见的概念与构念,如话语标
公平体现在人类生活的各个方面。特别是在信息高速化,生产提速化的今天,公平的重要性体现的更加明显。但是,不公平的现象仍屡见不止。如今,数字鸿沟与信息分化在全世界中存在
《史记》的整理刊行由来已久。及至1959年,中华书局出版顾颉刚先生领衔点校之《史记》,1982年再版,风靡半世纪有余,为今世最普及之《史记》通行本。其以金陵书局本为底本,参
随着人类基因组计划的完成,生命科学的研究重点逐步的从基因组学转向蛋白质组学,人类进入后基因组时代。蛋白质组学的研究重点是蛋白质的结构与功能,而蛋白质的结构决定了蛋
摘要:由于受到体制的限制,铁路客运站的规划、设计、建设均是由铁路部门完成的,铁路客运站外的区域则是由北京市政府部门规划设计的,二者存在脱节之处,难免选成换乘系统效率低
摘要:随着我国铁路大规模的建设,许多高速铁路、城际铁路、客运专线投入使用,北京站、北京西站、北京南站、北京北站成为联结铁路运输、城市公共交通的枢纽。这些枢纽站对衔接
目的建立快速、灵敏测定人体血清/全血中维生素B_1的稳定同位素稀释-超高效液相色谱串联质谱(ID-UPLC-MS/MS)法。方法血清/全血样本经蛋白质沉淀处理,上清液用双蒸水稀释,采用T
目的:探讨了不同孕期妊娠妇女血清铁蛋白(SF)、叶酸(FA)和维生素B12(VitB12)水平的变化及意义。方法:应用放射免疫分析对132例不同孕期的妊娠妇女进行了血清SF、FA和VitB12的
冲脉为奇经八脉之一。奇经八脉包括任脉、督脉、冲脉、带脉、阳蹻脉、阴蹻脉、阳维脉、阴维脉,是有别于十二正经的另一类的经脉,《内经》中将冲脉概括为“十二经之海”、“五