分片式处理器一级数据缓存的设计与优化

来源 :中国科学技术大学 | 被引量 : 0次 | 上传用户:xzy200611519
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
分片式处理器体系结构(TPA)能够很好地应对纳米工艺代的功耗、线延迟、设计和验证复杂度等一系列问题,是一种具有良好的性能扩展潜力的众核处理器体系结构设计方案。作为一种新型的处理器体系结构,分片式处理器的一级数据高速缓存是决定分片式处理器性能的一个重要因素,面临许多有待深入研究和解决的问题,包括访存延迟、通信和同步、存储二义性,以及可扩展性等。本文探索了分片式处理器(TPA-PI)的一级数据高速缓存的设计空间,提出了一种设计方案,并通过对其性能影响因素的量化分析完成了对该设计方案的优化。论文的主要研究内容和成果包括:(1)在充分调研学术界提出的分片式处理器体系结构一级数据缓存设计方案的基础上,给出了分片式处理器TPA-PI的一级数据缓存设计。一级数据缓存包含四个体以提高访存带宽,体与体之间的数据按地址交叉存储以减少数据同步,体与体之间的通信通过片上网络来进行。一级数据缓存主要包括Load&Store队列、缺失处理单元、存储依赖预测器等模块。(2)分析了应用在TPA-PI块执行模型下的数据依赖特征,提出了对TPA-PI的一级数据缓存设计的第一种优化—改进存储依赖预测器。模拟结果表明改进的存储依赖预测器可以提高大部分应用的存储依赖预测率。(3)分析了TPA-PI块执行模型的访存特征的基础上,提出了对TPA-PI的一级数据缓存设计的第二种优化—利用数据预取机制降低访存延迟。模拟结果表明数据预取机制可以减少访存指令的访存延迟。本文针对SPEC CPU 2000中部分程序的初步实验结果表明:两种优化方案在占用很少的片上资源的情况下可以适应大多数的应用程序。
其他文献
工作流技术是一种反映业务流程的计算机模型。传统工作流通常需要对工作流模型进行严格的定义,而在实际情况中,工作流实例往往偏离了预先的定义。为了使工作流能灵活的根据实际
随着电子商务和网络的不断发展,大型商场超市业已进入网络会员时代,在网络与实体店铺同步进行销售,但与此同时,商品种类数量越来越多,在琳琅满目的商品面前,无论是从网络还是实体店
遗传规划是一种进化算法,遗传规划所操作的程序树既是问题的解也是对于问题的一种描述。只要提供了描述问题的“函数”和“终结符”,遗传规划就能自动将其结合成解决问题的树
数字曲线可视为一种离散的几何信号;图像可以在空间上进行离散化,成为数字图像;三维几何模型可看作一系列离散点组成的非平稳信号。因而数字曲线、图像和三维几何模型的处理
城市交通中行人交通安全问题逐年恶化。为了保障行人交通安全,减少交通事故,车载行人检测技术已成为目前国内外智能交通领域公认的一个研究热点。它是通过车载的自动监视系统
随着电信技术、IP网络的发展,下一代网络NGN(Next Genration Network,下一代网络)技术正在迅速发展,软交换设备为NGN提供了具有实时性要求的业务呼叫控制和连接控制功能,是NG
P2P网络中,基于半分布式拓扑结构的P2P系统,结合了全分布式和中心化的特点,既有Napster良好的管理功能,又有Gnutella的健壮性和支持复杂查询的特点,具有良好的管理性和扩展性
随着网络带宽和传输速率的日益增大,各种网络业务飞速发展,网络流量自相似性的研究也逐渐成为热点,广泛应用于路由器排队、路由策略选择、网络测量、网络协议性能分析和网络
随着无线网络技术与传感器技术的不断发展与进步,无线传感器网络作为一种结合两者的新型网络技术,正逐渐引起全世界的广泛关注。节点可通过任意方式随机部署,自动组织成一个无线
计算机的发展激起了人们对人工智能的渴望,互联网的飞速膨胀改变人们对信息的理解。人们希望计算机能和人类用语言交流,能读懂互联网上的信息,能帮助人们从海量的信息中准确