龙芯2号片外存储系统性能分析

来源 :中国科学院计算技术研究所 | 被引量 : 7次 | 上传用户:dl_smh
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
访存性能是现代计算机系统性能的主要瓶颈。近二十年来,由于生产工艺、电路设计等方面的进步导致处理器主频每年以60%的速度提高,而DRAM的工作频率每年却只有10%左右的提高。处理器与DRAM工作频率的差距导致一个cache miss操作可能会引起几十个周期、甚至上百个周期的等待,大大降低了整个系统的性能。因此,如何提高访存性能已经成为计算机体系结构研究的一个重要方向。存储系统性能主要表现在两个方面:延迟和带宽。片外存储系统的访存延迟主要由DRAM延迟决定,带宽则是由内存总线的数据传输率所决定。DRAM存储单元由一对MOS管-电容对组成,电容的电位决定了存储单元的逻辑是1还是0。在访问DRAM存储单元之前,必须将位线预充(precharge)到1/2VCC,预充操作是执行其他DRAM命令的基础。所以,一个完整的DRAM访问包括三个部分:行选、列选和precharge。现代DRAM支持两种page策略:close page和open page。采用close page策略时,DRAM延迟由行选时间和列选时间两部分组成,访问结束后DRAM立即进入precharge周期。采用open page策略时,若下一个请求访问bank的同一行(page命中),则DRAM延迟仅包括列选时间;否则还需要额外的precharge时间。应该采用哪种page策略是由应用程序的访存模式决定的。另外,DRAM还支持不同bank的并发访问(multi-bank interleaving)。page策略和bank并发访问为开发DRAM系统性能提供了空间。本文主要讨论龙芯2号片外存储系统性能,介绍了SDRAM控制器的建模方法,分析了open page和bank interleave对系统性能的影响,评价了不同地址映射方式对page命中和bank interleave的影响。为了了解page不命中时程序的访存行为,我们从连续page命中的访存序列长度,最近32次访问的平均page距离,以及page替换距离等角度分析了SPEC CPU2000的访问模式。在此的基础上提出了扩展page的概念,并对其优化效果进行了初步评估。最后总结已完成的实验内容以及未来工作的一些方向。
其他文献
需求工程是软件工程领域的重要研究内容之一.自上世纪60年代软件危机出现以来,人们都致力于研究解决软件危机的办法.随着研究的逐步深入,人们意识到使用工程化的方法从事软件
计算机病毒对计算机安全和网络安全构成极大的威胁,随着变形病毒在网络上的飞速蔓延,传统防御病毒的手段和工具显示出越来越多的缺陷。其中最关键的问题是传统方法无法准确检
数据仓库技术是在数据模型、数据库和应用开发等技术不断进步的基础上发展起来的,其目的主要是对巨量数据进行分析处理进而提供决策支持。本质上,数据仓库是一个使用其自身数据
我们生活中使用的智能卡只有很少的硬件平台.它的存储空间也许只相当于1 K的RAM,16K的EEPROM和24K的ROM.所以Java卡技术设计的最大挑战是在保留足够的应用空间后将Java系统软
近年来,针对传统企业和关键部门的计算机应用仅停留在诸如文档处理、公文流转以及信息发布等简单业务层面上,越来越多的企业或部门要求将信息技术的应用扩展到工作流系统,本文研
人工智能是当下的热门主题,实现对图像智能化的理解与分析是其中一个重要领域。图像智能包括图像分类,图像分割,目标检测等。目标检测是进行场景内容理解等高级视觉任务的前
数据挖掘是一种通用的技术,它是从大量的数据中提取人们感兴趣的模式的过程。将数据挖掘技术应用到网络安全当中,建立网络入侵检测系统模型,就是通过建立我们所需要的网络行
本文重点是对VLAN相关技术的研究.具体包括局域网与交换技术,VLAN技术,VLAN相关协议分析及其中继技术.特别是对2层交换、3层交换、IEEE802.1Q协议,以及以太网通道技术进行了
计算机网络和多媒体技术的发展,尤其是近几年基于TCP/IP的宽带网络的迅速发展和普及,基于IP网络的多媒体应用--MoIP(Multimedia over IP)成为一个备受关注的领域。社区宽带网的
虽然现在网上有海量的信息,例如Google能检索出成千上万的网页,但是仍然有很多信息没有办法被搜索到。很多知识不能存储于文档或者数据库中,而仅存在于人的脑子中,这些知识被