SoC高层建模和存储子系统内存布局优化技术研究

来源 :东南大学 | 被引量 : 0次 | 上传用户：dingyougui1

【摘要】

：

嵌入式系统经过十几年的迅速发展，从简单的电子表、电子计算器到高数据吞吐量和密集计算的个人数字助理、移动式多媒体终端，它所包含的产品出现了显著变化。然而，随着处理器速度

【作者】

：

王学香

【机构】

：

东南大学

【出处】

：

东南大学

【发表日期】

：

2009年期

【关键词】

：

系统芯片高层仿真模型内存布局优化存储子系统片上存储器嵌入式系统

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

嵌入式系统经过十几年的迅速发展，从简单的电子表、电子计算器到高数据吞吐量和密集计算的个人数字助理、移动式多媒体终端，它所包含的产品出现了显著变化。然而，随着处理器速度与存储器访问延迟的差距不断增大，面向多媒体应用和实时控制应用的SoC芯片中存储子系统的访问延迟已经成为系统性能的主要瓶颈之一。另外，对基于RISC核的嵌入式系统来说，在面向影像，视频的应用中，能耗的主要来源不在于数据通路和控制器，而在于对存储器的频繁访问，其中片外存储器成为能耗主要的消费者。因此，如何设计和优化存储子系统，便成了SoC芯片设计过程中必须要解决的重要问题。本文以ARM、SPM、Cache、外部存储器接口和片外存储器构建的SoC存储子系统作为目标架构，探索了一套在芯片设计阶段进行存储子系统设计以及性能和能耗优化的方法。　　本文首先利用ARM公司的SoC Designer工具实现了一套时钟周期级(Cycle Accurate)精度的SoC高层仿真模型，为后续研究提供了软件运行环境和性能、能耗的评估手段。它设计和实现了EMI、SDRAM、Cache、SPM等模块的高层模型，ARM内核和AMBA总线采用库中的模型，并通过与RTL代码的VCS仿真结果相比，仿真波形与后者基本一致，仿真速度比VCS仿真快近600倍(RTL代码的VCS仿真速度为平均每秒钟177个周期，本文的SoC高层模型平均每秒钟可以运行105438个周期)，完全达到了系统级设计对于SoC高层模型的要求。　　基于以往SPM布局优化技术的分析，本文提出了一种基于扩展控制流图的SPM布局优化技术，适用于SoC芯片中嵌入式微处理器为ARM并且仅有SPM没有Cache的架构。该技术充分考虑了程序中所有的函数和数据，包括DCD数据、全局变量、堆栈数据、并根据划分粒度将函数进一步细分为指令块，从而把程序划分为一系列节点。采用扩展控制流图(ECFG)来描述各个节点之间的关系，进而生成性能矩阵、能耗矩阵和大小矩阵来更加精确的计算存储子系统的性能和能耗收益以及节点所需的SPM容量。本文采用改进的贪婪算法来解决节点分配这个经典的0/1背包问题，最后通过一个链接器自动生成新的目标程序。通过MP3player、Gunzip等基准测试程序的仿真实验结果表明，通过合理运用分配策略将程序中访问频度大的节点放入SPM可以大幅降低程序的运行时间和能耗。采用基于扩展控制流图的SPM分配策略把应用程序的一部分从SDRAM中移到SPM中运行可以平均减少应用程序的运行时间56％，降低能耗60％左右；与前人的研究相比，平均减少应用程序运行时间11％，降低能耗27％左右。在SPM的容量平均为2Kbytes时，对于上述基准测试程序可以得到性能和能耗收益相对于SPM容量的最大化。　　基于以往关于Cache组织架构的研究，本文提出了一种基于软件可控Cache方法的Cache布局优化技术，适用于SoC芯片中没有MMU并且Cache硬件结构可更改的系统架构。在以前的研究中大多选用Cache命中率，特别是读操作命中率，作为衡量Cache性能的标准。一般认为命中率越高，性能越好。但是在嵌入式应用中，命中率并不能真实地反映Cache的工作性能。另外传统的仅由硬件控制的替换策略，严重限制了高速缓存(Cache)性能的提高。本文提出的软件可控Cache优化方法，以总体操作开销(Total Operation Overhead，TOO)为研究对象，基于传统结构增加一个软件控制器，实现了如下的三种操作：①TOO很大且生命期均匀分布的数据块在Cache中保留副本；②TOO很大且生命期集中分布的数据块在其有效生命期内，优先保留在Cache中；③TOO很小的数据块由处理器直接与外存通信。通过软什配置，可以方便地控制影响Cache性能的数据存取操作，并且可以有效地控制硬件开销及能耗的增长，弥补了前人研究中存在的不足，为嵌入式Cache的设计提供了一种新颖的实现机制。通过CRC32等基准测试程序的实验结果表明，对于数据指令统一Cache，程序执行时间比普通Cache减少了约10％，同时总线占用率减少了28％左右，硬件开销为增加了8条标记表信息和相关控制电路。　　最后，对整篇论文的研究内容进行了总结，并指出本课题进一步发展的方向。

其他文献

细胞重编程因子导入新技术研究

诱导多能性干细胞技术是指通过特定重编程因子的表达将完全分化的成体细胞重新编程为类似胚胎状态的全能性或多能性的细胞技术。现有的重编程因子导入技术无论是病毒性载体还

学位

诱导多能性干细胞细胞穿透肽细胞重编程因子导入

技能需求

在美国,雇主企业需要什么样的技术技能?为了回答这个问题,求职网站Indeed的研究人员对它的数据库进行了深入研究.至少到目前为止,SQL专业知识是最受欢迎的技能,其次是Java.Py

期刊

人机智能融合:汽车智能化驾驶的新高度

随着社会发展和科技进步,对地面移动平台作业方式的自动化和智能化要求日益增高,进而推动了相关技术的发展,如为缓解交通压力、减少交通事故和方便人们出行,智能汽车驾驶技术

期刊

中国南部台湾乳白蚁遗传多样性及种群结构研究

台湾乳白蚁Coptotermes formosanus Shiraki，隶属于等翅目(Isoptera)鼻白蚁科(Rhinotermitidae)乳白蚁属（Coptotermes），是世界已知危害严重且易被引进和传播、蔓延的白蚁种之一。

学位

台湾乳白蚁微卫星分子标记遗传多样性种群结构地理隔离

探析电网调度运行事故处理及预控策略

本文通过对荣华二采区10

期刊

区域轨道交通的下一站:多制式协同运输与服务

随着中国都市区和城市群的快速发展,相关区域内的干线铁路、城际铁路、市域(郊)铁路和城市轨道交通等轨道交通建设突飞猛进并呈现网络化发展趋势,让人们的生活越发便捷,城市

期刊

深海仪器装备规范化海上试验

深海仪器装备是研究、开发、利用海洋的必要手段,发展海洋高技术,自主研发和制造深海仪器装备是实现海洋强国战略的最重要支撑条件.近年来,我国科技计划专项支持研发的深海仪

期刊

芽殖酵母DNA复制机制的研究

DNA复制是生物体稳定传递其遗传信息并保证生命延续的基本前提。因此DNA复制机制的研究有着极其重要的意义。虽然半不连续DNA复制模型已经被人们广为接受并被认为适用于大多

学位

真核生物芽殖酵母DNA复制X核酸外切酶閃崎片段全基因组定位

巨人计算机背后的隐藏人物

第二次世界大战期间,在布莱切利公园有10台巨人计算机(Colossus)在高度风险和保密的环境下,夜以继日地破解着纳粹德国的洛伦兹(Lorenz)密码.这些尺寸有房间大小的机器里装满

期刊

吸收型光纤气体传感器解调系统的研究

光纤气体传感技术是20世纪70年代伴随光纤通信技术的发展而迅速发展起来的，以光波为载体，光纤为媒质，感知和传输外界被测信号的新型传感技术，在工业生产、环境监测和医学等多个领

学位

光纤气体传感器光谱吸收谐波检测解调系统

SoC高层建模和存储子系统内存布局优化技术研究

与本文相关的学术论文