基于代码插桩的寄存器传输级模拟加速方法研究

来源 :郑晓铧 | 被引量 : 0次 | 上传用户:liongliong424
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在异构体系架构中,硬件加速器的广泛使用带来了性能和能效的提升。加速器设计流程中,高层次综合工具可以将加速器的C语言设计编译成硬件语言描述的寄存器传输级(Register Transfer Level,RTL)设计。RTL模拟是硬件设计中功能验证的重要步骤,用它验证加速器设计具有较高的精确度,但是生成、模拟并分析一个比较复杂的加速器RTL设计通常消耗数小时甚至数天的时间。然而,现有的RTL模拟加速方法中,对RTL模拟分析过程进行优化的加速方法对较大规模加速器的加速倍数较小,依靠额外硬件的加速方法成本较高,对加速器的C描述进行性能建模的加速方法未完成对加速器电路设计的功能验证。为了解决上述问题,提出了一种基于代码插桩的RTL模拟加速方法。对加速器的C语言描述进行代码插桩,跳过加速器中大部分重复的循环迭代不进行分析,用高层次综合工具将其编译成硬件语言描述并进行RTL模拟,实现了较大的RTL模拟加速倍数;建立了性能预测模型,用部分循环迭代的RTL模拟性能结果预测原本完整的RTL模拟的周期数;代码插桩插入了变量还原代码,保证RTL模拟结果的正确性,并且在不使用额外硬件的条件下完成了对电路设计的功能验证,同时减小了性能预测误差。此外,设计了使用该方法的加速器设计代码框架以及一系列编程接口,方便用户高效地使用此加速方法设计加速器,从而提高了用高层次综合工具进行加速器硬件设计的效率。实验部分用Mach Suite加速器基准程序验证提出的方法,使用Vivado XSIM进行RTL模拟。实验结果表明,对于单次数据处理和批量数据处理的加速器RTL模拟,此方法的加速平均倍数分别可以达到7.49倍和43.3倍,对性能的周期数预测误差平均值分别为1.71%和1.06%,有效地缩短了RTL模拟的时间并控制了较低的精确度误差。并通过实验总结、推导出使用该方法跳过循环迭代的间隔值公式,使得用户在使用该方法进行加速器硬件设计时,可以快速找到加速倍数和精确度之间的平衡地带。
其他文献
水产品自身携带的腥臭味在很大程度上限制水产品加工生产与消费,探讨水产品腥味物质的提取和分析技术对水产品加工生产具有重要意义。该文对近年国内外水产品腥味物质的提取技术和分析技术进行综合阐述,并对提取、分析技术进行优缺点对比,旨在为腥味脱除和水产品高值化加工生产提供参考。
期刊
元代科举自延佑元年(1314)始,至至正二十五年(1365年)终,期间中断七年,共举行十六科,取士1300名左右。其规模与影响无法与前朝相比,但在中国科举演变史上,却起到了过度作用。元代科举的名额分配,在数量上看似是平等的,乡试在蒙古、色目、汉人、南人中各选75人进入会试,在会试中各录取25人。但实际的情况则是除了元统元年(1333)录齐100人之外,其余科都不足百人。考虑到人数分配及整体族群人数
学位
小微企业的发展对国民经济的运转有重要的影响,是税收和GDP的主要贡献者。小微企业规模体量小、经营风险高、信用度低等特点阻碍了其在金融市场快速融资,是限制发展的因素之一。近年来供应链金融模式发展逐渐成熟,借助供应链上下游企业之间的贸易往来和核心企业的信用担保为小微企业提供融资解决方案。但是传统供应链金融存在诸多弊端,例如信息不对称、运转效率低、操作成本高、风险管控难等。近两年来,区块链等金融科技技术
学位
<正>教师困惑我觉得教学设计最难的就是课堂主线的挖掘,有的时候题目和素材都确定好了,但是整体设计下来却如同搭积木一样缺少灵魂、浮于表面。若要挖出教学设计的主线,应该怎么办?教研解惑真破题,从内部打破真破题,是从内部打破主题,而不是在外围围绕主题转圈圈。小学高年级学生的“学会包容”主题,
期刊
致密油藏储层低孔,低渗、超低渗的特点使得只有采用大规模的体积压裂改造和对应的助排措施才能达到有效生产的目的。而在压裂改造后采用常规的助排剂提高采收率仍然存在致密砂岩油藏纳米级孔喉流动困难,并且生产产量递减快的特点。针对上述问题,提出了纳米压驱复合液压裂驱采一体化的技术思路,在压裂施工过程伴随压裂液注入纳米压驱复合液,增大储层改造体积同时一并改善致密储层流体的可流动性,具有较好的推广前景。
期刊
<正>《数学课程标准(2022年版)》指出:借助学生的生活经验,引导学生认识小数单位,进一步感悟十进制计数法,在这样的过程中,发展学生数感。基于此理念,在《小数的意义》这节课教学中,从小数的计数单位——0.1、0.01、0.001的建构入手,充分调用学生已有的平均分经验,巧妙嫁接几何模型,迁移到小数的计数单位的学习;拓展不同的学习素材,通过类比推理,多元表征建构多位小数;利用数线模型表征整数、
期刊
中小企业在我国经济发展中,有着不可替代的地位,但由于其管理水平落后、经营风险较大、缺乏抵押担保物等原因,导致很难融资。供应链金融从整条供应链出发,通过把控链上各方的交易关系解决中小企业的融资困境,但供应链金融的参与主体众多、业务流程复杂,存在一些风险因素阻碍其发展。区块链作为一项新兴技术,具有去中心化、不可篡改等特征,这些技术特征能够有效契合供应链金融风险的控制。将区块链技术引入供应链金融中,优化
学位
当今世界主要大国的科技竞争愈发激烈,科技领域的语言竞争和语言问题日益凸显。目前,我国对科技领域语言问题的探讨不够充分,对中文在世界科技领域的语言功能及影响力的相关研究有待拓展和深化。文本借鉴语言功能分类理论,尝试建立世界科技竞争中的语言功能分析框架,归纳语言功能参数,基于对科学网(Web of Science)近20年收录的中文科技成果数据进行文献计量分析,从三个层面、九个维度总结、分析和讨论中文
期刊
中文命名实体识别(CNER)指识别中文文本中具有特定意义的实体,是自然语言处理诸多下游任务的重要基石。近年来,深度学习技术依托其端到端的方法,自动学习到更深层次和更抽象的数据特征,摆脱了人工标注的依赖,解决了高维特征空间的数据稀疏问题,从而逐渐成为中文命名实体识别方法的主流。首先回顾了命名实体识别的发展进程和CNER的特殊性和难点;接着围绕着中文命名实体识别的不同处理特点,将基于深度学习的中文命名
期刊
《语言教学与研究》编辑部近些年特别关注语言学研究及相关应用研究的新观念、新理论、新方法、新领域、新学科的生长过程和实践活动,并以大家谈或专栏形式不定期地刊发相关探新成果,以期深入参与和推动创新性探索过程。所刊作品不求成熟,重在予人启发,引人思考。欢迎学界同仁积极参与、共献智慧,大力推进相关研究和实践工作。ChatGPT的出现,引发了国内外各界的热烈讨论。人工智能领域的创新发展将对国际中文教育带来何
期刊