众核系统动态分区Cache一致性协议与分区内负载感知广播机制研究

来源 :上海交通大学 | 被引量 : 0次 | 上传用户:chiaotian
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
众核处理器在片上集成了数十到数百个轻量级处理核,通过开发线程级的并行性来提高运算能力,众核核数竞赛已经成为微处理器架构的趋势。在众核系统中,处理核资源充足,一方面,这要求系统能够有效的利用空闲资源,另一方面,核与核直接的通信代价是制约系统整体性能的重要因素。研究表明,随着众核处理器核数目的增加,Cache一致性协议的性能急剧下降,现有的全局Cache一致性在大规模的众核系统中并不可行。具体的说,随着多播和广播通信的增加,片上互连网络(Network-on-Chip,NoC)的通信负载急剧增加、吞吐率急剧下降,这说明现有的NoC结构无法有效地支持Cache一致性产生的众多全局多播、广播包。对此,一种主流的方法是对众多处理核进行分区,每个分区包含若干处理核,一个分区运行一个任务,分区之间不共享资源。基于这一任务级的分区机制,本文从三个方面提出机制,以支持分区内的Cache一致性协议,提高Cache一致性协议和分区内核间通信的性能:第一,在Token一致性协议的基础上,提出改进的分区内Token一致性协议,减少了Token协议的通信代价。第二,在逻辑分区与物理分区概念的基础上,提出基于bLBDR的NoC层分区间通信隔离方法,在路由器内使用较少的存储空间就能实现分区间的通信隔离,同时支持分区的重叠。第三,在分区间通信隔离的基础上,提出负载均衡的广播路由算法,进一步优化分区内广播的性能。算法根据通信负载情况动态变化路由方式,从而在高低通信负载的情况下都能取得较低的时延。本文基于Noxim NoC仿真器,对支持负载感知广播的路由器进行了硬件建模,对比传统双路径广播和xy树广播进行注包实验;同时,基于Graphite众核处理器模拟器,对三种广播算法进行了行为建模,并分别运行Benchmark测试集进行实验。实验结果表明,不论在低通信负载还是高通信负载的条件下,负载均衡的广播路由算法均能取得较低的通信时延。
其他文献
20世纪90年代初起,以货运物流业、银行业为首的中国央企就已经走出国门,大力拓展海外市场,并逐渐在世界各地建立起分支机构。海外分支机构成立初期,通常会调派国内业务骨干开
肿瘤的多药耐药性(MDR)是制约肿瘤化学治疗的一个重要因素。MDR的产生机制十分复杂,其中药物外排蛋白的过表达已被广泛认可和接受。MRP1是一种重要的药物外排泵,其能有效外排
Combretastatin A4(CA4)是从南非灌木Combretum caffrum中提取分离获得的顺式二苯乙烯类化合物,是迄今已发现的微管蛋白抑制剂中活性最强的化合物之一。CA4P的抗肿瘤作用机制
改革开放以来,中国的通用航空随着中国经济的持续健康发展保持较好的发展态势,2014年中国航空旅客运输市场同比增长12%。航空运输在我国整体交通运输体系中比重已从1990年的4
以乙醇溶液为提取溶媒,以梓醇得率为评价指标,乙醇浓度、溶媒用量、提取次数、提取时间为考察因素,用正交设计方法优化得到地黄叶最佳提取工艺为:10倍量50%乙醇,提取3次,每次
全面质量管理是一种优秀的管理模式,是各类企业在管理上势在必行的发展要求。军工企业内全面质量管理落实情况不佳,全员参与质量改进活动、推进军工企业的全面质量管理深入发
研究目的:白血病是一种恶性血液系统疾病,也称血癌,严重威胁患者的健康甚至生命。虽然有多种治疗方法,但以化疗为主要手段,然而其毒副作用和耐药目前依然无法避免,而针对异常
丹参新酮是中药丹参中一个具有抗氧化、抗肿瘤、保护心脑血管等活性的脂溶性化合物,由于在天然产物中含量较少,大大限制了对丹参新酮的研究和开发。本文第一部分以鼠尾草酸为
目的:本研究以肠道菌群为出发点,采用实时荧光定量PCR技术,对功能性腹痛综合征(FAPS)患者肠道中的双歧杆菌、乳酸杆菌、大肠杆菌、肠球菌进行定量分析,以此探讨功能性腹痛综合征(FAPS)患者是否存在菌群变化,从而为功能性腹痛综合征(FAPS)的发病机制提供新线索,为功能性腹痛综合征(FAPS)的治疗寻求新的靶点。方法:采用前瞻性、随机、对照研究,将研究对象分为病例组与健康对照组两组。病例组为就诊
伴随着科技的发展,现代人所面临的是一个无法剥离网络环境的时代背景。尤其是从2007年以来,以中国内地出现微博为标志,这一集快速信息发布和交流于一体的网络平台,以及随之出