一种面向科学计算的数据流优化方法

来源 :计算机学报 | 被引量 : 0次 | 上传用户:talen
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
传统数据流结构通过多上下文来隐藏指令等待源操作数的延迟,然而这种隐藏方式只能部分提高数据流处理器执行单元的利用率.在面向例如Stencil、FFT和矩阵乘法等典型科学应用时,传统数据流结构的执行单元利用率仍然较低.科学计算中的核心程序一般是对不同数据进行相同的操作,而且这些操作可以并行执行,数据之间没有直接依赖关系.传统数据流结构是面向通用计算的,通常采用循环来实现对不同数据的相同操作.在这些循环中,迭代是按照顺序依次执行的,这导致了传统数据流结构没有利用科学计算的并行性来提高性能.所以传统数据流结构在处理这些规则的科学应用时没有协调好数据流计算模式和科学计算特征,而数据流计算是非常适合科学计算这种类型的规则计算.基于科学计算的这些特征,该文提出了一种面向科学计算的数据流结构优化方法:循环流水优化方法.循环流水优化方法利用科学计算的分块和并行处理特征,对传统数据流结构中的上下文控制逻辑进行了改进,将科学计算中的循环采用硬件自迭代的方式实现,并将上下文切换逻辑进行了流水化,使数据流结构中的上下文以流水线方式进入执行单元阵列,从而提高计算单元的利用率.面对这种循环流水优化后的数据流结构,传统数据流结构上的指令映射算法不再适用.通过分析循环流水优化后的结构特征,该文进一步提出了一种改进的指令映射算法:LBC(Load Balance Centric)指令映射算法.LBC算法按照深度优先顺序依次映射数据流图中的所有指令,对每条指令分别计算执行单元阵列中所有位置的代价,取最小代价的位置作为最佳映射位置.LBC算法以执行单元负载均衡为核心,同时将定点指令和浮点指令分开处理,保证执行单元上的定点部件和浮点部件的负载均衡.每当映射一条指令时,LBC算法采用相邻节点传输延迟与已经映射的该类型指令数量的乘积作为负载代价,来实现计算部件的负载均衡.另外,LBC算法将网络拥堵也作为指令映射的影响因素.LBC算法将节点与所有父节点的距离之和作为传输代价,使指令间传输消息的路径最短,从而减小片上网络消息传递的跳数.实验结果表明,在处理典型科学应用时,相比于传统数据流结构,循环流水的优化方法将数据流结构的性能平均提高了4.6%.相比于传统指令映射算法SPDI和SPS,在循环流水优化后的数据流结构上,LBC指令映射算法将性能分别平均提升了182.6%和158.1%.
其他文献
目的探讨香芍方穴位贴敷对慢性胃炎气滞证患者中医症候积分的影响。方法采用目的抽样法,选择2017年9月—2018年3月我院脾胃病科收治的以慢性胃炎为第一诊断患者为研究对象。
据世界卫生组织统计, 恶性肿瘤已经成为继心脑血管疾病之后危害人类健康的最大疾病。化学药物疗法为治疗肿瘤的主要方法之一,但由于受血药浓度及药物毒性的限制, 肿瘤内难以
笔者分析了现代职业学校重知识轻素质的教育的现状,得出提升现代中职生职业素养的必要性。笔者首先研究了职业素养的内涵.得出在化工制图教学中从职业思想道德、职业文化素养、
意思自治是民法的基本价值取向.民事法律行为制度的功能是为了合理实现意思自治,意思自治原则在民事法律行为制度中最主要体现在契约自由原则上.
枸杞产业是青海省“十二五”时期重点支持发展的特色优势产业之一,对促进青海省经济增长、优化产业结构具有重要作用。文章基于对青海省特色枸杞产业发展现状的深入了解,运用综
电磁轴承是一种通过电磁力调节来控制转子悬浮状态的新型机电一体化轴承。电磁轴承凭借无接触,无磨损,无需润滑,功耗低,无污染,控制精度高,适合高转速等优良性能,在高速精密
目的研究绞股蓝不同组分对链腺佐菌素(STZ)所诱导的高血糖模型小鼠体重和血清中血糖(GLU)、总胆固醇(Tc)、甘油三酯(TG)、超氧化物歧化酶(SOD)、丙二醛(MDA)和游离脂肪酸(NEFA)的影响,确定绞
特色农业的产业化、品牌化是我国现代农业发展的一种必然趋势,它能够有力推进农村经济和社会的发展并促进“三农”问题的解决。但是部分地区在发展特色农业的过程中,由于自身
前言 肺癌是呼吸系统最常见的恶性肿瘤之一,在我国许多地区恶性肿瘤的死亡率统计中肺癌占首位。侵袭和转移是肺癌的重要生物学特征之一,也是决定肺癌预后的重要关键因素。Rac
分层制造(LM)技术是快速成型(RP)、快速模具(RT)和功能终端产品(RM)的基础。以激光和粉末烧结技术为基础的分层制造技术(例如选择性激光烧结/熔覆(SLS/SLM)等)在分层制造技术