面向CUDA程序的性能预测框架

来源 :电子学报 | 被引量 : 0次 | 上传用户:jordanfandemin
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
为对CUDA并行程序内核性能进行分析和预测,从而指导并行程序设计及性能优化,提出一种性能预测框架.1)从GPU编程模型和设备架构细节入手,以线程束为研究单位,通过整合与GPU程序用时密切相关的软硬件基本特征,定义了并行空间闲置度、流处理器线程束负载、并行效应因子等高层次性能相关特征.2)基于上述特征,框架针对线程负载均衡型GPU程序,评估内核函数在不同问题规模以及执行配置下的执行时间.3)依据性能评估原理提出了内核函数执行配置参数的优化策略.验证实验结果表明,该框架在两种典型情境下对现有程序性能的平均预测
其他文献
目的探讨20例癫痫持续状态患者的急诊急救的综合护理,以总结抢救成功的措施。方法通过及时采取病情观察、心理护理、气道管理、营养支持等全面系统的护理干预,并进行严密观察
目的了解腹股沟疝手术围手术期预防感染用药效果。方法采用回顾性调查方法,对96例围手术期用药与传统术后用药进行效果比较。结果术后最高体温、术后退热时间、术后病率、腹
大数据分布式存储系统中,修复流水线(Repair Pipelining,RP)减少90%的修复时间,有效地解决由于修复时间开销较大,纠删码不适用于存储热数据的问题.然而,现有的RP存在节点负载
2型糖尿病的主要发病机制是胰岛素分泌缺陷和(或)胰岛素抵抗,高糖毒性的长期存在可加速胰岛B细胞功能的衰竭,胰岛素强化治疗可使血糖得到快速理想控制,并有效解除糖毒性对胰岛B
目的总结丈夫对妻子供肾移植的临床经验,分析临床效果。方法回顾性分析郑州人民医院器官移植科于2002年4月至2010年12月期间10例丈夫对妻子供肾移植的临床及术后随访资料。所
本文通过对2005年以来铁路食品运输污染情况分析,得出铁路食品运输污染呈现新的特点,主要是污染事件大幅度下降,从化学性污染为主变为漏雨致湿损霉变生物污染为主。提示在新
大量研究表明,microRNA(miRNA)在人类复杂疾病研究中发挥着重要作用.识别miRNA与疾病之间的关系对于提高复杂疾病的治疗水平具有重要意义.然而,传统实验方式常受限于小规模和
目的观察醋酸去氨加压索在开放性前列腺术中止血的安全性和有效性。方法选择ASAⅠ~Ⅱ级开放性前列腺手术患者54例,随机分为醋酸去氨加压索组(DDAVP、例数=27)和对照组(例数=27),DD
针对多目标跟踪中的传感器控制问题,本文基于有限集统计(FISST)理论,利用高斯混合多伯努利滤波器研究并提出相应的传感器控制策略.首先,文中给出容积卡尔曼高斯混合势均衡多
任务切换实验是评估人类认知灵活性的有效范式,其中提示语切换实验(Task Cuing)能够有效地测量任务切换的认知过程.为了深入研究任务切换的认知过程,本文设计了提示语(cue)和