基于延迟隐藏因子的GPU计算模型

来源 :2010年全国高性能计算学术年会(HPC china2010) | 被引量 : 0次 | 上传用户:zeer
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
  近年来在生物计算,科学计算等领域成功地应用了GPU 加速计算并获得了较高加速比.然而在GPU 上 编程和调优过程非常繁琐,为此,研究人员提出了许多提高编程效率的编程模型和编译器,以及指导程序优化的 计算模型,在一定程度上简化了GPU 上的算法设计和优化,但是已有工作都存在一些不足.针对GPU 低延迟高 带宽的特性,提出了基于延迟隐藏因子的GPU 计算模型,模型提取算法隐藏延迟的能力,以指导算法优化.利用三种矩阵乘算法进行实测与模型预测,实验结果表明,在简化模型的情况下,平均误差率为0.19.
其他文献
  以TRIPS为代表的分片式结构是未来通用微处理器设计的可选方案之一.TRIPS采用细粒度推测多线程的方法,极大地开发了程序运行时的片内并行性,力图为各种类型的应用提供一
会议
  随着以数据为中心的嵌入式移动计算和多媒体应用的兴起,以应用为中心功能可重构的系统设计方法将成为未来处理器研究的重要方向.FFT 作为这类应用中最为重要的计算 类型
会议
理查德.赖特的《土生子》是美国黑人文学史上具有重要现实意义的一部“反抗小说”代表作.本文对主人公别格的人物形象进行了多方面探析,分析其暴力性格行为的根本原因,指出畸
随着互联网的不断普及,青年亚文化呈现出蓬勃发展的态势.新媒体时代的到来赋予了青年亚文化新的时代特征,网络的虚拟性撕裂了青年亚文化原有的表达方式,青年亚文化逐渐从抵抗
  本文首先介绍多核处理器的发展,多核处理器分为同构多核处理器和异构多核处理器,并简要介绍 过去几种常见的异构多核处理器,如TI的OMAP多媒体处理器、Cell 处理器、特别
会议
在课堂教学中,让学生们进行将影片转换为剧本的练习,训练学生把剧本与镜头语言融会贯通,课后,要求学生自己写剧本,开始创作自己的第一个故事,这个过程也是独立学习的过程.微
语言教学是幼儿园教学的重要内容.如何采取符合幼儿成长规律的教学方法,有效促进幼儿园语言教学的质量,是目前幼儿园语言教学面临的一项重要课题.本文从游戏化教学方法在幼儿
  云计算平台是一个按需进行动态地部署、配置、重新配置、以及取消服务的平台,平台服务的高可用是云计算平台的重要指标之一.Java 技术被普遍采用,已成为构建云计 算平台的
【社区】拉丁词源:“社区”一词延伸自拉丁语“fellowship”一词,它一度被指为在人们松散的社会群体中可以预期的温暖和亲密关系。德国社会学家 F·藤尼斯《社区和社会》(18
在国家经济发展过程中,税务部门占据着重要地位,可以发挥出有效作用.在传统模式下,主要采用哲学理念进行管理,随着社会发展已经无法满足实际需求,因此要有效运用自然辩证法,