基于OpenCL的连续数据无关访存密集型函数并行与优化研究

来源 :计算机科学 | 被引量 : 0次 | 上传用户:rabbitwangli
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
连续的数据无关是指计算目标矩阵连续的元素时使用的源矩阵元素之间没有关系且也为连续的,访存密集型是指函数的计算量较小,但是有大量的数据传输操作。在OpenCL框架下,以bitwise函数为例,研究和实现了连续数据无关访存密集型函数在GPU平台上的并行与优化。在考察向量化、线程组织方式和指令选择优化等多个优化角度在不同的GPU硬件平台上对性能的影响之后,实现了这个函数的跨平台性能移植。实验结果表明,在不考虑数据传输的前提下,优化后的函数与这个函数在OpenCV库中的CPU版本相比,在AMD HD 5850GPU达到了平均40倍的性能加速比;在AMD HD 7970GPU达到了平均90倍的性能加速比;在NVIDIA Tesla C2050GPU上达到了平均60倍的性能加速比;同时,与这个函数在OpenCV库中的CUDA实现相比,在NVIDIA Tesla C2050平台上也达到了1.5倍的性能加速。
其他文献
医疗服务市场的有序竞争有利于促进医院提高效率,改进质量,而市场结构则直接影响到竞争的态势。本文从市场集中度、产品差别、进入壁垒和城乡差异等方面分析了我国医疗服务市
媒介事件,尤其是卡茨强调的"竞赛"、"征服"、"加冕"其本身具有的公开性、公共性、重大性等特点。媒介事件的传播范围广,传播影响力强,是国家形象、区域形象建构、提升的有力
目的:探讨鞍内鞍上型颅咽管瘤术后并发重度中枢性尿崩症(CDI)的原因及治疗体会。方法:收集我院收治的36例鞍内鞍上型颅咽管瘤术后重度CDI患者的临床资料,回顾性分析肿瘤与三
我国互联网金融市场有明显的双边市场特征。基于双边市场的交叉网络外部性、平台流动性、价格结构非中性及多消费者多归属性的特征,使得我国互联网金融的竞争既激烈又复杂。
我们采用针刺疗法配合内服驱虫药治疗小儿胆道蛔虫症。取得较满意的效果。现介绍如下:1治疗方法11临床确诊为胆道蛔虫症后,即按常规进行针刺治疗。取穴灵台透筋缩。令患儿坐位,双
建立村镇银行是为了解决我国现有农村地区银行业金融机构覆盖率低、竞争不充分、金融供给不足、金融服务缺位等"金融抑制"问题,更好地建设农村金融生态环境。但作为新生事物,
<正>在日常新闻实践中,马克思主义新闻观是广大新闻从业人员必须掌握的指导思想。马克思主义新闻观是关于马克思主义新闻思想的基本观点、立场和方法,产生于马克思主义经典作
扁平型组织的弹性工作环境会使员工更好地平衡工作,提高工作效率,增强工作满意度,但同时对管理过程中的沟通以及利用沟通营造学习环境、协同作战的能力提出了新的挑战。本文
中国加入亚太经合组织25年来,坚持把亚太作为开放的优先方向,随着2020年茂物目标期限临近,中国愿同各方一道,以发展为主题,扩大开放,促进区域经济一体化、互联互通,共同绘制
期刊
2010年9月,胡锦涛发表了"包容性增长"之后,国内理论界对"包容性增长"的现实背景、科学内涵、理论贡献、影响因素、实践路径等都进行了较深入论述。该文对已有的研究成果进行