一种适用于GPU图像处理算法的合并存储结构

来源 :计算机工程与科学 | 被引量 : 11次 | 上传用户:rwuinthe3924
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
大多数图像处理算法都可利用GPU进行加速以达到更好的执行性能,但数据传输操作与核函数执行之间的调度策略问题仍是桎梏加速性能进一步提升的主要瓶颈。为了解决这个问题,通常采用GPU任务流将核函数执行与数据传输操作进行重叠,以隐藏部分数据传输与核函数执行耗时。但是,由于CUDA编程模型的特性以及GPU硬件资源的限制,在某些情况下,即使创建较多的任务流用于任务重叠,每个流上仍会存在串行执行的任务,导致加速效果无法进一步提升。因此,考虑利用CSS将待处理图像进行合并从而将单个流中的算子核函数及数据传输操作进行
其他文献
信息物理融合系统是一类将信息系统和物理系统连接并融合在一起的混合系统,包含了感知、通信、计算与控制等多种技术,其系统操作既包括离散的计算过程,又包括连续的物理过程
CCF全国计算机体系结构学术年会(ACA,Advanced Computer Architecture)是国内体系结构领域权威的学术盛会,每两年举办一次,已历经近30年。ACA 2020将于8月13日至15日在云南省
探讨了基于 3S技术的现代空间信息系统支持下的对策论多元合作对策费用分摊策略问题。首先 ,从对策论基本原理出发 ,分析了费用分摊对策模型。针对大气环境污染防治多元决策问题 ,提出了采用 3S综合集成技术确定污染源及盛行污染路径、确定污染区域面积和污染损失、污染损失费用分摊分析模型与方法。介绍了模型在大气环境污染防治多元决策领域中的应用实例。 3S技术为对策论模型提供科学决策数据 ,有效地解决对策论
对某大型磷铵企业所发生的环境污染事故进行了回顾性环境风险评价.评价结果表明,事故发生概率(P)大小依次为PSO2、PF、PH2SO4、PNH3;污染因子风险(R)大小依次为:RSO2、RH2SO4
针对宜万铁路碳酸盐岩分布广泛,岩溶强烈发育,位于恩施市白果坝龙麟宫隧道出口处存在大型溶腔,并基于龙麟宫隧道1^#大型溶腔处工程地质和水文地质条件,通过比选分析和优化设计,确
<正> 1 洞流概况汤旺河地处松花江下游,由北向南贯穿小兴安岭腹地,流经全市12个区(局)。流域范围东经128&#176;52’~129&#176;50’,北纬47&#176;26’~48&#176;43’,流域面积205
矿井中存在的电磁干扰严重影响了井下人员定位系统的无线传输,针对此问题,提出了利用nRF905芯片及多频道跳频技术来提高井下人员定位系统的抗干扰能力,并对该定位系统的结构
肉、蛋、奶,被称为国民营养“金三角”。一枚鸡蛋,含有孕育一个生命体所需的全部营养成分。据统计,我国一年消费鸡蛋总量为4000亿枚,约为世界平均水平的1.7倍。
农业综合开发是我国农村经济工作的一个重要组成部分,是财政支农的一个重要手段。农业综合开发是国家支持和保护农业发展,改善农业资源利用状况、优化农业结构、提高农业生产能
辽宁省卫生监督所于2010年6月至8月开展了食品标签、复合食品添加剂标注情况的调研工作,在全省30家超市抽查了366个品种定型包装饼干,其中强化饼干84品种,占调查总数的22.95%。采