基于GPU的并行优化技术

来源 :计算机应用研究 | 被引量 : 2次 | 上传用户:wqhao2
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
针对标准并行算法难以在图形处理器(GPU)上高效运行的问题,以累加和算法为例,基于Nvidia公司统一计算设备架构(CUDA)GPU介绍了指令优化、共享缓存冲突避免、解循环优化和线程过载优化四种优化方法。实验结果表明,并行优化能有效提高算法在GPU上的执行效率,优化后累加和算法的运算速度相比标准并行算法提高了约34倍,相比CPU串行实现提高了约70倍。
其他文献
提出一种基于服务时间标记的性能异常侦测方法,标记相对稳定的请求服务时间,并通过分析该时间变化来定位性能瓶颈以及分析可能的原因。该方法已经实现在一个典型的多层Web应用系统的支撑平台中,TPC-W测试基准的测试结果验证了其有效性。
提出了一种基于内容自适应的Web QoS反馈控制系统。首先分析Web QoS的组成及主要保证方法,并研究了队列控制当中的反馈控制机制,实现任务数量的稳定;然后,分析了Web内容自适应的机制与实现,提高了系统的自我调节能力;最后详细介绍这种Web QoS系统的模型。
由于缺乏有效的计算机图形学技术和三维几何建模支持,当前可计算桥梁三维几何建模面临着很大的困境。通过以下四方面的研究,建立了复杂桥梁的可计算三维特征几何模型:a)通过布尔运算,实现了任意桥梁构件基本截面的定义;b)建立了适合桥梁建模特点的曲线拉伸、渐变和构件放样等基本的三维建模方法;c)通过单元划分和节点编号策略,实现了复杂桥梁三维几何模型的构件间约束的定义;d)通过特征依赖树结合桥梁几何模型,建立
为进一步适应Ad hoc网络中各种应用的需求,提高网络性能,跨层设计已成为Ad hoc网络研究的热点之一。基于跨层设计思想,研究了多种用于Ad hoc网络的能量控制算法,给出了跨层设计方法的定义,研究和讨论了两种典型的Ad hoc网络跨层设计方法。对Ad hoc网络中多种能量控制算法进行了分类、描述、分析比较和评价,在此基础上,提出了基于跨层设计的Ad hoc网络能量控制算法存在的问题和进一步的研
1临床资料1.1一般资料本组63例均为门诊病例,男性39例,女性24例;年龄18~72岁,平均37.7岁,其中有40岁以下的50例;持续发病5年以上21例,2~5年15例;2年以内27例.
针对对偶树复小波变换(DT-CWT)比离散小波变换具有更好的方向选择性、平移不变性,能更好地表征影像特征的优点,提出了基于替换规则的对偶树复小波变换遥感多光谱和全色影像融合算法。通过对IKO-NOS影像的实验表明,本方法比基于实数小波变换的融合方法和IHS变换法有优势,在保留了光谱特征的基础上,更好地提高了融合影像的清晰度,且方法简单高效。
给出了一种适用于通信领域的基于前后台的消息调试与过滤方案,该方案采用消息代理通信的方式屏蔽前后台软硬件平台的异构性,在消息跟踪和记录模块中引入消息过滤机制,在后台消息的显示和打印输出中引入消息分级机制。基于该方案建立的嵌入式软件开发平台,实现了对面向通信领域的应用软件模块中消息的有效调试、测试、跟踪和监控,大大提高了此类软件的开发效率和可靠性。
基于领域模型重用机制,以提高模型重用性为目标,分析了领域概念模型体系结构的设计方法,将概念模型体系分为军事概念模型、逻辑概念模型和领域专业术语字典三个部分。介绍了构建领域概念模型的设计流程和关键技术,以电子对抗作战模拟领域概念模型的设计为例,说明了该方法的实际运用结果。
目的:观察降糖通脉方对由葡萄糖、胰岛素和氧化型低密度脂蛋白诱导的血管内皮细胞损伤的保护作用及机制。方法:采用葡萄糖、胰岛素和氧化型低密度脂蛋白诱导的人脐带静脉内皮
1临床资料64例患者中男34例,女30例,年龄均在25~45岁,病程最长12年,最短2年.2治疗方法取水分、中脘、天枢、关元、阴陵泉、命门穴局部常规消毒,将火针在酒精灯上烧至白亮,在已