节点内多CPU多GPU协同并行绘制关键技术研究

被引量 : 0次 | 上传用户:wychao1014
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
并行绘制是将绘制通道从统一的程序执行模型主循环中分离出来,扩展多条独立的图形流水线,并通过并行派发绘制任务实现协同并行绘制计算。并行绘制是提高大规模复杂场景图形绘制性能的有效技术途径。并行绘制系统一般由多个分布式并行绘制节点构成,绘制节点通常采用CPU作为通用计算单元,GPU作为图形协处理单元。早期并行绘制系统节点内CPU计算产生的数据难以满足单个GPU的需求,因而节点内一般只配置一个GPU。随着商业多核处理器和图形硬件技术的发展,目前的并行绘制系统节点可以配置多个CPU和多个GPU。许多研究和应用表明,深入研究节点内协同并行绘制技术,充分发挥绘制节点内多CPU多GPU协同并行计算性能,既是提高单机图形绘制效率的有效技术途径,又是构建大规模复杂场景高效分布式并行绘制系统的重要基础。现有节点内多CPU多GPU并行绘制技术并没有充分考虑绘制节点内硬件体系结构特点,系统难以充分发挥节点内多CPU多GPU的协同并行绘制计算能力。本文以充分发挥绘制节点内协同并行绘制计算能力为目的,针对绘制节点内CPU和GPU的非对称性计算与访存体系结构特点,研究了节点内多CPU多GPU协同并行绘制模型及其sort-last并行绘制模式下性能优化方法,主要工作和研究成果如下:(1)针对已有节点内并行绘制模型将硬件绘制与合成显示阶段串行耦合导致GPU停顿问题,从发挥节点内多核CPU计算能力和提高节点内多GPU并行绘制能力的角度出发,提出了一种面向节点内多核CPU多GPU体系结构的并行混合绘制模型。该模型一方面将应用事件逻辑与绘制逻辑分离,保证了系统的易配置和扩展性;另一方面,采用CPU软件绘制与GPU硬件绘制相结合将硬件绘制与图像合成分离,同时利用DMA异步传输机制构建节点内绘制、读回和合成三段并行绘制流水线,保证了系统的高效性。理论分析与实验表明:该模型易配置、可扩展,同时可以极大的提高节点内并行绘制性能。(2)针对已有节点内CPU端图像合成操作效率低和存在大量冗余操作问题,提出一种基于GPGPU加速的节点内多GPU图像高效合成方法。该方法通过GPGPU计算生成有效像素合成索引列表,完全避免了节点内多GPU图像合成过程中CPU端的冗余合成计算。理论分析表明:在理想负载平衡条件下,该方法加速比为图像有效像素百分比与节点内GPU数量的比值。实验结果表明:在节点内配置4个GPU时,针对有效像素比为12%~76%的高分辨率图像,该方法与原始方法相比合成性能提高3~5倍。(3)针对已有节点内基于CPU-GPU通信模型的图像合成方法数据通信和计算时间开销大的问题,提出了基于节点内P2P直接通信模型的合成策略,一方面避免了大量的GPU与CPU间的数据交换,另一方面高效的利用了GPU片上高速通信带宽和其强大的计算能力;基于该合成策略,提出了图像合成过程中的推合成与挽合成操作相结合的图像合成方法,优化了多GPU图像合成过程中本地显存与远程显存的存储访问效率,为实现高效的并行图像合成算法奠定了坚实理论基础;同时,提出一种基于位图掩码的GPU端图像合成优化方法,该方法依据图像中的有效像素生成掩码位图,通过对GPU间掩码位图进行集合运算快速得到图像重叠区域的掩码位图,使得图像合成操作仅发生在有效像素区域以内,有效减少了图像合成过程中的传输数据量及合成判别计算开销。实验结果表明:采用基于掩码位图的方法能够有效提高约40%的图像合成效率。(4)针对已有并行绘制框架并行绘制流水线难以发挥多CPU多GPU绘制节点性能问题,研究和实现了一个面向多CPU多GPU绘制节点的层次式节点间sort-last并行绘制框架。框架采用基于层次式合成的绘制流水线组织将系统内GPU划分为绘制节点内和节点间两个层次,并针对各自的GPU互联网络拓扑结构特点选用高效的合成通信模型,同时结合节点内无效像素剔除算法去除了冗余图像数据合成与传输。实验结果表明:该框架可以有效避免节点间无效像素传输并具有较高的图像绘制与合成性能。
其他文献
"刁斗"作为边塞诗中的常见意象,通常被认为是军中使用的炊具兼敲击警戒用具。然而现今被命名为"刁斗"或"鐎斗"的器物却并不具备这些功能。目前常把"刁斗"与"鐎斗"混同一体,但
分销渠道管理作为企业的一项最基本的管理内容,是企业获得长期发展优势的战略要素。本文笔者在查阅大量文献的基础上,通过在K公司多年的实践工作经验,使用多方位、多角度的学习
随着经济发展水平的提高、居民体育意识的觉醒,公共体育服务体系建设问题得到越来越多的关注和重视。但目前我国公共体育服务体系无论从理论上还是从实践上尚处于探索阶段,因此
智能终端产品的技术在2014年会继续发展。中国产品厂家的主要选择是芯片功耗低、价格廉。联发科和高通在智能终端产品中的核心芯片互相竞争。触控和面板驱动的芯片、视频解码
1994年在湖北襄阳城内东街发现一座东汉末至三国初期的大型砖室墓。报告的作者已初步推论该墓可能是刘表墓,但却不能确定。本文通过文献考证该墓就是三国初期荆州牧刘表之墓
  本文深入分析了谷物营养摄入的重要性和我国全谷物食品发展的现状,提出馒头等传统主食品是我国全谷物食品的产品研发和市场推广的最佳载体,并对我国推进全谷物食品的发展提
物流效率的提高有赖于物流流程的优化,而流程优化的前提是明确物流流程所涉及的物流作业环节到底有哪些。烟草商业物流由于其作业对象是成品卷烟,所以有其自己的独特性。抓住其
“小产权房”从一开始,就以一种尴尬的地位存在于中国领土之上,其在现实生活中的地位与其法律上的规定是截然相反的,在法律上它是不能进入正规渠道进行交易的,但在民间却如火如荼
政府主导型旅游业发展战略是国家旅游局一直在倡导并已取得显著成效的战略。其完整的表述是:“在以市场为基础配置资源的前提下,全面实行政府主导型的旅游发展战略,以进一步加大
燃油或液压油中的微量水分对飞机和汽车的发动机使用效率和安全寿命起着至关重要的作用。聚结分离技术能够对燃油或液压油中的微量水分进行有效脱除,保证飞机、汽车的安全使用