基于GPU的实时光线跟踪研究

来源 :中国科学院计算技术研究所 | 被引量 : 0次 | 上传用户:jeff2001
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
作为一种计算机绘制方法,光线跟踪具有很多优点,可以比较真实、自然的模拟阴影、反射、折射等光照效果,但由于绘制速度较慢,一直没有在实时绘制中得到应用。不过,随着硬件水平的提高和算法的改进,实时光线跟踪逐渐可行。虽然光线跟踪通常使用CPU计算,不过GPU计算能力越来越强大,通用编程能力也越来越完善,尤其是CUDA通用编程模型的出现,因而使用GPU进行光线跟踪,得到了越来越多的关注。   在上述背景下,本文研究如何在CUDA架构下,使用最新体系结构的GPU,进行实时光线跟踪。最基本的实时光线跟踪系统,由生成加速结构和光线跟踪两部分组成。本文对使用CPU和GPU生成均匀网格都进行了尝试,结合使用GPU进行光线跟踪,实现了两个实时光线跟踪系统。   对于光线跟踪部分,权衡各种加速结构的利弊,选择均匀网格作为加速结构。针对CUDA的特点,提出了一个面向实时的光线跟踪框架,并优化了数据存储。鉴于光线一致性对遍历速度的重要性,分析了CUDA线程的划分对光线一致性的影响。   分析了均匀网格分辨率对均匀网格生成速度和光线跟踪速度的影响,在此基础上,使用CPU生成均匀网格,实现了一个基于CPU-GPU混合的实时光线跟踪系统。与基于kd树的实现相比,生成速度优势明显,但总体性能稍差。   现有的并行生成均匀网格的方法,无法直接应用于GPU。针对CUDA架构的特点,本文提出两个在GPU上并行生成均匀网格的算法,即sort-middle×sort-first生成算法和基数生成算法,与CPU的生成速度比,有很大优势。进而实现了一个完全基于GPU的实时光线跟踪系统。由于生成速度的巨大优势,测试中的大部分场景的绘制速度优于基于kd树的实现。
其他文献
模拟是计算机体系结构研究的重要手段,也是很多其它科学与工程学科日益采用的研究方法。模拟并行化则是主要的加速方法。计算机系统的并行模拟,通常具有细粒度任务并行的特性,以
P2P对等通信业务,如即时通信、文件共享和多媒体分发等应用广泛流行,然而,因IP地址短缺、网络接入设备增多、互联互通需求增强等原因,基于NAT技术的多级私网接入Internet结构越来
随着半导体工艺进入深亚微米时代,芯片的复杂度越来越高,给IC设计者带来极大的挑战。本文介绍了曙光5000A高效能计算机互连网络的交换芯片——D5K-Switch ASIC芯片的物理设计和
图像匹配是指把一个图像区域从另一个可能在不同时间,不同视点位置或者由不同传感器所获得的图像区域中确定出来或找到它们之间对应关系的一种重要的图像分析与处理技术。  
当今时代,随着网络化和信息化的迅猛发展,云计算模式应用而生,其采用按需付费的方式为云用户提供轻便、可用的服务,并使云用户从繁重的资源维护中解脱出来。但是随着云计算应
网络安全随着互联网的兴起而产生,并随着互联网的发展而不断发展进步。在早期,人们通过对IP包的头部进行分析,发现网络流中的异常数据包,从而对IP包进行相应的处理。如今,随着网络
图像和视频中的文字包含丰富的语义信息,在很多应用中占有重要的位置,如自动标注,基于内容的图片或视频检索与分析等。由于图像和视频中的文字通常叠加在复杂的图像背景之上,现有
学位
无线传感器网络技术作为一个极具应用前景的技术,已经成为当前研究的热点。传感器节点是无线传感器网络最基本的构成元素,而运行在传感器节点的操作系统,能够有效地管理和使用有
随着面向服务计算技术的发展,互联网上Web服务的数量越来越多。面对数量众多的服务资源,如何有效地组织和管理这些服务成为了一个亟需解决的问题。分类是人们组织和管理大规模
随着网络存储系统的广泛应用,应用对其I/O性能也提出了越来越高的要求。蓝鲸集群文件系统(BWFS)采用带外数据传输的方法,分离元数据流和数据流,客户端直接访问存储设备,为应用提