针对多媒体应用的SIMD编译优化技术研究

来源 :复旦大学 | 被引量 : 0次 | 上传用户:myh8888
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近年来多媒体应用逐渐成为计算领域研究的热点。为了获得更为卓越的性能,几乎所有的通用处理器生产厂商都为他们的处理器集成了一个或多个多媒体指令扩展部件。针对多媒体应用的核心代码往往具有并行性高、计算精度要求低的特点,这些多媒体扩展部件往往以通用处理器已有的计算资源为基础,通过一系列整合,以向量部件的形式出现。相应的扩展指令集则以单指令多数据(SingleInstructionMultiData)的向量指令为主,由于这些扩展指令集主要针对多媒体应用,我们称其为“多媒体扩展指令集”(MultimediaExtensionInstructionl,对应的计算部件我们称为“多媒体扩展部件”。 多媒体扩展指令集的出现,给提升多媒体应用的性能带来了美好的前景,然而如何充分利用这些多媒体扩展指令加速多媒体应用,还有很多尚未解决的问题。在多媒体扩展指令出现以后的很长一段时间里,程序员只能通过编译器有限的支持来使用各种多媒体扩展指令,例如通过嵌入汇编代码,或者使用编译器提供的内部函数(intrinsicfunction)等手段在代码中显式地使用多媒体扩展部件的指定计算功能。这些手段的使用,一方面要求程序员深入了解多媒体扩展部件的体系结构,并且具备基本的向量化程序开发能力,大大提高了多媒体程序开发的难度;另..方面,由于不同处理器生产厂商的多媒体扩展指令各不相同,缺乏统一的标准,严重影响了程序的可移植性。为了解决这些问题,我们有必要增强编译器对多媒体扩展指令集的支持,使得编译器能够使用多媒体扩展指令自动优化高级语言编写的应用程序。我们称编译器的这种优化为“针对多媒体扩展指令集的编译优化”,简称为“SIMD编译优化”。 最近几年在SIMD编译优化领域,取得了一些成果,少数商业编译器如(ICC8.0)已经能够对个别多媒体程序实施有效的优化。然而,编译器自动优化的程序和手工优化的程序还是存在很大的性能差距,完全依赖编译器进行高效率的SIMD优化还需要做一些努力。本文在以下几个方面给出了创新性的研究。 ·针对多媒体应用中出现的一阶线性递归饱和操作,我们提出了高效的变形算法。 ·多媒体应用中存在数据重用的现象,针对这一特点,我们提出了向量寄存器重用的优化方法。 .以并行编译平台agassiz为基础介绍了如何开发SIMD编译优化的原型系统。
其他文献
随着网络技术的发展,网络存储技术越来越受到人们的重视。网络存储技术中有两个问题急待解决,首先传统的网络存储技术只注重于对服务器存储设备的研究,而忽略了对用户计算机
随着计算机技术的日新月异和自然科学领域的不断发展,科学工作流作为面向数据的工作流旨在利用计算机技术帮助人们解决科学实验的数据再现和有效性验证等问题,并进一步减轻科学
随着大规模集成技术的发展,数字信号处理器(DSP)在功能、处理速度和处理能力方面都取得了划时代的突破,并广泛应用在数据通信、图像处理、语音处理、自动控制等领域中。DSP嵌
语义网是当前Web的一种扩展,其中的信息附加了机器可处理的语义。语义网是一个信息基础设施,它提供一个通用可存取的信息平台,使计算机能有效地发现、处理、集成和复用Web内
学位
随着科学技术特别是计算机网络与信息技术的迅猛发展,科研环境和科研过程发生了很大的变化。由于科学研究的问题空前复杂化,科研过程中对数据和信息的获取和处理显得越来越重
随着信息技术的发展,尤其是Internet的普及和应用,以电子形式存在的文本信息已经成为人们主要的信息来源,人们需要对这些大量的文本资源进行有效的组织,以利于主题发现、信息
遗传程序设计(GP)因其出众的解决复杂问题的能力成为演化计算中的重要分支,为多国学者青睐,并被应用于如人工智能、金融测算等多个领域。然而,GP及其分支在演化过程中出现的
市场的全球化带来了产品设计和生产管理的网络化要求;要求有一种支持协同设计的平台技术,支持不同专业背景的领域专家间的协同工作。分布环境下异构CAD系统间协同设计的最大挑
随着通信能力的不断增强以及通信业务的多样化,为了提供下一代网络服务,3GPP在R5版本中引入了IP多媒体子系统(IP Multimedia Subsystem,IMS)。IMS位于3G核心网中,构架于分组域(PS