基于x86多核架构的数学函数扩展库设计与实现

来源 :东南大学 | 被引量 : 0次 | 上传用户:joyceywq
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着多核并行计算技术的普及,如何开发适应多核体系架构的软件逐渐成为人们关注的焦点。然而,要想真正发挥出多核处理器的最佳效力,软件的开发一定要跟上多核硬件的开发速度,多核处理器非常需要与之相配备的系统软件和应用软件。各种高性能计算机系统都提供面向科学计算和工程应用领域的底层数学函数库,因此要充分发挥出多核处理器的计算能力,必须要针对多核体系架构的特点,建立起高度优化的数学函数库。   本论文以GNU GSL科学数值函数库为基础,针对X86多核体系结构,设计并实现一个高性能数学函数扩展库HPSL(High Performance Scientific Library),HPSL由数值函数库和图像扩展库两部分组成,其中数值函数库是针对GSL中的BLAS函数库和FFT进行并行优化实现的,图像扩展库部分是在GSL函数库的基础上扩展出一个面向图像处理领域的图像压缩编解码函数库。   本课题的研究内容包括:在剖析并行计算技术和x86多核体系架构的基础上,探讨能够发挥出x86多核处理器性能的多线程编程技术。接着,在详细分析了BLAS函数库Level2、Level3核心函数和FFT的基础上,测试其性能表现,根据它们在多核处理器上的性能表现作出相应调整,并对这些函数进行并行优化和算法优化.最后,利用GSL函数库中的基础函数小波变换对GSL进行扩展,设计出基于小波变换的图像压缩编解码函数库,并针对压缩过程中的核心函数进行并行优化。在优化完成后,依据Amdahl定律对并行后的结果进行分析,并总结出相应的性能评价。   本课题的意义表现在:针对当前的x86多核技术,通过对传统的数学函数库进行算法优化和多线程程序设计,将以往的串行计算扩展为高性能的多核并行计算,并取得了良好的性能提升,为今后计算软件的并行化提供参考。
其他文献
随着互联网技术与应用的迅速发展,Web服务作为一种新兴的Web应用模式及远程访问标准,很好地解决了异构平台上的数据和应用的整合与共享问题。但是,传统的Web服务缺乏语义信息,语
数字农作系统是数字农作技术研究的核心。近年来,随着计算机和3S技术的快速发展,数字农作系统的研制更加趋于综合集成。然而,当前作物模型应用系统及作物模型组件的开发往往采用
肿瘤是目前危害人类健康乃至生命的重大疾病之一,它的发生发展与受损DNA上基因的异常表达密不可分,然而利用基因芯片技术测量得到的成千上万个基因的表达水平中,仅有为数不多
近年来,随着多媒体以及网络技术的飞速发展,基于内容的视频应用得到了人们越来越多的关注,成为数字视频技术乃至计算机视觉领域的一个研究热点。这些应用包括基于内容的视频
随着多核系统的普及和发展,中央处理器的数目越来越多,软件应用规模也越来越大,对存储器的存储容量和访问速度要求逐渐加大。另一方面,随着工艺的发展,作为主流的DRAM和SRAM的工艺
随着嵌入式技术的发展, GPS移动导航产品在汽车电子技术行业得到了广泛的使用。但由于常见移动导航终端功能较为单一,不具备多媒体功能,使其很难满足市场上对人性化导航终端
伴随汽车社会的临近,机动车数量的不断增加,机动车驾驶员的数量也在快速增长,交通安全问题日益成为社会发展的重要影响因素。在交通管理中数据库技术已经获得了普遍的应用,经
随着Internet的飞速发展,信息内容空前庞杂,通用搜索引擎已经很难满足特定领域的信息检索需求,垂直搜索引擎应运而生。然而,现在流行的垂直搜索引擎多在语法级层面进行操作,
随着农民收入的稳定增长和政府对农村安全用药的高度重视,农民整体健康水平有了显著的提高,消费潜能不断地释放也使得农村售药终端所蕴含的市场变得越来越清晰。但是由于相关
随着Internet的迅速发展,Web资源成指数级增长使得对Web资源的管理显得更加困难。如今,大量隐藏着木马、病毒和非法广告等程序的恶意网页在Web网络中泛滥。这些网页采取作弊