基于GPU平台的ATMI模拟器并行算法的研究与实现

来源 :内蒙古大学 | 被引量 : 0次 | 上传用户:jackie_kara
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
目前处理器持续增长的温度已经成为芯片设计的主要瓶颈之一。求解热方程最常用的方法是有限差分法(Finite Difference Method,简称FDM)和有限元法(Finite Element Method,简称FEM),这两种方法可以对物理系统进行详细的建模。但是使用有限差分法(FDM)和有限元法(FEM)对微处理器温度进行建模时需要大量的节点,这也意味着需要更长的计算时间。ATMI模拟器对热方程的求解是采用最早的分析法(Analytical Method,简称AM),采用分析方法的优点是减少了计算所需要的节点,在一定程度上加快了计算速度。ATMI模拟器具有高效性,可靠性和易用性,这些优点使其在科研领域得到了广泛的应用。实验表明,当ATMI模拟器在模拟十几个核的处理器温度的时候,热响应阶段的计算需要一个周的时间。那么,随着科学技术的不断发展和处理器的更新换代,ATMI模拟器已经不适合未来处理器温度的模拟。本文采用CUDA技术完成了ATMI模拟器GPU平台移植的前期工作,主要包括以下几个方面的工作:首先,在深入研究ATMI模拟器串行算法的基础上,重点研究了ATMI模拟器热响应阶段的算法,结合GPU体系结构和CUDA编程的特点,对原有的热响应阶段的串行算法进行了优化,优化的目的是使其更合适GPU编程。其次,实现了GPU平台的积分算法和贝塞尔算法。由于线程的并行度不够和复杂的程序结构,实现的这两个算法与原有串行算法相比实验结果不是很理想。在GPU平台上求解热响应方程的时候可以直接调用这两个已经在GPU实现的库函数。最后,我们提出了GPU平台热响应阶段的并行算法,完成了整个并行算法的框架搭建。本文从任务级进行了并行程序的设计,每一个线程负责一对热源之间的计算。本文致力于GPU平台的模拟器的研究与探索,希望解决GPU多线程应用程序在开发过程中遇到的问题,也希望为以后多核处理温度相关问题的研究提供一些可以积累的经验。
其他文献
随着互联网技术的迅猛发展,网络媒体已经成为人们日常生活中不可或缺的一种传播媒介。其中微博作为新兴典型代表之一,以极快的速度影响着社会传播格局。用户可以通过微博随时
微博新词的出现给短文本分词工作带来了极大的挑战。本文从多个角度对微博新词发现研究进行较为全面地分析。结合微博新词的构词规则自由度大和极其复杂的特点,针对信息抽取
现今,由于信息的存储、传输和处理越来越多地在开放网络上进行,信息易受到窃听、截取、篡改、伪造和重放等各种攻击手段的威胁。在现代的制造业生产流程中,企业与企业之间、部门
近些年来,随着生产制造企业网络规模的不断扩大,对网络的管理变得越来越困难。加上工业网络所处的特殊的环境,很容易造成设备故障,从而给企业带来经济损失甚至是人员伤亡。如
BBS作为一种新兴的交互性强的媒体,越来越受到网民的青睐,成为了新闻、观点和民声的集散地,是网民获取信息和发表评论的重要渠道之一。BBS上的发帖和回帖都围绕一个个话题,而这些
本论文中的应用程序使用C#语言编程实现,该应用程序可以计算往返时间,并能够提供有关数据传输和连接稳定性的信息数据,这些功能对于从事网络管理的工作人员非常有用。   由于
视频运动目标跟踪是当前计算机视觉领域最活跃的研究主题,作为一门跨学科的前沿技术,它融合了图像处理、模式识别、人工智能等多种不同领域的理论知识,广泛应用于军事和民用方面
中文分词是中文信息处理领域的一项基础性课题,未登录词识别问题又是中文分词的瓶颈问题之一。为了解决中文分词中的未登录词识别效率低下的问题,本文在分析现有未登录词识别
统计机器翻译是自然语言处理领域具有挑战性的前沿课题之一,具有广泛应用价值和重要的商业应用前景。随着网络技术的发展和普及,信息量快速增加,各领域对机器翻译的需求量也
同步自动机是一种特殊的有限状态自动机,在机器人学、工业自动化以及生物计算等方面有重要应用,同步性检测和最短同步字的长度(特别是(?)ern(?)猜想)是同步自动机理论研究的两个核心