面向智能计算系统的跨平台编译技术研究

来源 :中国科学技术大学 | 被引量 : 0次 | 上传用户:king5440
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
以深度学习算法为代表的人工智能算法近些年来飞速发展,在计算机视觉、自然语言处理和竞技游戏等不同的领域,深度学习算法展现的智能已经接近甚至超过了人类的水平。基于通用处理器的传统计算系统已经不能很好地支持深度学习算法的需求,新兴的智能计算系统以其在性能和功耗上的优异表现,成为了深度学习算法的重要物质载体。然而,深度学习算法快速发展,智能芯片也不断推陈出新,这对智能计算系统的通用性提出了极大的挑战。本文从智能计算系统中系统软件的不同层次出发,以深度学习算法和智能芯片中的张量运算为典型特点,探究面向智能计算系统的跨平台编译技术问题。本文的主要研究内容及贡献包括:(1)针对智能计算系统中的跨平台代码生成问题,提出了面向智能计算系统的统一抽象机器模型。我们广泛调研了智能计算系统中不同智能芯片的硬件架构特点,发现张量运算是智能芯片设计的核心。因此,提出了智能芯片的张量抽象架构,总结了基于张量抽象架构的张量抽象指令集,并设计了包含标量运算、向量运算和张量运算的张量中间表示。此外,设计了一个两阶段的代码生成方法,完成从通用的张量中间表示到不同智能芯片的代码生成工作。实验结果表明,张量抽象架构可以实例化到4种典型的智能芯片架构:DianNao、TPU、VTA和GPU Tensor Core。我们的张量中间表示相较于传统的标量中间表示,可以平均提高2.68倍的编程效率,并显著降低不同智能芯片代码生成模块的开发代价。(2)针对智能计算系统中的跨平台编译优化问题,开展了面向智能计算系统的通用张量编译优化工作。基于智能计算系统中不同张量操作的运算特点,提出了张量操作的基本范式,定义了张量运算描述。然后,研究了针对张量运算的编译优化方法,设计了5种张量调度原语。最后,通过张量调度语言,实现了3种张量编译优化方法:张量分解优化、特殊卷积优化和流水线优化。我们在GPU Tensor Core、VTA和TPU这3种常见的智能芯片上进行了实验验证工作。实验结果表明,通过张量调度语言仅用实现一套的通用调度模板,就能相比于厂商提供的高性能计算库和其它深度学习编译器达到1.05~2.05倍的性能提升。(3)针对智能计算系统中的用户程序跨平台移植问题,提出了面向智能计算系统的源到源神经编译器Codeformer。Codeformer由三个主要部分组成:预训练、反向翻译和判别式重排序,它能够完成从已有用户程序到智能计算系统的用户程序之间的自动翻译。我们以C语言作为传统计算系统中串行编程模型的代表,以CUDA语言作为智能计算系统中并行编程模型的代表,公开了首个大规模的C-to-CUDA数据集,以学习从C程序到CUDA程序的自动翻译。实验结果表明,相较于传统的自动并行化方法和基于统计的机器翻译方法,Codeformer能够在机器翻译评价指标BLEU、CodeBLEU、ParaBLEU和生成程序的编译通过率上得到显著提升。此外,Codeformer生成的CUDA程序能够达到串行C程序347倍的性能,最高提升CUDA程序的开发效率3.8倍。Codeformer提出了基于机器学习的自动并行程序翻译方法,为传统的自动并行问题提供了全新的思路。
其他文献
上转换纳米粒子(upconversionnanoparticles,UCNPs)能够将低能量近红外(near infrared,NIR)激发光转换成高能量可见或紫外光。近红外激发的UCNPs具有近红外激发、光稳定性优异、信噪比高和多色发射等优点,在生物医学、环境检测、食品安全等领域具有广泛应用。然而,传统上转换发光探针具有发光共振能量转移(luminescence resonance energy
目前受控热核聚变能被认为是能够有效解决人类未来能源需求的清洁新能源,燃烧等离子体、托卡马克聚变堆工程技术、聚变堆各类材料是影响托卡马克聚变堆走向产业化应用的三个主要方面。在磁约束热核聚变装置中,面向等离子体部件的表面材料会与等离子体发生作用,形成杂质进入等离子体,杂质辐射对高参数等离子体稳定运行产生重要影响。前期大多数中大型托卡马克实验装置均使用碳瓦作为第一壁和偏滤器靶板表面材料,在未来托卡马克聚
随着海上运输业的蓬勃发展,船舶火灾安全问题日渐凸显。根据事故统计船舶火灾多发于机舱,而七成以上的船舶机舱火灾事故是发生在海上航行过程中。海上航行中的船舶不可避免会受到海风的作用,事故分析表明环境风影响下的船舶火灾危害性更大。前人研究中通常将船舶舱室简化为顶部开口舱室,但鲜少考虑环境风这一外界因素的影响。因此,研究环境风对顶部开口舱室火灾的影响,能够为此类船舶火灾事故的预防和应急救援对策的制定提供理
黄热病毒家族的寨卡病毒(ZikaVirus,ZIKV)由于导致人类神经系统疾病如小头畸形和Guillain-Barré综合征等而受到广泛关注。寨卡病毒是一种单链正义RNA病毒,其RNA基因组编码的非结构蛋白3(NS3)包含一个蛋白酶结构域和一个解旋酶结构域,N端丝氨酸蛋白酶结构域需要与NS2B蛋白因子相互作用才能发挥活性;C端解旋酶结构域在核糖核苷三磷酸(Nucleoside triphospha
单视角深度估计任务是计算机视觉领域中极具挑战性的问题之一,其目标是给定单张彩色图像,预测图像上每个像素点的深度值。由于三维空间到图像平面的透视投影,该任务存在天然的歧义性,是一个非适定问题。近年来,随着深度学习技术的发展,单视角深度估计的算法性能得到大幅提升,但仍然面临三个困难:(1)通过深度卷积神经网络预测的深度图缺乏对场景精细结构的描述;(2)深度标注数据获取难度大;(3)单视角深度估计网络的
近年来,太赫兹(THz)电磁波在医疗生物检测、材料分析、无线通信、大气监测等广泛领域展现出越来越重要的应用前景。THz辐射源是支撑THz技术应用和发展的关键器件。然而,由于THz波处在电子学和光子学的中间地带,基于传统电子学方法和光子学方法的THz源在输出功率、频率、便携性等方面难以满足实用需求。自由电子驱动的电磁辐射源在THz频段可以实现大功率输出,是一类重要的THz源。但是这类装置通常体积庞大
服役于人体生理环境中的植入金属材料往往由于腐蚀、磨损等作用而产生金属离子释放。某些适量释放的金属离子虽然在促进组织再生等方面发挥积极作用,但不可否认,过量的离子积累将对人体产生毒副作用,进而直接影响材料的生物相容性。通常,植入金属离子释放行为与材料的耐蚀能力息息相关,而作为评价植入金属材料耐蚀性的通用、实用手段,腐蚀电化学测试技术已广泛应用。因此,探究模拟人体环境中金属离子释放的动力学过程,阐述离
基于密度泛函理论的第一性计算方法已经被大量应用于预测和研究材料的各种物理和化学性质,已经成为独立于实验和理论的第三种研究方法。密度泛函理论的成功在于创造性利用密度作为能量的泛函,将3N维的Schr(?)dinger方程转为了三维问题,大大降低了计算量。但是密度泛函理论是基于变分原理的基态理论,这使得其在应用到激发态过程中存在很多问题,比如无法准确地预测分子和固体体系的光谱和激发态能级等。同时由于到
随着计算能力日渐强大的移动智能设备的广泛普及,一种基于众包思想而衍生出的移动计算范式——移动群智感知,可以协调网络中的移动用户群体通过携带的智能设备进行大规模的数据收集和复杂的任务计算。另一方面,数据交易可以打破数据孤岛,提高数据的流通性和复用性,但它同时也面临数据来源匮乏和多样性欠缺的问题。因此本文利用移动群智感知在数据收集方面的智能性、普适性、低成本等优势构建一种新型的移动群智感知数据交易系统
移动场景下的轻量级客户端不在本地储存完整的区块链,在向全节点查询交易过程中轻量级客户端会泄露与其相关的地址和交易。移动用户可以运行一个轻量级全节点来服务其轻量级客户端,从而保护其轻量级客户端的交易查询隐私,但是轻量级全节点面临区块验证效率降低问题,这会降低区块链的可扩展性。此外,区块链可用于管理移动用户访问公共无线热点的访问凭证,但仍需满足移动用户的条件匿名认证需求,以及降低访问凭证管理中的上链数