LLVM循环向量化研究

来源 :国防科学技术大学 | 被引量 : 0次 | 上传用户:y412327391
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
SIMD体系结构不断发展,其向量寄存器变得越来越长。如何在使用向量指令时利用更先进的SIMD单元获得更高的性能收益成了应用开发者和编译器实现者研究的重点内容之一。编译器自动向量化是开发SIMD性能的重要途径之一。典型的产品化编译器都实现了自动向量化支持,随着SIMD体系结构的发展和编译优化技术的进步,编译器的自动向量化技术仍是学术研究和工程实现的热点。本文基于架构先进的LLVM编译器,针对更长向量长度的SIMD体系结构,研究循环向量化技术。LLVM循环向量化依赖编译器中许多其他的分析和优化,在向量化之前要分析程序的数据流和控制流信息、循环向量化合法性和向量化收益。此外为了使向量化时循环有统一的结构,还需要简化循环结构。LLVM向量化时为了获得更多ILP优化机会,会结合循环展开优化来实现。在循环体的标量指令中,只有部分指令能够向量化,剩下的指令只能标量执行,称这部分不能向量化指令为尾循环。本文通过对循环向量化时采取的操作进行分类,提出了基于掩码存取和数据填充方法,针对包含不同指令的尾循环进行向量化。在向量长度增长的情况下,尾循环向量化带来了性能收益。LLVM在处理循环向量化时,不能处理循环尾循环向量化,无法发挥硬件性能,也无法完全利用程序并行性。本文提出了尾循环向量化方法,能够很好解决尾循环无法向量化的问题,可以增强LLVM循环向量化能力,产生更高性能的目标代码。实验结果表明,尾循环向量化生成的代码比原来LLVM向量化生成代码具有更高的性能。在TSVC上测试最高加速比可以达到210%,在SPEC2006上测试可以获得最高5%性能收益。
其他文献
独立学院大学生思想政治工作的开展,既要符合一般大学生的思政教育培养规律,更应兼顾其群体的特殊性。笔者从独立学院大学生的归属感成因和影响归属感的因素探索着手,以广州
1故障一1.1故障现象开机,RESET(复位)后,按START(曝光)键,发现曝光指示灯不亮,图像监视器出现多环状图像.文件监视器出现如下信息:“CN0122:ANODE SPEED IS NOT0K(阳极转速不正常);CN0060:NO
科技企业孵化器,又称科技创业服务中心,是促进科技成果转化、培育民营科技型企业和科技型企业家的有效途径,是推进高新技术产业化的有效载体,也是我市"一号工程"科技创新创业
SCT-7000T是岛津公司20世纪90年代的一款性能比较稳定的CT,在电路上和SCT-6800T以及SCT-7800T基本一样,所以故障出现的原因也大多相同。现介绍该机型典型故障“Tubevoltageover”
建设社会主义新农村不仅关系到“三农”问题的根本解决,而且关系到国家的长治久安和民族的伟大复兴。我们一定要站在全局高度,统一思想,科学规划,扎实推进社会主义新农村建设,加快
本文针对小学信息技术课在基本技能打字教学日益淡化中所出现的问题,进行了研究的综述。经过一个学年的研究,以培养规范的、熟练的计算机打字为目标,以设计适合小学生年龄特征和
为进一步加强调查研究工作,更好地服务科学决策,推动工作落实,促进作风建设,特提出如下意见。一、切实把调研工作放到重要位置调查研究是谋事之基,成事之道,是我们党的优良传
本文结合飞行仿真器过载系统的设计,讨论了过载系统数字模型及仿真算法的建立,并论述了过载系统的构成及设计方法。
基于无人机遥感作物长势监测与光谱特性的营养诊断技术研究,是现代农业生产实现过程化管理与数字化决策的重要手段,也是近年来智慧农业研究的热点。本研究针对宁夏滴灌玉米生长发育进程中存在的数字化信息获取手段单一、信息采集基础设施薄弱、田间动态管理不精准等问题进行研究与探讨。采用无人机获取玉米苗期田间数字图像信息,运用数字图像处理技术提取玉米出苗状况,建立基于无人机遥感的玉米出苗率预测模型;采用高光谱成像系
经济结构不合理、产业层次低、增长质量较差,已成为我国参与国际经济竞争的重大制约.在新的发展阶段,单纯追求经济增长速度,沿用传统的外延型、粗放式经济增长模式,已经难以