面向“神威·太湖之光”的异构并行算法设计与实现

来源 :湖南大学 | 被引量 : 0次 | 上传用户:dalang003
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着科学技术的进步和移动互联网的迅猛发展,高性能计算技术在工业界和科学计算等领域发挥着越来越重要的作用。鉴于这些应用领域中数据规模的爆发式增长,为了能够高效处理超大规模数据,亟需研究面向领域应用的高性能并行基础算法。
  当前我国超算系统的研制能力己居世界前列,研制的“天河”系列和“神威,太湖之光”异构并行超级计算机的峰值运算速度己数次位居世界第一。但现有的加速基础算法多为面向同构系统或单节点加速器而设计,缺乏能扩展到大规模异构并行计算系统、充分发挥异构系统计算效率的基础算法,难以为实际应用需求提供高性能计算支撑。一方面,各类大规模应用领域中的信息安全问题越来越严峻,不仅要求保护数据的安全性,还对海量数据加、解密的效率提出了更高的要求,大规模异构并行系统对数据的安全、高效保护提供了重要的机遇和挑战;另一方面,稀疏线性代数运算作为各类高性能工程应用的核心算法,其运算速度决定了应用的运行效率,但计算中存在冗余的内存占用、计算和负载不均衡、不规律的访存模式及低计算/访存比等问题,使其难以在大规模异构系统上实现并行加速与优化。
  鉴此,本文基于国产自主100P大规模多/众核超算系统研究面向领域应用的加密算法和稀疏线性代数运算,提出快速异构并行方案及优化策略,主要工作如下:
  (1)面向申威26010特殊的无缓存、异构多核的处理器构架设计了一种大规模的异构并行AES密码算法,保证大规模应用中的数据安全保护的高效性。结合AES算法和“神威,太湖之光”构架的特点,为大规模异构并行AES算法选择了一种合适的异构并行化方案;基于该异构并行模式,在“神威,太湖之光”系统上对AES算法的加、解密运算设计并行算法;在此基础上,提出两种性能优化策略,进一步开发申威26010处理器的计算资源,提高大规模异构并行AES算法的计算和通信性能。
  (2)基于“神威,太湖之光”超级计算机,结合并行AES算法和SHA-3算法设计了一种快速、安全的高性能数据安全保护系统,不仅实现了大规模应用中对数据的高效加/解密,而且保证了数据存储和操作过程中的安全性和完整性;针对“神威·太湖之光”的计算结构和内存层次,对高性能数据安全保护系统提出了一种细粒度的异构并行化设计,以充分发挥平台的多级并行性,更好地控制平台多级内存层级构架中的数据管理;进一步对所提出的安全保护系统中的并行算法部分设计一系列优化策略,使其在“神威.太湖之光”上获得更好的数据加/解密性能。
  (3)针对大规模SpMV运算扩展到“神威·太湖之光”异构并行构架所面临的局部存储器限制、高访存延时和负载不均等问题,本文提出了一种TPSpMV加速计算框架。为解决CPE上局部数据内存LDM对计算规模的限制,设计了一种两阶段并行执行方案,将基于CSR格式的SpMV运算分为两个阶段执行,即并行PartialCSR-SpMV阶段和并行累加阶段;为了减少并行SpMV中不规则数据访问所造成的访存延迟,并缓解并行工作负载分配不均衡的问题,利用LDM缓存技术设计了一种自适应数据划分策略和并行化机制;为了进一步利用平台的硬件优势,提出了几种优化技术,提高TPSpMV对“神威”计算资源的利用率。
  (4)针对SpMSpV扩展到大规模异构多/众核系统所面临的大量冗余数据和不规律访存问题,提出了一种高效的细粒度并行SpMSpV计算框架(fgSpMSpV)。为减少不必要的内存占用和计算操作、优化数据局部性,提出一种SpMSpV数据重集方法,将输入稀疏矩阵、稀疏向量、稀疏结果向量中计算所必须的非零元素进行重新收集;为了缓解SpMSpV运算中带宽利用率低、可能的并行写冲突和负载不均等问题,对重集后的稀疏矩阵数据设计了一种适配的列向压缩存储格式,并提出一种基于“神威”架构的优化并行SpMSpV算法。理论分析和实验证明了所提出算法的有效性和良好的并行可扩展性。
其他文献
随着社会信息化地不断加深,无论是个人还是企业都坐拥着越来越多的数字化信息,信息量的持续增加加重了数据拥有者的管理负担,因此数据管理服务开始成为一种商业概念。随着云计算技术的发展,云平台的大容量、易部署、管理价格低廉等特点使之成为了数据存储服务的优秀提供商。云存储服务不但降低了数据拥有者的数据管理成本,而且提供了多种便捷的数据访问方式。但是如何在不可信的云服务商面前保证数据安全与隐私依然是亟待解决的一大问题,可搜索对称加密领域的研究试图解决这一难题。
  可搜索对称加密要求在外包数据前进行加密,并支持
习近平总书记在庆祝中国共产党成立100周年大会上的重要讲话,是闪耀着马克思主义真理光芒、真理力量的纲领性文献,是新时代中国共产党人不忘初心、牢记使命的政治宣言,是我们党团结带领人民以史为鉴、开创未来的行动指南。辽宁省直机关工委注重从百年党史和伟大建党精神中汲取强大力量,扎实推动省直机关党的建设高质量发展。  坚持党的领导  坚决做到“两个维护”   办好中国的事情关键在党。没有中国共产党,就没有新
期刊
随着车载GPS设备的大量安装和普遍使用,人们可以方便的获取海量车辆轨迹数据。这些轨迹数据集可潜在反映城市路网、人类出行行为以及城市交通动态等等,由此吸引了大量研究人员使用各种数据挖掘技术力求从这些数据中提取有价值的信息,为城市规划、智能交通、环境保护以及生物病毒传播遏制等领域实现许多创新应用。本文以私家车轨迹数据集为基础,研究了一种新的路网推理机制,据此挖掘和分析了个人出行模式、人群整体出行模式和城市间人群交互特征。
  路网是导航、辅助驾驶以及自动驾驶技术必不可少的一部分。车辆的GPS轨迹可反映潜
随着经济的持续快速发展,中国汽车保有量的持续增长与有限的城市道路资源之间的矛盾日益加剧。在汽车保有量中,私家车所占比例尤为突出。在中国,据公安部的统计,截至2019年12月31日,中国汽车保有量已增加到2.6亿辆,与2018年底相比,增加了2122万辆,增长比为8.83%。随着汽车的持续增加,将进一步加剧城市交通拥堵等问题。随着定位技术,信息处理和数据挖掘等技术的发展,为获取私家车大规模的轨迹数据带来了便利。在当今的智能交通系统中,大规模的车辆轨迹数据具有很高的利用价值。在大多数情况下,广泛使用的GPS(
与其他国家搞的多党制、两党制、一党制不同,中国实行的是中国共产党领导的多党合作和政治协商制度。这是一种具有中国特色的新型政党制度,与中国的国家性质及国情是比较吻合的。  中国政党制度模式选择   在当代中国,除中国共产党外,还有八个民主党派。这些党派诞生于20世纪三四十年代,并从一开始就与中国共产党建立了互济互助的合作关系。   中国共产党在领导新民主主义革命走向胜利的伟大斗争中,确立了在中国各种
期刊
忆阻器具有非易失性,能很好地模拟神经突触,从而被广泛地运用于神经网络中。基于忆阻器的良好特性,用忆阻器替换传统神经网络电路模拟中的电阻可以构建新型神经网络,即忆阻神经网络。因为同步、多稳定性等动力学行为在安全通信、图像加密、联想记忆存储等领域具有广泛的应用前景,从而忆阻神经网络的同步及多稳定性受到国内外学者们密切关注。此外,不同的忆阻神经网络模型也有不同的应用场景,如二阶忆阻神经网络中引入的惯性项通常是产生更加复杂的分叉与混沌行为的一个关键因素。由于忆阻神经网络在电路模拟过程中,放大器等元件不可避免的存在
习近平总书记在中央党校(国家行政学院)中青年干部培训班开班式的讲话中指出,凡是有利于党和人民的事,我们就要事不避难、义不逃责,大胆地干、坚决地干。这一重要指示,就要求新时代党员干部要有新担当新作为,以行动彰显实干、以实干扛起担当,干出一番事业、擎起一片蓝天。   要有忠诚于党的坚定信念。要让群众看得出,就要有坚定的理想信念,矢志不渝的事业追求。不可否认,现实中有的党员信仰发生偏移,不信马列信鬼神,
期刊
手绘草图是一种简洁且高效的表达方式,在人类社会漫长的发展中扮演着重要的角色,方便了人们交流和信息传递。现代社会中,手绘草图被广泛用于设计创作领域,比如动画卡通、建筑设计、服装设计等。然而,现有的计算机辅助设计系统需要人们在完成手绘草图创作之后,继续对该草图进行手工的语义标注操作,这是由于计算机还不能准确地解释手绘草图中人们表达的语义信息。如何利用计算机实现自动且高效地对手绘草图进行精准地语义解析与识别,进而提升相关从业人员的工作效率,是一项极具意义和挑战性的前沿课题。
  手绘草图语义解析与识别任务
日益发展的高带宽应用导致接入网流量的爆炸式增长。接入网肩负着连接用户的使命,其通信速率制约了终端用户最终所能获取的带宽资源。结构简单、成本低廉的强度调制直接检测(Intensity Modulation Direct Detection,IM/DD)光通信系统很适合应用于对成本非常敏感的接入网中,先进的调制格式和相关的数字信号处理技术(digital signal processing,DSP)能大大提高光通信系统的传输速率。因此,通过研究适用于IM/DD光通信系统的先进调制和DSP技术来克服系统传输中的
中国式民主是一种全过程的民主,不仅需要完整的制度程序,而且需要完整的参与实践。在当代中国,人民当家作主具体地、现实地体现到中国共产党执政和国家治理之中,具体地体现在国家权力、司法机关运行之中,也具体地体现在人民参与社会治理和基层自治之中。可以说,在中国,国家治理本质就是民主治理。  中国共产党民主执政   在70多年的执政实践中,中国共产党形成了较为成熟的民主执政理念,探索出高效的国家治理模式。中
期刊