面向高性能计算的可扩展I/O体系结构研究与实现

来源 :国防科学技术大学 | 被引量 : 0次 | 上传用户:dianzi511
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
数值模拟计算是进行科学研究和探索的主要技术手段之一,其对计算机的计算和数据处理能力提出了巨大的、不断增长的需求,推动着并行计算机系统的发展。高性能计算已进入PetaFlops时代,与此同时,数据存储也进入Petabyte(千万亿字节)时代,对I/O性能、可扩展性、可靠性、可用性和易管理性提出了严峻挑战。大规模并行计算机系统的I/O效能已经成为阻碍系统获得高效能的重要瓶颈。这主要表现在两个方面,一是I/O设备速度、I/O体系结构等因素的制约,使系统I/O性能和计算性能严重不匹配;二是系统规模的扩展导致I/O设备高故障率和数据恢复时间的增长,使I/O系统的可用性问题日益突出。为了缓解I/O瓶颈问题,可以从应用程序、可扩展算法、编译器和语言、运行时库、操作系统和体系结构六方面展开研究。其中,I/O体系结构是所有技术途径的关键支撑。针对高性能计算I/O需求与挑战,结合高效能并行计算机系统的研制任务,论文首先研究了I/O体系结构,从体系结构上保证并行I/O的性能及可扩展性。其次,在实现机制上,研究了涵盖I/O的存储一致性模型及实现技术、智能I/O控制、电磁混合存储加速和事务型存储管理等技术,达到提高并行I/O性能和系统可用性的目的。论文的主要研究工作和创新点如下:1. I/O受限的并行加速比模型针对并行计算机系统的可扩展性问题,研究了I/O负载对并行计算机系统可扩展性的影响,提出了I/O受限的并行加速比性能模型,以此为基础对三类常见的I/O体系结构的可扩展性进行了分析;最后用性能模型指导I/O体系结构设计,设计了一种面向高性能计算的可扩展并行I/O系统结构,提出了提高系统可扩展性的几种策略。2.涵盖I/O的广义域存储一致性模型及协议实现技术针对支持全局DMA操作的共享存储系统存储一致性问题,从I/O与存储体系结构一体化设计理念出发,定义了涵盖I/O的广义程序概念,研究了广义存储一致性,建立了广义顺序一致性模型、广义释放一致性模型和广义域一致性模型,基于广义域一致性模型设计并实现了Cache-Memory-I/O数据一致性协议,在大规模CC-NUMA系统上实现了支持全局并发DMA的全局共享I/O系统。实测结果表明,该系统I/O吞吐能力和扩展能力强,实测并行I/O带宽高达20.2GB/s,并行I/O带宽随着进程个数良好扩展。3.基于强化学习的智能I/O调度算法RL-scheduler针对实际应用中磁盘阵列的I/O服务效率问题,将机器学习领域中的强化学习技术引入RAID控制器中,提出了基于强化学习的智能I/O调度算法RL-scheduler,利用Q-学习策略实现了面向并行应用的自治调度策略。RL-scheduler综合考虑了调度的公平性、磁盘寻道时间和MPI应用的I/O访问效率,并提出多Q-表交叉组织方法提高Q-表的更新效率。实验结果表明,RL-scheduler缩短了并行应用的平均I/O等待时间,提高了大规模并行计算机系统的实用I/O带宽,增强了系统的可扩展性。4.支持事务语义的电磁混合存储管理算法针对高性能计算对I/O性能和可用性的双重需求与挑战,在存储设备一级将事务型存储管理和电磁混合存储加速技术有机结合,研究支持事务语义的电磁混合存储技术,提出了基于令牌的并行事务冲突处理协议和自适应动态逻辑分区管理算法。模拟结果表明,支持事务语义的电磁混合存储系统能够有效利用事务访问规律提高固态盘缓存命中率,隐藏版本管理、冲突检测等开销,获得I/O性能和可用性的双重改善。
其他文献
计算机软件在当今社会中发挥着越来越重要的作用。无论是在人们的日常生活中,还是在一些关键系统中——例如银行系统,飞行控制器和医疗系统——都大量地使用软件。软件运行的
本文分析了税收征纳双方的信息不对称问题及其风险,进而提出了充分利用现代信息技术手段解决征纳双方信息不对称问题,完善税收信息管理机制,加强业务与技术的融合,提高税收征
实验教学在电子专业教学体系中发挥着举足轻重的作用。随着计算机技术的飞速发展和电路仿真软件的不断出现,很多高等学校通过计算机把教学内容、实验设备、教师指导、学生操
<正>纵观整个教学过程,我们的视角往往停留在备课、上课和实验教学上,其实"命题"也是高中生物教学过程中一个不可或缺的环节,有助于对学生学情的考察,根据学情教师可以对教学
本文重点介绍了目前实验室和市场上可用于固相组合合成的含羟基的聚合物载体及其主要的化学反应性能。
中国地震灾害紧急救援队经过几年来的开拓性发展,完成了多次具有减灾实效的成功救援行动。然而,由于我国救援事业起步较晚,整体水平还有待提高。本文以中国国际救援队成立后
恐怖主义袭击不仅是一种暴力恐怖活动,还是一种暴力传播行为。在对之进行严厉的暴力打击的同时,也极其有必要调控公众情绪,凝聚一切反对恐怖主义的力量,建构同仇敌忾的舆论环
高性能计算发展到今天,已经从单一地追求高性能转向致力于实现系统的高效能,提高系统的实际性能、可编程性、可移植性和健壮性,降低系统的开发、运行以及维护成本。然而,由于
工程和科学计算中的很多优化问题从最初的低维优化发展为高维、大规模复杂优化,或常常带有比较复杂的约束条件,因而比较难以求解。以遗传算法为代表的各类进化算法在求解该类
总结了国内外薄壳山核桃的种质资源、育种目标、育种方法以及良种繁育等方面的研究情况,并针对薄壳山核桃在我国的育种研究现状提出建议。概述了薄壳山核桃的起源与分布、品