论文部分内容阅读
据联合国国际减灾战略1月18日公布的数据,去年全球共发生302起自然灾害,直接造成经济损失达3660亿美元,创30年来的新高,全年自然灾害共造成29782人死亡或失踪。天灾不能完全避免,但如能准确及时地预测,可以大大减少人员伤亡与经济损失。人们对于灾难短期预报的要求越来越高,灾害性天气的保障服务成为了气象研究的关键课题。
灾害预防呼唤更强高性能计算
大气科学本质上是实验性科学,目前人们还无法建造一个真实的大气实验室,只能通过海量的实测数据对大气活动进行模拟。目前完成48小时天气预报的总数据量高达25TB。如果要在有效的时间内完成计算,当计算能力不足时,就只好降低计算的分辨率,修改幻化方案,这样会影响预报的准确度。对气候尤其是特殊气象的研究要求更加精确的计算,这对承载相关重任的数据中心提出了更严峻的挑战。能够应战的,只有不断强化的高性能计算技术。
传统计算集群性能受限
一边是更高的要求,另一边却是力不从心,美国国家航空航天局(NASA)气候模拟中心面对的就是这样一个局面。名为Discover的计算集群集成的超级计算、可视化和数据管理技术可以提供大约 400 Teraflops(每秒百万亿次浮点运算)的计算能力,曾为该中心承担了多年的气候变化及相关现象研究工作。可是,Discover 是完全基于非虚拟化的集群系统,增加计算容量需要添加额外的物理服务器。扩展所带来的成本和计算复杂性越来越高,导致在作业过程中出现运算瓶颈等问题。当该中心意识到这些问题将对其研究造成影响时,采用具有更出色可扩展性并能支持更灵活作业安排的替代方案就被提上日程。
让高性能计算驾云前行
NASA气候模拟中心渴求的解决方案在云计算技术日渐成熟后开始成形。本着有效利用云基础设施天生优势的宗旨,该中心希望确定开放式云架构能否能满足其应用程序苛刻的吞吐率和延迟要求,与虚拟化相关的性能开销是否影响到系统整体性能。
Nebula是该中心探索的一种基于云的基础设施即服务(IaaS)的环境,它基于OpenStack开源软件项目。该项目用于支持大范围可扩展的云计算基础设施,以帮助企业构建私有云和公有云。英特尔一直积极参与该项目,支持其充分利用英特尔?誖平台功能。
为满足节点到节点通信对速度和延迟的严苛要求,NASA工程师与英特尔通力合作,将虚拟化技术的潜力发挥到极致。他们确立了一套性能基准测试工具,比较原始系统环境和虚拟化后的系统环境在不同工作负载下的表现。结果表明,使用万兆位以太网的Nebula云基础设施能够实现与基于InfiniBand的Discover相同的吞吐率和延迟。基于此,NASA气候模拟中心开始将其高性能计算工作负载向采用以太网结构的开放式基础设施进行迁移,以充分利用云计算和基于以太网的融合网络的可扩展性与灵活性优势。
Nebula成功的幕后英雄
Nebula的成功表明采用万兆位以太网来支持节点间通信和管理流量的开放式云架构高性能计算是一种可行的替代解决方案。其幕后英雄——英特尔的相关技术的价值获得了验证。如以太网服务器适配器支持的单根I/O虚拟化技术,它为设备在多个虚拟机(VM) 间实现共享提供了一种标准机制,克服与虚拟化相关的性能限制。
从该技术的成功应用上,人们也不难看出英特尔对高性能计算将向云计算迁移这一趋势的深刻洞察,以及在相关研发战略上的先见之明。英特尔早就意识到,降低一些关键云计算技术(如虚拟化)带来的额外开销就是实现高性能计算与云计算联姻的基础。因此它一直在强化核心硬件平台所有与云计算相关的内置特性或功能。
今年3月问世的英特尔?誖至强?誖处理器E5产品家族采用把I/O延迟时间降低30%的Integrated I/O技术,具备将I/O带宽速度提升2倍的PCI-E 3.0特性,搭载万兆位以太网适配器,为高性能计算用户加装更可靠的技术引擎,拉低他们的成本。有像Nebula这样计算环境,人们在灾害面前就能准备得更充分,不再惧怕。
灾害预防呼唤更强高性能计算
大气科学本质上是实验性科学,目前人们还无法建造一个真实的大气实验室,只能通过海量的实测数据对大气活动进行模拟。目前完成48小时天气预报的总数据量高达25TB。如果要在有效的时间内完成计算,当计算能力不足时,就只好降低计算的分辨率,修改幻化方案,这样会影响预报的准确度。对气候尤其是特殊气象的研究要求更加精确的计算,这对承载相关重任的数据中心提出了更严峻的挑战。能够应战的,只有不断强化的高性能计算技术。
传统计算集群性能受限
一边是更高的要求,另一边却是力不从心,美国国家航空航天局(NASA)气候模拟中心面对的就是这样一个局面。名为Discover的计算集群集成的超级计算、可视化和数据管理技术可以提供大约 400 Teraflops(每秒百万亿次浮点运算)的计算能力,曾为该中心承担了多年的气候变化及相关现象研究工作。可是,Discover 是完全基于非虚拟化的集群系统,增加计算容量需要添加额外的物理服务器。扩展所带来的成本和计算复杂性越来越高,导致在作业过程中出现运算瓶颈等问题。当该中心意识到这些问题将对其研究造成影响时,采用具有更出色可扩展性并能支持更灵活作业安排的替代方案就被提上日程。
让高性能计算驾云前行
NASA气候模拟中心渴求的解决方案在云计算技术日渐成熟后开始成形。本着有效利用云基础设施天生优势的宗旨,该中心希望确定开放式云架构能否能满足其应用程序苛刻的吞吐率和延迟要求,与虚拟化相关的性能开销是否影响到系统整体性能。
Nebula是该中心探索的一种基于云的基础设施即服务(IaaS)的环境,它基于OpenStack开源软件项目。该项目用于支持大范围可扩展的云计算基础设施,以帮助企业构建私有云和公有云。英特尔一直积极参与该项目,支持其充分利用英特尔?誖平台功能。
为满足节点到节点通信对速度和延迟的严苛要求,NASA工程师与英特尔通力合作,将虚拟化技术的潜力发挥到极致。他们确立了一套性能基准测试工具,比较原始系统环境和虚拟化后的系统环境在不同工作负载下的表现。结果表明,使用万兆位以太网的Nebula云基础设施能够实现与基于InfiniBand的Discover相同的吞吐率和延迟。基于此,NASA气候模拟中心开始将其高性能计算工作负载向采用以太网结构的开放式基础设施进行迁移,以充分利用云计算和基于以太网的融合网络的可扩展性与灵活性优势。
Nebula成功的幕后英雄
Nebula的成功表明采用万兆位以太网来支持节点间通信和管理流量的开放式云架构高性能计算是一种可行的替代解决方案。其幕后英雄——英特尔的相关技术的价值获得了验证。如以太网服务器适配器支持的单根I/O虚拟化技术,它为设备在多个虚拟机(VM) 间实现共享提供了一种标准机制,克服与虚拟化相关的性能限制。
从该技术的成功应用上,人们也不难看出英特尔对高性能计算将向云计算迁移这一趋势的深刻洞察,以及在相关研发战略上的先见之明。英特尔早就意识到,降低一些关键云计算技术(如虚拟化)带来的额外开销就是实现高性能计算与云计算联姻的基础。因此它一直在强化核心硬件平台所有与云计算相关的内置特性或功能。
今年3月问世的英特尔?誖至强?誖处理器E5产品家族采用把I/O延迟时间降低30%的Integrated I/O技术,具备将I/O带宽速度提升2倍的PCI-E 3.0特性,搭载万兆位以太网适配器,为高性能计算用户加装更可靠的技术引擎,拉低他们的成本。有像Nebula这样计算环境,人们在灾害面前就能准备得更充分,不再惧怕。