论文部分内容阅读
国内高性能计算领域的年度盛会——2011全国高性能计算学术年会10月29日至30日在济南举行。向着万万亿次迈进成为年会的热点。
蓄势万万亿次
在题为《中国的HPC自主之路》大会报告中,中国工程院院士陈左宁表示,1983年1亿次的银河Ⅰ、1996年1千亿次的神威Ⅰ、2000年1万亿次的银河Ⅳ、2009年1千万亿次的天河1号,是我国HPC发展史上实现性能跨越的里程碑。在这些性能量级的实现时间上,我国与国际同行的时间差从最初的7年缩短到只有1年。而在2010年11月,天河1号夺得了全球HPC 500强的第一名。
陈左宁认为,当前,我国HPC在核心器件的使用水平上与国际同步,技术差距在缩小,但在芯片工艺上差距悬殊;体系架构的使用水平与国际同步,且技术差距在缩小;系统软件的使用水平与国际同步,技术差距也在缩小;应该引起足够重视的是在应用上,尽管使用水平与国际的差距在缩小,但技术差距有扩大的危险,而且,前三个层面的自给率上都是自主与引进并举,唯独在应用上是以使用国外软件为主。
“今年,中国在全球HPC 500强榜单的机器份额上首次超越日本,仅位居美国之后。”中国HPC百强编制者中科院软件所研究院张云泉在揭晓2011中国HPC百强时表示,“今年百强总Linpack性能为11.85 Pflops(千万亿次浮点/秒) ,较之去年的6.3PFlops提高了0.88倍。”
在今年的HPC十强中,天津超算中心的星河1号蝉联冠军,但亚军已被国家并行计算机工程技术研究中心研发研发的神威蓝光获得。共有7个新面孔第一次出现在十强榜单上。今年HPC百强的Linpack入门门槛从2010年的9.6TFlops(万亿次浮点/秒)提高到22.1TFlops,峰值性能从11TFlops提高到25.6TFlops。
从制造商上看,国产机器厂商占有率达到51%,其中,曙光公司继续保持中国TOP100数量份额第一名,而国防科大则连续3年保持百强冠军和总性能第一名。
从机器数量上看,互联网服务、政府部门、教育、超算中心和电信行业包揽前5名,而云计算、半导体等作为新兴应用领域首次出现在百强榜上。
从体系架构上看,机群从去年的98套降到今年的97套,依旧占据主导地位;CPU GPU异构机群在百强中共有13套,其中在前三名中占据2个席位。
从CPU上看,除了神威蓝光采用自主CPU外,其余99套均为x86架构,其中英特尔占85套、AMD占14套。
根据张云泉的预测,国内万万亿次HPC将在2012年~2013年之间问世。
神威蓝光:万万亿次实力在握
今年9月,国家并行计算机工程技术研究中心研发的神威蓝光高性能计算机落户国家超级计算济南中心。该系统采用8704个我国自主研发的申威1600 CPU,峰值性能达到1.07PFlops,LinPack为0.796PFlops。神威蓝光是我国唯一一个完全采用自主CPU构建的千万亿次HPC,也使得我国继美国和日本之后成为第三个在千万亿次HPC上实现自主可控的国家。
神威蓝光具有自主可控的CPU与基础软件、超大规模且高度可扩展、绿色节能、高可用等四大特点。
作为工业和信息化部支持的核高基重大专项,申威1600是由国家高性能集成电路(上海)设计中心于2010年8月研发的首款64位通用16核CPU,申威1600采用自主研发的RISC指令体系,芯片集成有6.1亿个晶体管,主频为0.975~1.1GHz,典型功耗只有43.7W。在制造上突破了,基板生产与芯片封装技术。
与3家国际通用CPU厂商的主流产品相比,在相同工艺下,神威1600实现了管芯面积和单位面积晶体管集成度最高,峰值性能最高和能效比最高。在同一时期内,申威1600以140.GFlops的峰值性能领先,并以2GFlops/W的能效比领先,也是内核数最大的通用64位CPU。
需要特别指出的是,申威1600问世时,3家国际通用CPU厂商的主流产品均为45纳米工艺且主频则在2.2~4.1GHz,而申威1600采用的是65nm工艺且主频最高只有1.1GHz,这意味着,申威1600在性能上还有很大的提升空间。据悉,即将推出的申威1610将会进一步提升主频和访问内存性能。
神威蓝光还在基础编译系统、基础库和自动并行识别等基础软件上实现了自主可控。
在系统体系架构上,国家并行计算机工程技术研究中心提出了“基于片上系统的紧耦合高流量层次互连”的高效能体系结构,面向申威CPU研发的并行操作系统全面采用虚拟化技术,支持CPU、存储器、以太网卡、计算网等资源的虚拟化,实现了国产CPU运算节点的资源复用和故障隔离,提高了资源利用率和系统可用性。
神威蓝光也是国内首台采用纯液冷技术的千万亿次系统,其性能功耗比达到了741.06MFlops/W,与上届全球HPC500强前十名一同比较,排名可达第三;神威蓝光的组装密度高达1024个CPU/机仓。
神威蓝光的主动容错节点迁移技术,通过数据感知和故障挖掘,发现潜在的故障,利用配置相应的容错策略,自动触发主动迁移过程,从而保障了整个系统的高可用。
据国家并行计算机工程技术研究中心的专家介绍,神威蓝光采用的是万万亿次的体系架构,加之其在能效功耗比和组装密度上的优势,确保了系统规模可以扩展到万万亿次。
万万亿次要靠应用拉动
HPC既是智力密集型领域,同时又是资本密集型领域。HPC系统需要昂贵的资金建造,又需要不菲的资金维护运营,撇去系统折旧、维护等开销,单是一个典型的千万亿次HPC系统两年的电费支出就要超过1亿元。因此,在HPC迈向万万亿次的过程中,唯有应用导向才能优化HPC的体系并兑现HPC的价值。
中科院徐冠华院士在题为《全球变化研究与高性能计算》的大会报告中指出,全球气候变暖正严重影响着人类的生产活动与生活环境,这是各国政府和科学家必须面对的重大问题,地球系统是全球变化研究最重要的工具之一。而地球系统模拟则是把大气圈、水圈、生物圈、岩石圈和冰冻圈之间在千年乃至万年的长时间过程中复杂的相互作用转移到HPC上。
徐冠华说,地球系统模式呈现4大趋势:分量越来越多,分辨率越来越高,物理过程描述更加精细和集合模拟日显重要。这4大趋势对HPC的性能、技术和人才都提出了极高的要求。单就分辨率而言,当模拟分辨率为100千米时,需要十万亿次的HPC;当分辨率缩小到10千米时则需要万万亿次的HPC,分辨率到了5千米时就需要10万万亿次的HPC。
他认为,制约我国地球模式系统发展的不仅仅是缺乏面向地球系统模式的高性能、高效率的HPC,更重要的是地球系统模式涉及数学、物理、环境、计算机等众多学科,学科交叉特别是各学科与HPC领域交叉不足,已成为我国发展地球系统模式的瓶颈。
“地球系统数值模拟将极大地推动我国高性能计算机研制、高性能计算技术与到高性能应用的水平。”徐冠华总结道。
在HPC的历史上,一方面,极高强度的计算应用始终推动着HPC不断地优化性能,引领着HPC向着更高的性能攀登,这种专有化的平台位于HPC金字塔的塔尖。另一方面,来自更多行业和领域对HPC的需求,使得HPC从最初主要用于军事目的专有计算平台向着通用计算平台的方向发展,这种趋势要求HPC基于应用优化,从而适用各种类型的应用。
尽管采用机群架构的HPC能够支持相当多的应用,但在应用的部署和资源的动态调度上还是比较麻烦,需要HPC方面的专业人士介入。
只有当HPC与云计算对接后,才能通过虚拟机来支持更为广泛的应用,并且显著降低HPC的应用门槛。云计算将把HPC变成社会的基础设施,从而让HPC平民化。
蓄势万万亿次
在题为《中国的HPC自主之路》大会报告中,中国工程院院士陈左宁表示,1983年1亿次的银河Ⅰ、1996年1千亿次的神威Ⅰ、2000年1万亿次的银河Ⅳ、2009年1千万亿次的天河1号,是我国HPC发展史上实现性能跨越的里程碑。在这些性能量级的实现时间上,我国与国际同行的时间差从最初的7年缩短到只有1年。而在2010年11月,天河1号夺得了全球HPC 500强的第一名。
陈左宁认为,当前,我国HPC在核心器件的使用水平上与国际同步,技术差距在缩小,但在芯片工艺上差距悬殊;体系架构的使用水平与国际同步,且技术差距在缩小;系统软件的使用水平与国际同步,技术差距也在缩小;应该引起足够重视的是在应用上,尽管使用水平与国际的差距在缩小,但技术差距有扩大的危险,而且,前三个层面的自给率上都是自主与引进并举,唯独在应用上是以使用国外软件为主。
“今年,中国在全球HPC 500强榜单的机器份额上首次超越日本,仅位居美国之后。”中国HPC百强编制者中科院软件所研究院张云泉在揭晓2011中国HPC百强时表示,“今年百强总Linpack性能为11.85 Pflops(千万亿次浮点/秒) ,较之去年的6.3PFlops提高了0.88倍。”
在今年的HPC十强中,天津超算中心的星河1号蝉联冠军,但亚军已被国家并行计算机工程技术研究中心研发研发的神威蓝光获得。共有7个新面孔第一次出现在十强榜单上。今年HPC百强的Linpack入门门槛从2010年的9.6TFlops(万亿次浮点/秒)提高到22.1TFlops,峰值性能从11TFlops提高到25.6TFlops。
从制造商上看,国产机器厂商占有率达到51%,其中,曙光公司继续保持中国TOP100数量份额第一名,而国防科大则连续3年保持百强冠军和总性能第一名。
从机器数量上看,互联网服务、政府部门、教育、超算中心和电信行业包揽前5名,而云计算、半导体等作为新兴应用领域首次出现在百强榜上。
从体系架构上看,机群从去年的98套降到今年的97套,依旧占据主导地位;CPU GPU异构机群在百强中共有13套,其中在前三名中占据2个席位。
从CPU上看,除了神威蓝光采用自主CPU外,其余99套均为x86架构,其中英特尔占85套、AMD占14套。
根据张云泉的预测,国内万万亿次HPC将在2012年~2013年之间问世。
神威蓝光:万万亿次实力在握
今年9月,国家并行计算机工程技术研究中心研发的神威蓝光高性能计算机落户国家超级计算济南中心。该系统采用8704个我国自主研发的申威1600 CPU,峰值性能达到1.07PFlops,LinPack为0.796PFlops。神威蓝光是我国唯一一个完全采用自主CPU构建的千万亿次HPC,也使得我国继美国和日本之后成为第三个在千万亿次HPC上实现自主可控的国家。
神威蓝光具有自主可控的CPU与基础软件、超大规模且高度可扩展、绿色节能、高可用等四大特点。
作为工业和信息化部支持的核高基重大专项,申威1600是由国家高性能集成电路(上海)设计中心于2010年8月研发的首款64位通用16核CPU,申威1600采用自主研发的RISC指令体系,芯片集成有6.1亿个晶体管,主频为0.975~1.1GHz,典型功耗只有43.7W。在制造上突破了,基板生产与芯片封装技术。
与3家国际通用CPU厂商的主流产品相比,在相同工艺下,神威1600实现了管芯面积和单位面积晶体管集成度最高,峰值性能最高和能效比最高。在同一时期内,申威1600以140.GFlops的峰值性能领先,并以2GFlops/W的能效比领先,也是内核数最大的通用64位CPU。
需要特别指出的是,申威1600问世时,3家国际通用CPU厂商的主流产品均为45纳米工艺且主频则在2.2~4.1GHz,而申威1600采用的是65nm工艺且主频最高只有1.1GHz,这意味着,申威1600在性能上还有很大的提升空间。据悉,即将推出的申威1610将会进一步提升主频和访问内存性能。
神威蓝光还在基础编译系统、基础库和自动并行识别等基础软件上实现了自主可控。
在系统体系架构上,国家并行计算机工程技术研究中心提出了“基于片上系统的紧耦合高流量层次互连”的高效能体系结构,面向申威CPU研发的并行操作系统全面采用虚拟化技术,支持CPU、存储器、以太网卡、计算网等资源的虚拟化,实现了国产CPU运算节点的资源复用和故障隔离,提高了资源利用率和系统可用性。
神威蓝光也是国内首台采用纯液冷技术的千万亿次系统,其性能功耗比达到了741.06MFlops/W,与上届全球HPC500强前十名一同比较,排名可达第三;神威蓝光的组装密度高达1024个CPU/机仓。
神威蓝光的主动容错节点迁移技术,通过数据感知和故障挖掘,发现潜在的故障,利用配置相应的容错策略,自动触发主动迁移过程,从而保障了整个系统的高可用。
据国家并行计算机工程技术研究中心的专家介绍,神威蓝光采用的是万万亿次的体系架构,加之其在能效功耗比和组装密度上的优势,确保了系统规模可以扩展到万万亿次。
万万亿次要靠应用拉动
HPC既是智力密集型领域,同时又是资本密集型领域。HPC系统需要昂贵的资金建造,又需要不菲的资金维护运营,撇去系统折旧、维护等开销,单是一个典型的千万亿次HPC系统两年的电费支出就要超过1亿元。因此,在HPC迈向万万亿次的过程中,唯有应用导向才能优化HPC的体系并兑现HPC的价值。
中科院徐冠华院士在题为《全球变化研究与高性能计算》的大会报告中指出,全球气候变暖正严重影响着人类的生产活动与生活环境,这是各国政府和科学家必须面对的重大问题,地球系统是全球变化研究最重要的工具之一。而地球系统模拟则是把大气圈、水圈、生物圈、岩石圈和冰冻圈之间在千年乃至万年的长时间过程中复杂的相互作用转移到HPC上。
徐冠华说,地球系统模式呈现4大趋势:分量越来越多,分辨率越来越高,物理过程描述更加精细和集合模拟日显重要。这4大趋势对HPC的性能、技术和人才都提出了极高的要求。单就分辨率而言,当模拟分辨率为100千米时,需要十万亿次的HPC;当分辨率缩小到10千米时则需要万万亿次的HPC,分辨率到了5千米时就需要10万万亿次的HPC。
他认为,制约我国地球模式系统发展的不仅仅是缺乏面向地球系统模式的高性能、高效率的HPC,更重要的是地球系统模式涉及数学、物理、环境、计算机等众多学科,学科交叉特别是各学科与HPC领域交叉不足,已成为我国发展地球系统模式的瓶颈。
“地球系统数值模拟将极大地推动我国高性能计算机研制、高性能计算技术与到高性能应用的水平。”徐冠华总结道。
在HPC的历史上,一方面,极高强度的计算应用始终推动着HPC不断地优化性能,引领着HPC向着更高的性能攀登,这种专有化的平台位于HPC金字塔的塔尖。另一方面,来自更多行业和领域对HPC的需求,使得HPC从最初主要用于军事目的专有计算平台向着通用计算平台的方向发展,这种趋势要求HPC基于应用优化,从而适用各种类型的应用。
尽管采用机群架构的HPC能够支持相当多的应用,但在应用的部署和资源的动态调度上还是比较麻烦,需要HPC方面的专业人士介入。
只有当HPC与云计算对接后,才能通过虚拟机来支持更为广泛的应用,并且显著降低HPC的应用门槛。云计算将把HPC变成社会的基础设施,从而让HPC平民化。