如何看待全球超级计算机 TOP 500 榜单日本登顶,中国跌出前三?近年中国超算发展现状如何?

历史地看中美日超级计算机竞争

很多事情结合历史来看会比较有意思。

2002年日本的超级计算机“地球模拟器”达到35TFlops,超过此前世界第一、IBM的ASIC White性能的5倍。美日之间的超级计算机竞争进入白日化阶段,都希望率先在2010年前实现Petaflops。2004年对中国来说是一个重要的时间节点,曙光4000A首次在Top500排行榜上进入世界前十,当时中国也制定了2010年达到Petaflops的计划。于是,美国开始把中国也列为冲击Petaflops选手之一。当时,我刚到计算所读研究生不久,听报告时经常能看到这张图片(应该是《纽约时报》提供的)。

2005年第11期的Communication of the ACM有一段关于中美日三国超级计算机竞赛的报道。当时中国最快的超级计算机曙光4000A才刚刚进入前十,中国在Top500排行榜上还只有19台计算机。但是美国人还是没有看错,5年后的格局正如当时所预测——2008年6月美国的Roadrunner率先突破1PFlops;两年后,2010年11月中国的天河一号A以2.5PFlops的性能夺得世界第一,中国超级计算机首次登顶;半年后,2011年6月,日本超级计算机“京”以8PFlops的性能再次登顶。

在超级计算机领域,最新一代比前一代快几倍甚至十倍也很常见,所以暂时落后可能是因为机器还在研制中。中美日谁率先冲到Exaflops这个里程碑,究竟鹿死谁手,还充满悬念。但可以肯定的是如今中国的超级计算机已妥妥地处于第一梯队,国内的三家(天河、神威、曙光)都具有研制世界第一超级计算机的水平。因此,某种程度上拿个世界第一更多的是一种象征意义。

再说说日本Fugaku靠什么夺得世界第一

最新公布的全球超计算机Top500排行榜,日本的超级计算机Fugaku排名世界第一,日本继2011年K夺得世界第一后再次回到世界之巅。

一般而言超级计算机研制有主要有三个难点——节点算力、互连网络、功耗散热控制(关系到系统稳定性)。根据现有的公开资料对Fukaku的设计做个大致的分析如下:

(1)单节点的运算能力。Fugaku定制了一颗基于ARM v8指令集的SoC处理器A64fx。我看了这颗处理器一些公开的参数,不管是集成度、运算性能还是访存带宽,都是相当强悍。

  • A64fx直接把互连网络的接口Tofu-D集成到芯片中了。所以可以直接数据直接从芯片就可以送到互连网络中,而不像传统那样需要先到PCIe总线,然后再转到互连网络上。

  • 处理器的运算能力也是非常出色,支持2个512位的向量运算单元,这对提升芯片绝对性能帮助非常大。而且还支持不同精度的定点和浮点运算,这确实和GPU很像了。
  • 访存能力也是非常强,集成了4个HBM2。作为对比,Google的TPUv2也只有集成2个HBM,去年发布的TPU v3也是集成了4个HBM2。

综合来看,A64fx处理器是一颗全能型选手,既可以做高性能计算,也可以做AI计算,而且都还不错。这个设计还是很牛的。

(2)互连网络。高性能计算机的互连网络也是非常核心的部件,中美的超级计算机一般都是采用商用的InfiniBand,但日本的互连网络设计是他们的强项。这次也是沿用了Tofu-D互连网络,将15万个节点(730万个处理器核)连接,而且直接芯片中直接集成了Tofu-D接口,这进一步提升了互连网络的效率。

(3)功耗散热控制。Fugaku的功耗是28MW,中规中矩,并特别突出,也没有看到相关资料介绍它在这方面有特别设计。相比而言,之前中国的神威太湖之光在散热方面采用了液冷技术,是在超级计算机领域中的一个突破(但总功耗还是较高)。

——-

结论:日本的Fugaku最大亮点还是那颗A64fx处理器,互连网络发挥稳定,功耗散热控制中规中举。

来源:知乎 www.zhihu.com

作者:iKnow

【知乎日报】千万用户的选择,做朋友圈里的新鲜事分享大牛。
点击下载

此问题还有 201 个回答,查看全部。
延伸阅读:
如何评价神威太湖之光打败天河二号在超算 Top 500 榜单中登顶第一?

中国神威太湖之光位列HPC TOP500榜首,能说明中国计算机领先国际水平吗?