6 月 20 日德国法兰克福国际超级计算机大会 (ISC)公布了新一期世界计算机 500 强榜单,我国最新的超级计算机“神威•太湖之光”登顶。最受关注的是,“神威•太湖之光”实现了核心处理器的全国产化。

据了解,本次世界最快超级计算机使用的微处理器芯片并非由硅谷英特尔公司提供,“神威•太湖之光”超级计算机由国家并行计算机工程技术研究中心研制,安装在国家超级计算无锡中心,这也是有史以来的第一次。

约等于20 台家用计算机的神速运算

“神威•太湖之光”击败的是霸占榜首 3 年的“天河 2 号”。“神威•太湖之光”运算速度达到 93 petaflop(每秒运算一千万亿次),理论最高速达 125.4 petaflops。这一数值约为“天河 2 号”的两倍。

区别于“天河 2 号”采用的英特尔 Xeon E5-2692v2 12 核处理器,“神威•太湖之光”首次采用国产核心处理器“申威 26010”。

2016JUN19 OS EMBEDDED NT 01 54

新华社记者称,“申威 26010” 大小约 25 平方厘米,集成了 260 个运算核心,内置数十亿晶体管。每块“申威 26010”运算能力为每秒3万多亿次,约等于 20 台家用计算机。

然后可以做一题简单的乘法题:

•“神威•太湖之光”由 40 个运算机柜和 8 个网络机柜组成 •每个柜门内有 4 块超节点 •每块超节点由 32 块运算插件组成 •每个插件由 4 个运算节点板组成 •每个运算节点板又含 2 块“申威 26010”处理器 •整台“神威•太湖之光”共有 40960 块“申威 26010”处理器

叠加之下,“神威•太湖之光”一分钟的计算能力相当于全球 72 亿人口用计算器不间断计算 32 年。根据资料显示,就算最新的“神威•太湖之光”也存在着短板。它使用的是相对较旧的内存芯片技术,这意味着与美国目前运算能力最强的超级计算机相比,它的处理器数据存取速度会受限。另外,这台新型中国超级计算机仍旧是基于美国的光纤网络技术研发的,该技术主要用于连接数以千计的微处理器芯片。

2016JUN19 OS EMBEDDED NT 01 53

越来越快的计算能力

目前中国在排行榜上硕果最丰,但占据榜单前 20 位的超级计算机里,由美国研发的还是占了 10 台。欧洲眼下共有 105 个超级计算机系统上榜;日本在 11 月时还有 37 个系统登榜,而现在降至 29 个。

榜单前十名除了“神威•太湖之光”与“天河二号”外,分别为美国的“泰坦”与“红杉”、日本的“京”、美国的“米拉”和“三一”、瑞士的“代恩特峰”、德国的“花尾榛鸡”和沙特阿拉伯的“沙欣II”。

而在上榜总数量上而言,上榜计算机数量上,中国以 167 台超越美国 165 台成为上榜最多的国家,而这 167 台计算机全部是近 15 年研发的——2001 年前这一数字为 0 。

“没有国家能有这速度。“排行榜主要编撰者兼美国田纳西大学计算机学教授 Jack Dongarra 接受《华尔街日报》采访说:“中国超级计算机不断增多已成为一个趋势。”

田纳西大学(University of Tennessee)的计算机科学家杰克•唐加拉(Jack Dongarra)还提到,去年,美国禁止了其国内一些先进微处理器对中国的出口,因为政府担心它们被用于发展核武器,而这一举动很可能恰恰促使了中国发展其自主技术。

2016JUN19 OS EMBEDDED NT 01 55

“神威太湖之光”超级计算机的交换机网线

2001 年时,中国尚无一台超级计算机在 500 强名单中登榜。而如今,共有 167 台跻身 500 强的超级计算机来自中国,而来自美国的只有 165 台。同时,中国还在一个比较生僻的领域——总处理能力——中异军突起,这个指标指的是一个国家所有上榜的超级计算机加总后的运算速度。

但美中不足的是,根据资料显示,就算最新的“神威•太湖之光”也存在着短板。它使用的是相对较旧的内存芯片技术,这意味着与美国目前运算能力最强的超级计算机相比,它的处理器数据存取速度会受限。另外,这台新型中国超级计算机仍旧是基于美国的光纤网络技术研发的,该技术主要用于连接数以千计的微处理器芯片。

超级计算机日趋重要

据了解,“全球最快超级计算机 500 强”(Top 500)排行榜每年公布两次,最新榜单发表于周一,中国取得了显赫战绩:中国研发的超级计算机不仅连续七次夺得世界运行速度最快计算机称号,其跻身 500 强的超级计算机总数也为世界之最——这还是首次有美国以外的国家获此殊荣。

在科学界,超级计算机常被视作一个国家技术领军能力的指标,从新式武器和药物的研发,到汽车与消费类产品的设计,它们都起着至关重要的作用。Google、微软、Facebook、亚马逊等私营公司均投资了数十亿美元用于兴建云计算中心,但解决科学问题并不是云计算的主要关注点。 多年来,美国计算专家和企业高管们一直告诫道,在超级运算领域保持领先地位,将对国家利益的许多方面产生深远影响。

其实,超级计算机的应用领域非常广阔,不仅代码破解和核武器发展(核爆炸模拟)等都需要高速处理大量复杂计算。在民用用途上,超级计算机也正在发挥着强大的作用,尤其在气候预报,石油勘探、药物开发和汽车设计等方面。在医学领域,对人体血流进行模拟与分析,可以及时有效地判定一个病人是否会发生脑梗塞的风险,超级计算机的运算能力可以提供快速的预判。

物理学家、芝加哥大学教务长的埃里克•艾萨克(Eric D. Isaacs)曾这样说道“今天,甚至连一个家用洗涤液的瓶子都是由超级计算机设计的”,“中国越来越擅长研发这类计算机,对美国产业和国家安全来说,这成了一个事关竞争力的问题。”

看近期的榜单,美国在 500 强榜单上逐渐失去领军地位,这里的原因有很多:人们对基础科学研究中投入的联邦开支额度长期存在争议;对政府资助与国家安全无直接关系的产业创新的反对声音也一直存在,因此,政府对超级计算机事业的扶持已经有所放缓。

跑得比谁都快 仍难掩应用尴尬?

运算速度快,数量增加速度也快,除了在高中历史课本和新闻上感受到它的“快”之外,我们真的能用到这种“快”吗?

虽然同为超级计算机,但中国和国外的建造目的存在区别。

目前我国的超级计算机主要有银河、天河、曙光、神威四个系列,除了军用的“银河 V”和“神威 Ⅱ”(在研)之外,主要应用方式都是租用。租用对象主要是高校、科研院所、商业企业等。

而美国超级计算机的建设方一般都是使用方。在榜单上排名第三、也是美国最快的 Titan 建设方是美国能源部,主要应用于美国能源部内部的核试验模拟。

定位不同,建设方式自然就不同。国外超级计算机建设方一般是先有计算量需求,根据所需计算量设计系统,根据需求设计超级计算机的架构方式。中国是先进行建设,尽力提高建能,尝试满足更高的计算需求。

因此,“泰坦”与“红杉”等国外超级计算机用途较为单一,基本只能适配某一方向的应用,但针对性、专业性更强。而国内超级计算机则更为开放,可以匹配不同使用者的需求。

问题是,如果没法用起来,再高的计算能力只是一个让人迷醉的数字,意义在哪?

去年 6 月《南方日报》就报道过“天河 2 号”所在的广州超算中心的“业务荒”。

南方日报提出,自 2014 年落户广州以来,广州超算中心已成为广东最大的科技基础设施,但高昂的能耗费用,宣传推广不力,国际交流与合作不足,嫁接国家重大领域的科研项目较少,应用软件开发的周期过长,人才梯队与技术支撑尚未形成系统。

去年 6 月,广州超算中心主任袁学锋透露,广州超算中心利用率为 60%。用户占比上,83% 是政府机关、高校、科研院所,企业用户只有 17%。

中科院计算机网络信息中心研究员张鉴表示,我国利用超算系统解决问题的能力长期不足,相关商业应用软件仍为国外垄断。

除了资源闲置外,超级计算机的高耗能问题无可回避。

“天河二号”年耗电量达到 2 亿度,每天耗费电费 10 万元。另外,为了应对机柜因为高负荷产生的高温,广州超级计算机中心专门为“天河二号”建设了冷水厂,不间断运送 8 摄氏度的水进入超算中心的“水冷”系统。

结语

新的计算机发布成功,那么接下来,给这台机器进行软件移植和调试优化会是一个很有挑战的工作。

因为国产架构处理器,并没有社区支持,编程与优化经验仅仅掌握在少数人手里,公开的文档与资料更是少之又少;单处理器260核,相当于Intel的Knights Landing的逻辑核心数,其编程模式必定和传统CPU不同,又和GPU有区别。对于那些纯MPI的程序,很可能一个计算节点上没有足够内存让它们用完所有的核心。这台机器的持续速度比天河二号要快两倍多,节点数也比天河二号多一倍多(40960:16000),小编估计也不容易喂饱,可见,成为榜首后,新的挑战还在继续。