中国超算即将达到量子性能-EDN 电子技术设计

 在2021年全球超级计算大会（SC21）上，一支来自中国的团队摘得赫赫有名的戈登贝尔奖，该奖相当于超算领域的诺贝尔奖。该团队的论文描述了他们如何使用新型超级计算机来仿真随机量子电路。

在2021年全球超级计算大会（SC21）上，一支来自中国的团队摘得赫赫有名的戈登贝尔奖，该奖相当于超算领域的诺贝尔奖。该团队的论文“Closing the Quantum Supremacy Gap: Achieving Real-Time Simulation of a Random Circuit Using a New Sunway Supercomputer”(缩小量子霸权差距：利用全新神威超级计算机实现随机电路的实时仿真)描述了他们如何使用新型超级计算机来仿真随机量子电路。jvAednc

事实上，谷歌对其2019年研发出的悬铃木（Sycamore）量子计算机自称“量子霸权”，当时颇受争议，而此次中国团队采用的即为同一测试基准。谷歌曾声称，悬铃木量子计算机在200秒内能完成的计算任务，像顶点（Summit）这样的经典超级计算机需要一万年才能完成。这一说法当时就遭到IBM的批驳，认为真实数字可能只是2.5天。而最新的中国超级计算机结合了中国团队的算法研究，在304秒内就能完成相同的计算任务。看起来量子计算机似乎仍然比经典超级计算机稍胜一筹，但差距无疑在缩小。jvAednc

据该论文描述，基于神威的超级计算机具有1.2ExaFLOPS的单精度性能。虽然这并没有从官方上证实中国所具备的Exascale性能的传闻（1.2ExaFLOPS为单精度，而“Exascale”这个术语则需要1ExaFLOPS的双精度性能），但这款新型超级计算机似乎确实是世界上最强大的超级计算机之一。尽管它尚未命名，但可以确定，这项研究采用了4190万个神威RISC处理器内核进行计算。jvAednc

超算500强出炉

人们都对世界上首个Exascale系统翘首以待，但全球超算排行榜500强HPC基准测试结果显示，前十名几乎没有变化。中国并没有为其基于神威的新型超算系统报名参加评选，而2021年末上线的美国1.5ExaFLOPS系统Frontier（前沿）似乎也还没有准备好（图1）。jvAednc

在中国新型超算和美国Frontier缺席的情况下，500强榜首仍然是卫冕冠军富岳（Fugaku），这个记录自2020年6月以来就一直保持着。这台日本超级计算机的HPL（高性能Linpack）基准分数为442PFLOPS，是排名第二的超级计算机Summit性能的三倍。jvAednc

jvAednc

图1：1.5ExaFLOPS的Frontier将成为美国第一个Exascale超算系统。（图片来源：美国橡树岭国家实验室）jvAednc

事实上，前十名几乎没有变化，唯一的新晋者是排在第十位的微软Azure超级计算机Voyager-EUS2。该系统基于AMD Epyc Rome CPU和英伟达A100 GPU。jvAednc

本轮值得注意的新晋者还包括四个俄罗斯的超算系统，排名位于19至43名之间。jvAednc

总体而言，本轮竞赛中，中国进入500强的系统从186个下降到173个，而美国从123个增加到150个。jvAednc

MLPerf HPC得分

大会还公布了AI基准测试套件MLPerf HPC的测试结果。这种基准测试专门用来衡量AI性能——AI在科学工作中的占比正变得越来越大。与上一轮提交相比，最佳基准测试结果提高了4至7倍，这表明，新一代超算无论是硬件、软件还是系统规模都有大幅的提升。jvAednc

除了日本富岳由其基于Arm的CPU提供支持，没有使用加速器之外，其他所有提交都由英伟达的GPU加速器提供支持，具体包括P100、V100和A100。jvAednc

英伟达还是CosmoFlow和DeepCAM基准测试中的赢家。CosmoFlow被用于根据宇宙学图像数据进行物理量的估计。最佳CosmoFlow测试结果为，采用1024个英伟达A100-SXM4-80GB GPU能够在8.04分钟内完成训练，而富岳则是用512个CPU在114.35分钟内对其进行管理。jvAednc

DeepCAM被用于在气候仿真数据中识别飓风和大气流。在此，英伟达仍居魁首，这次使用了相同的GPU但数量翻倍，时间为1.67分钟。jvAednc

美国劳伦斯伯克利国家实验室则跑赢了新的OpenCatalyst基准测试，他们采用了512个40GB版本相同的英伟达GPU，训练时间为111.86分钟。OpenCatalyst主要用于根据图的连通性预测分子构型的能量。提交人表示，将图形网络包含进来非常重要，因为它反映了材料科学和化学工作负载的最新技术水平。其计算特性不同于其他类型的神经网络，因为它们往往具有稀疏性，而且不同的数据集会导致网络具有不同的结构和连接性，这会导致负载的不均衡，从而使负载难以有效地并行。jvAednc

另外，测试中还引入了新的性能指标——弱缩放模式意味着系统能够同时训练同一模型的多个实例。其目标是要捕获对共享资源（如存储系统和互连）的影响。jvAednc

多裸片GPU

就在本届SC21大会之前，部分半导体公司发布了一些重要公告。jvAednc

大会前不久，AMD推出了首款多裸片GPU。AMD Instinct MI200将包含两个GPU裸片，它们之间通过一种新的2.5D硅桥技术（高架扇出桥，EFB）连接。该公司表示，与嵌入式硅桥架构竞争技术不同，这项技术支持标准的衬底和组装技术。jvAednc

MI200将是第一款基于AMD第二代CDNA2架构的GPU，该架构针对计算密集型HPC和AI工作负载进行了优化。与去年的第一代产品MI100相比，这款新器件尺寸大1.8 倍，拥有220个计算单元和880个矩阵内核。MI200还将拥有多达8个HBM2e内存堆栈，从而成为第一款具有128GB HBM2e内存的GPU。其内存容量是MI100的4.7倍，内存带宽是MI100的2.7倍。其FP64向量运算峰值性能为 47.9 TFLOPS，FP64矩阵数学峰值性能为95.7 TFLOPS。jvAednc

jvAednc

图2：AMD首款多裸片GPU MI200。（图片来源：AMD）jvAednc

据透露，美国首个Exascale超级计算机Frontier就将采用AMD Instinct MI200 GPU。jvAednc

“当我们去想我们这一代人所面临的最重要的挑战，例如能源转型、气候变化以及克服我们目前所面临的新冠疫情等问题时，Frontier将使我们能够利用由AMD处理器所驱动并提供支持的机器的能力来应对这些重要挑战。”美国橡树岭国家实验室（Frontier的所在地）的实验室主任Thomas Zacharia表示，“这使得MI200成为目前科学家们可利用的最强大的处理器。其单个GPU的性能就比目前美国最快超级计算机顶点的整个节点还要强大。”jvAednc

Zacharia表示，Frontier将很快上线，并于明年年初提供给科学家。jvAednc

仿真地球

英伟达首席执行官黄仁勋在英伟达GTC大会开幕主题演讲中透露，该公司将建造一台新的超级计算机 Earth 2，它将成为地球的数字孪生，主要用来仿真和预测气候的变化（图3）。黄仁勋还透露，Earth 2 将全部由英伟达出资开发，其规模将与英伟达内部的Selene超级计算机和用于医学研究的Cambridge-1 UK设备大致相同。他补充说，Earth 2的架构将使其成为“有史以来最节能的超级计算机”，不过，这台超算具体位于何处还待定。jvAednc

jvAednc

图3：Earth 2将致力于仿真和预测气候变化。（图片来源：英伟达）jvAednc

（原文刊登于EDN姐妹网站EE Times，参考链接：SC21: Chinese Supercomputer Approaches Quantum Performance，由Franklin Zhao编译。）jvAednc

本文为电子技术设计原创文章，未经授权禁止转载。请尊重知识产权，违者本司保留追究责任的权利。

阅读全文，请先

数据中心处理器/DSP 产业前沿 EDN原创

上一篇： 麻省理工工程师生产出世界最长柔性纤维电池 下一篇： 仿真问题：为振荡器绘制波特图

微信扫一扫
一键转发
最前沿的电子设计资讯
请关注“电子技术设计微信公众号”

雷击之后加强我的NAS备份，谨慎遵循3-2-1备份规则？在我之前报道被雷击事故时，我曾提到过，这次被雷击损坏的电子设备中包括一台网络存储设备(NAS)。这次挫折迫使我不能再忽视我数据备份防护中一个长期存在的漏洞···
AMD 宣布推出第二代 Versal Premium 系列，实现全新以业界首款采用 CXL 3.1 及 PCIe Gen6 并支持 LPDDR5 的 FPGA 器件扩展第二代 Versal 产品组合，助力快速连接、更高效数据迁移并释放更多内存···
后量子加密确保安全过渡量子计算时代量子计算机崛起的最重要影响之一就是对于安全的冲击，因为量子计算机甚至可能破解目前最安全的加密方法。这也就是为什么在此“量子十年”(quantum decade)期间，业界将会看到从传统加密系统快速转移到“后量子加密”(PQC)技术的原因...
Microchip推出高性能第五代PCIe®固态硬盘控制器系列 Flashtec® NVMe® 5016 控制器经过优化，可管理不断增长的企业和数据中心工作负载···
借助电源完整性测试提高人工智能数据中心的能效让我们通过基于的服务器系统的电源分配网络高能级结构图，了解如何评估 PDN 性能···
Melexis革新发布：无代码单线圈驱动芯片，助力服务器散热随着行业对数据存储和运算处理能力提出更高的要求，以及云服务和人工智能的快速发展，服务器的数量不断增加。这促使市场对兼具高可靠性和高成本效益的散热解决方案的需求日益增长。
Vishay推出具有业内先进水平的小型顶侧冷却PowerPAK® 第四代器件，额定功率和功率密度高于D2PAK 封装产品，降低导通和开关损耗，从而提升能效···
颠覆性 Cadence Reality 数字孪生平台为人工智能时代通过快速且高精度的 AI 驱动数字孪生，可将能效提升 30%···
三星官宣PB SSD解决方案规格：未来将拓展到PB级近日，据TechRadar Pro报道，三星确认了其PB SSD存储订阅计划的规格。该服务提供的订阅基数为244TB，只需5份订阅就能达到PB级……
英伟达公司Michael Kagan：以AI的“iPhone时刻”为基础 Kagan拥有40年的行业经验，他的职业生涯始于英特尔，参与了从i860到Pentium MMX的架构设计。
芯原推出面向下一代数据中心的全新VC9800系列IP 为数据中心提供卓越的吞吐量、AI编码和图像增强性能
Rambus通过业界首款第四代DDR5 RCD提升数据中心服务器数据速率提高到 7200 MT/秒，内存带宽比目前的第一代 DDR5 设备提高了 50%；扩大在服务器主内存中关键内存接口芯片解决方案领域的领先地位；支持针对生成式人工智能和其他高级数据中心工作负载的服务器性能加速路线图

25年第19周新能源周销量：不同价格带的车型走势解析本周插混与增程车型市场呈现出“两极化”趋势：一方面，10-15万元级的主流家用轿车与SUV销量强劲；另一方面，20万元
拆解报告：甲骨文3060W碳化硅服务器电源模块甲骨文服务器电源模块输入输出均为专用接口，采用热拔插设计。电源模块支持200-277V交流和240-380V直流输入，输
评测：森海塞尔ACCENTUM Open真无线耳机半入耳机森海塞尔ACCENTUM Open 真无线耳机采用半入耳式设计，搭配约4.4克的重量，佩戴舒适。耳机充电盒轻盈小巧，携带外
人形机器人如何做到“手眼”协同+“大小脑”协同？人形机器人正站在“走出实验室”的临界点。从本体制造、控制系统、核心零部件到应用场景拓展，技术与产业生态
南非2025年4月：奇瑞和长城汽车快速上升 2025年4月的南非车市增长，马恒达和现代的强劲回归是一个信号，而中国品牌的集体崛起，则预示着未来竞争将更加多
4月新能源车领跑汽车出口增长，中国汽车走向全球的新引擎 2025年开年以来的出口数据呈现出清晰的结构升级路径。新能源产品在出口中扮演的角色日益重要，不再只是锦上添
拆解报告：vivo手机原装90W氮化镓闪充充电器 vivo 90W氮化镓闪充充电器采用经典直板造型设计，同时附带一条专门量身定制的8.5A大电流数据线，配合信号屏蔽层
拆解报告：HONOR荣耀手环10 荣耀手环10在外观方面，延续了上代的轻薄双曲面设计，同时采用全新的双色NCVM镀膜工艺，使之更加的时尚精致。标配
2025年4月中国车企加速渗透土耳其市场：比亚迪Seal U打响突围战 2025年4月，土耳其市场的爆发式增长为全球车企提供了重要信号：新兴市场正在进入电动化转型的加速期，而土耳其作
2025年第19周新能源周销量：问界起势 2025年第19周，中国乘用车市场的周度销量达到44.4万辆，其中新能源车占比突破50%，达22.3万辆，占比50.2%。比亚迪体
2024年4月汽车市场终端数据：自主崛起、新势力分化、合资承压从整体销量数据来看，4 月汽车终端销量达 169.7 万，同比增长 9.3% ，在目前的价格力度下，这个销售数字差强人意。2
拆解报告：华为750W钛金牌服务器电源华为这款服务器电源型号为PAC750S12-TE，支持220V交流或240V直流输入，输出电压为12V，输出电流为62.5A，输出端设有

史密斯英特康推出新一代“ DaVinci Gen V”测试插座史密斯英特康推出新一代“ DaVinci Gen V”测试插座，为人工智能、6G通信及先进计算应用领域的芯片提供超
意法半导体高集成度低边电流测量放大器简化高准确度电流检测意法半导体的 TSC1801低边电流测量放大器集成了设定增益所需的匹配电阻，从而简化了电路设计，节省了物料清单
意法半导体推出创新的、带有可改变存储配置存储器的车规微控制器新推出的Stellar微控制器内置了xMemory技术，它为正在发展的软件定义汽车以及不断进化的电动汽车架构提供了一
新系列串口EEPROM内置唯一ID码，适合设备识别、溯源和可持续性应用意法半导体 (ST) 推出了一系列内置128位唯一只读ID码 (UID) 的串口EEPROM芯片，以满足市场对产品识别、溯
Vishay新添增强短瞬态脉冲防护性能的经AEC-Q200认证的厚膜功率电这些器件采用夹片式TO-247 封装形式，可直接安装在散热器上，具有高达 75 J/0.1 s的高脉冲吸收能力和 150
凉棚集成Nordic 技术实现Matter over Thread连接为家庭和企业 StruXure+ 凉棚和小屋系列集成 Nordic 的 nRF5340 SoC以提供无缝的 Matter over Thread 连接
智能楼宇技术全球领导者与Nordic Semiconductor携手合作确保楼业界连手推动NR+成为智能楼宇的全球连接标准···
Cadence 率先推出 eUSB2V2 IP 解决方案，助力打造高速连接新范 Cadence 在业内率先推出 eUSB2V2 IP，此 IP 基于先进的台积公司 N3P 工艺，符合最新的嵌入式 USB2 版
纳芯微发布双通道电流检测放大器NSCSA285，赋能工业与能源管理近日，上海 —— 纳芯微电子（简称“纳芯微”）发布全新高精度双通道电流检测放大器NSCSA285系列···
攻克PWM高频瞬态干扰难题！纳芯微发布车规级电流检测放大器NSCSA24 近日，纳芯微发布全新车规级双向电流检测放大器NSCSA240-Q1系列，专为汽车高压PWM系统打造解决方案···
TE Connectivity 推出INMORO系列：致力于满足中国市场需求而打造的连接和传感解决方案提供商泰科电子（TE Connectivity，以下简称 TE）工业事业部隆重推出INMORO 系列，致力于满足中
破解汽车与工业等应用新挑战，TDK展示多传感器融合与AI+发展趋势在新能源汽车应用中，热管理系统既要能高效地冷却和加热电池、电机与OBC等车辆核心部件，确保其处于最佳运行温

热门评论
最新评论

换一换

杂志声明

中国超算即将达到量子性能

超算500强出炉

MLPerf HPC得分

多裸片GPU

仿真地球