广告

英伟达称其144核心超级芯片比英特尔Ice Lake快2倍

2022-04-11 15:01:12 综合报道 阅读:
Nvidia 在3月底的GTC上推出了其新的144核 Grace CPU Superchip,日前外媒在 Nvidia 加速计算业务部门副总裁 Ian Buck 的 GTC 演示中发现了 Grace 与 Intel Ice Lake 的基准。该基准声称,在 HPC 中常用的天气研究和预报 (WRF) 模型中,Grace 比英特尔当前的 Ice Lake 快 2 倍,能效高 2.3 倍。

Nvidia 在3月底的GTC上推出了其新的144核 Grace CPU Superchip,396MB缓存、1TB/s LPDDR5X ECC内存,功耗500W,这是其第一款专为数据中心设计的基于 Arm 架构的 CPU 芯片。jWCednc

英伟达此前称 Grace 在SPECrate_2017 基准测试中快 1.5 倍比两个上一代 64 核 EPYC Rome 7742 处理器,但那毕竟是AMD的上一代产品了,架构还是Zen2,并且它将在 2023 年初到货时提供当今服务器芯片两倍的能效,AMD 已经有了更快的 EPYC Milan 发货。jWCednc

那么Grace CPU Superchip性能究竟如何呢?jWCednc

日前外媒在 Nvidia 加速计算业务部门副总裁 Ian Buck 的 GTC 演示中发现了 Grace 与 Intel Ice Lake 的基准。jWCednc

该基准声称,在 HPC 中常用的天气研究和预报 (WRF) 模型中,Grace 比英特尔当前的 Ice Lake 快 2 倍,能效高 2.3 倍。jWCednc

jWCednc

请记住,此性能测量特定于 Grace CPU 超级芯片:jWCednc

  • 适用于 HPC 和云计算的高性能 CPU
  • 具有多达 144 个 Arm v9 CPU 内核的超级芯片设计
  • 全球首款带 ECC 内存的 LPDDR5x,1TB/s 总带宽
  • SPECrate2017_int_base 超过 740(估计)
  • 900 GB/s 相干接口,比 PCIe Gen 5 快 7 倍
  • 2 倍于基于 DIMM 的解决方案的封装密度
  • 2 倍于当今领先 CPU 的每瓦性能
  • 运行所有 NVIDIA 软件堆栈和平台,包括 RTX、HPC、AI 和 Omniverse

 jWCednc

jWCednc

Nvidia 表示,其对 144 核 Grace 芯片的模拟表明,在 WRF 模拟中,它将比两个 36 核 72 线程英特尔“Ice Lake”至强白金 8360Y 处理器快 2 倍,并提供 2.3 倍的功率效率。这意味着我们看到 144 个 Arm 线程(每个都在一个物理内核上),面对 144 个 x86 线程(每个物理内核两个线程)。jWCednc

WRF 的各种排列是通常用于基准测试的实际工作负载,并且许多模块已被移植用于使用 CUDA 进行 GPU 加速。我们就这个特定的基准与 Nvidia 进行了跟进,该公司表示该模块尚未移植到 GPU,因此它以 CPU 为中心。此外,它对内存带宽非常敏感,这让 Grace 在性能和效率上都有优势。Nvidia 的估计是“基于标准 NCAR WRF,3.9.1.1 版移植到 Arm,用于 IB4 模型(伊比利亚半岛 4 公里区域预测)。”jWCednc

Grace 巨大的内存吞吐量将在性能和能源效率方面带来红利,因为增加的吞吐量通过保持贪婪的核心获得数据来减少非活动周期的数量。与 Ice Lake 的 DDR4 相比,这些芯片还使用了低功耗的 LPDDR5X。jWCednc

然而,与英特尔即将推出的 Sapphire Rapids 相比,Grace 可能没有那么大的优势——这些芯片支持 DDR5 内存,并且还有带有 HBM 内存的变体,可以帮助对抗 Grace 在一些内存带宽匮乏的 应用程序中的优势。AMD 还拥有具有 3D 堆叠 L3 缓存 (3D V-Cache) 的Milan-X,这对一些工作负载有好处,我们预计该公司将为 EPYC Genoa 系列制造类似的 SKU。jWCednc

Nvidia 在 GTC 和其新闻稿中使用的基准测试显示比 AMD 的上一代 EPYC Rome 有 1.5 倍的增益,而不是使用比英特尔当前一代 Ice Lake 更大的 2 倍增益。相反,它将英特尔的比较隐藏在 GTC 演示文稿中。jWCednc

有趣的是,Nvidia 尚未分享任何有关 Grace 在单线程工作中的实力的预测,而是更愿意暂时炫耀其纯粹的线程分量。jWCednc

鉴于 AMD 是数据中心的领导者,也许 Nvidia 认为即使击败其上一代芯片也值得骄傲。jWCednc

责编:Demi
  • 微信扫一扫
    一键转发
  • 最前沿的电子设计资讯
    请关注“电子技术设计微信公众号”
  • 东京工业大学要在空中同时传输5G和电力 东京工业大学的研究人员创造了一种同时传输电力和 5G 信号的设备。这款 5G 网络信号收发器采用全无线供电,在大距离和角度下具有高功率转换效率。
  • 一种具有触觉感应能力的仿生弹性机器人皮肤 科学家认为,给社交机器人安装类人体皮肤(或触觉传感器),可以实现安全、直观和接触丰富的人机交互。然而,现有的软触觉传感器存在一些缺点,如结构复杂、可扩展性差、易碎,这限制了它们在机器人全身皮肤上的应用。韩国科学技术高等研究院的一组研究人员与麻省理工学院的一位研究人员和斯图加特大学的另一位研究人员合作,开发了一种具有触觉感应能力的仿生弹性机器人皮肤。
  • 详解比亚迪“海豹”的黑科技dTCS,核心技术还得靠博世? 刚刚过去的粤港澳大湾区车展上,比亚迪展台当属人流量最高的展台之一,其展出的限量版千山翠“汉”,以及海洋系列旗舰车型“海豹”也是大家关注的焦点。相比去年试水八合一电驱总成的海豚,海豹上自然有更多黑科技的东西,比如dTCS和iTAC这两项技术。本文就先聊聊dTCS这项技术。
  • 每秒可对近20亿张图像进行处理分类的“超级芯片” 在测试过程中,该团队制作了一个尺寸为 9.3 mm 2(0.01 in 2)的芯片,并将其用于对一系列类似于字母的手写字符进行分类。在对相关数据集进行训练后,该芯片能够对包含两种字符集的图像进行分类,准确率达到 93.8%,对四种类型的图像进行分类准确率为 89.8%。
  • 2022年面向物联网的热门无线网络——第二部分:非蜂窝方 虽然蜂窝技术(主要是4G和5G)可以满足大多数无线应用的连接需求,但考虑到成本、可用性、隐私和功耗等因素,许多组织都在寻找其他可能性。
  • 国产航电系统迎来突破,100%全自主研制的HKM9000 GPU通 当前国产大飞机的其他部件都可以做到自主可控,只有在航电系统和动力系统方面,还显得不足,需要和国外的厂商进行合作。但是就在近日,国产航电系统也迎来了突破。据中国航空报报道,航空工业计算所翔腾微电子公司自主研发的HKM9000 图形处理器转入适航认证阶段。
  • 非抗辐射MOSFET能用于辐射环境吗? 最近遇到一家客户有点“不切实际”地执意要在辐射暴露的供电应用中,使用并非专为辐射环境而设计的功率MOSFET……
  • 2022年面向物联网的热门无线网络——第一部分 如今,对于大多数需要低功耗以及蜂窝网络的安全性和可用性的大规模物联网应用来说,NB-IoT和LTE-M是首选的解决方案。虽然两者都支持数千个连接的大规模物联网部署,但它们也存在一些差异…
  • 台湾禁止向俄罗斯和白俄罗斯出口超过25MHz的芯片 日前,台湾经济部(MOEA)正式公布了禁止向俄罗斯和白俄罗斯出口的高科技产品清单,该清单禁止台湾生产的各种高科技设备以及用于制造芯片的工具出口到俄罗斯。经济部补充说该名单符合瓦森纳安排的第 3 类至第 9 类,涵盖电子、计算机、电信、传感器、激光、导航设备、海事技术、导航、航空电子设备、喷气发动机和许多其他类别。
  • 华为与中科院合作开发适用于3D-DRAM的CAA晶体管 华为与中科院方面开发了基于铟镓锌氧 IGZO-FET(由 In、Ga、Zn、O 组成的透明氧化物)材料的 CAA(Channel-All-Around)构型晶体管 3D DRAM 技术。该晶体管具有良好的热稳定性和可靠性,有望成为未来超越1-alpha节点的高性能3D-DRAM的候选产品。
  • 西班牙计划投入122.5 亿欧元发展5nm芯片制造 据EDN电子技术设计了解,西班牙政府已表示计划到 2027 年在半导体行业投入 122.5 亿欧元(约合 130 亿美元、约 874.65亿元人民币),以支持国内 5nm 以上和以下的芯片制造。
  • 塑造电源管理设计未来的五大趋势 新工艺、封装和电路设计技术的改进为工程师设计的系统提供了最高水平的效率。随着世界消耗越来越多的电力,我们都需要努力使我们生产的能源走得更远,寿命更长。今天,五个关键领域的一代代不断的改进正在帮助进一步推动电力的发展。
广告
热门推荐
广告
广告
EE直播间
在线研讨会
广告
广告
面包芯语
广告
向右滑动:上一篇 向左滑动:下一篇 我知道了