广告

英伟达称其144核心超级芯片比英特尔Ice Lake快2倍

2022-04-11 15:01:12 综合报道 阅读:
Nvidia 在3月底的GTC上推出了其新的144核 Grace CPU Superchip,日前外媒在 Nvidia 加速计算业务部门副总裁 Ian Buck 的 GTC 演示中发现了 Grace 与 Intel Ice Lake 的基准。该基准声称,在 HPC 中常用的天气研究和预报 (WRF) 模型中,Grace 比英特尔当前的 Ice Lake 快 2 倍,能效高 2.3 倍。

Nvidia 在3月底的GTC上推出了其新的144核 Grace CPU Superchip,396MB缓存、1TB/s LPDDR5X ECC内存,功耗500W,这是其第一款专为数据中心设计的基于 Arm 架构的 CPU 芯片。GeUednc

英伟达此前称 Grace 在SPECrate_2017 基准测试中快 1.5 倍比两个上一代 64 核 EPYC Rome 7742 处理器,但那毕竟是AMD的上一代产品了,架构还是Zen2,并且它将在 2023 年初到货时提供当今服务器芯片两倍的能效,AMD 已经有了更快的 EPYC Milan 发货。GeUednc

那么Grace CPU Superchip性能究竟如何呢?GeUednc

日前外媒在 Nvidia 加速计算业务部门副总裁 Ian Buck 的 GTC 演示中发现了 Grace 与 Intel Ice Lake 的基准。GeUednc

该基准声称,在 HPC 中常用的天气研究和预报 (WRF) 模型中,Grace 比英特尔当前的 Ice Lake 快 2 倍,能效高 2.3 倍。GeUednc

GeUednc

请记住,此性能测量特定于 Grace CPU 超级芯片:GeUednc

  • 适用于 HPC 和云计算的高性能 CPU
  • 具有多达 144 个 Arm v9 CPU 内核的超级芯片设计
  • 全球首款带 ECC 内存的 LPDDR5x,1TB/s 总带宽
  • SPECrate2017_int_base 超过 740(估计)
  • 900 GB/s 相干接口,比 PCIe Gen 5 快 7 倍
  • 2 倍于基于 DIMM 的解决方案的封装密度
  • 2 倍于当今领先 CPU 的每瓦性能
  • 运行所有 NVIDIA 软件堆栈和平台,包括 RTX、HPC、AI 和 Omniverse

 GeUednc

GeUednc

Nvidia 表示,其对 144 核 Grace 芯片的模拟表明,在 WRF 模拟中,它将比两个 36 核 72 线程英特尔“Ice Lake”至强白金 8360Y 处理器快 2 倍,并提供 2.3 倍的功率效率。这意味着我们看到 144 个 Arm 线程(每个都在一个物理内核上),面对 144 个 x86 线程(每个物理内核两个线程)。GeUednc

WRF 的各种排列是通常用于基准测试的实际工作负载,并且许多模块已被移植用于使用 CUDA 进行 GPU 加速。我们就这个特定的基准与 Nvidia 进行了跟进,该公司表示该模块尚未移植到 GPU,因此它以 CPU 为中心。此外,它对内存带宽非常敏感,这让 Grace 在性能和效率上都有优势。Nvidia 的估计是“基于标准 NCAR WRF,3.9.1.1 版移植到 Arm,用于 IB4 模型(伊比利亚半岛 4 公里区域预测)。”GeUednc

Grace 巨大的内存吞吐量将在性能和能源效率方面带来红利,因为增加的吞吐量通过保持贪婪的核心获得数据来减少非活动周期的数量。与 Ice Lake 的 DDR4 相比,这些芯片还使用了低功耗的 LPDDR5X。GeUednc

然而,与英特尔即将推出的 Sapphire Rapids 相比,Grace 可能没有那么大的优势——这些芯片支持 DDR5 内存,并且还有带有 HBM 内存的变体,可以帮助对抗 Grace 在一些内存带宽匮乏的 应用程序中的优势。AMD 还拥有具有 3D 堆叠 L3 缓存 (3D V-Cache) 的Milan-X,这对一些工作负载有好处,我们预计该公司将为 EPYC Genoa 系列制造类似的 SKU。GeUednc

Nvidia 在 GTC 和其新闻稿中使用的基准测试显示比 AMD 的上一代 EPYC Rome 有 1.5 倍的增益,而不是使用比英特尔当前一代 Ice Lake 更大的 2 倍增益。相反,它将英特尔的比较隐藏在 GTC 演示文稿中。GeUednc

有趣的是,Nvidia 尚未分享任何有关 Grace 在单线程工作中的实力的预测,而是更愿意暂时炫耀其纯粹的线程分量。GeUednc

鉴于 AMD 是数据中心的领导者,也许 Nvidia 认为即使击败其上一代芯片也值得骄傲。GeUednc

责编:Demi
  • 微信扫一扫
    一键转发
  • 最前沿的电子设计资讯
    请关注“电子技术设计微信公众号”
  • 深圳允许完全自动驾驶车辆上路,主驾无需坐人 据EDN电子技术设计引援央视财经报道,从8月1日开始,《深圳经济特区智能网联汽车管理条例》正式实施,智能网联汽车列入国家汽车产品目录或者深圳市智能网联汽车产品目录,这也让深圳成为了国内首个允许L3级别自动驾驶车辆合法上路的城市。
  • 理想ONE高速起火烧成光架,其1.2T三缸增程器曾被指隐藏 近期,网络平台上发布了一段理想ONE在行驶过程中,车辆出现起火的视频内容。现场拍摄的灭火后图片显示,该轿车过火后仅剩骨架,车辆前部增程器位置受损严重,车辆尾门已经在过火后从车身主体脱落。此前,曾有国内汽车媒体对一台行驶了10万公里的理想ONE的东安1.2T三缸增程发动机进行拆解,被指隐藏暗病。
  • 上海微系统所使用石墨烯纳米带研制出世界上最小尺寸的 非易失性相变随机存取存储器(PCRAM)被认为是大数据时代新兴海量存储的有希望的候选者之一。然而,相对较高的编程能量阻碍了 PCRAM 中功耗的进一步降低。利用石墨烯的窄边接触可以有效降低每个电池中相变材料的活性体积,从而实现低功耗运行。
  • 可解决工业自动化和IIoT挑战的MCU 工业自动化和工业物联网(IIoT)设计人员的性能要求不断变化。就MCU而言,他们希望获得更快的处理速度、更多的内存、更好的连接性和更多的安全功能。
  • 我国建成开通5G基站数达185.4万个 工信部近日透露,截至2022年6月底,中国5G基站数达到185.4万个,其中二季度新增基站近30万个,已建成全球规模最大、技术领先的网络基础设施,实现“县县通5G、村村通宽带”。。
  • 第三代半导体——碳化硅材料之制程与分析 SiC功率电子是加速电动车时代到来的主要动能。以SiC MOSFET取代目前的Si IGBT,不仅能使电力移转时的能源损耗降低80%以上,同时也可让芯片模块尺寸微缩至原本的1/10,达到延长电动车续航里程及缩短充电时间的功效。
  • 开源软件真的可靠吗? 乍看之下,采用开源软件似乎是个不错的办法,但归根究底,开源软件有几个特性可能会使其变得“邪恶”...
  • GaN是否可靠? GaN产业已经建立一套方法来保证GaN产品的可靠性,因此问题并不在于“GaN是否可靠?”,而是“如何验证GaN的可靠性?”
  • 国际象棋机器人Chessrobot夹断对手手指,意外还是设计缺 据悉,在7月19日的莫斯科国际象棋公开赛期间,一位7岁小男孩疑似因提前走子犯规手,意外被“对手”国际象棋机器人Chessrobot夹住手指,造成指骨骨折,该事件登上了热搜榜。该男孩是莫斯科9岁以下最强的30位棋手之一。
  • MIT研究人员发现了一种性能比硅更好的半导体材料 硅是地球上最丰富的元素之一,其纯净形式已成为许多现代技术的基础,从太阳能电池到计算机芯片,但硅作为半导体的特性远非理想。现在,来自 MIT、休斯顿大学和其他机构的一组研究人员发现了一种称为立方砷化硼的材料,这种材料可以克服硅的上述两个限制。其为电子和电洞提供了高迁移率,并具有优良的热导率。研究人员表示,这是迄今为止发现最好的半导体材料,在将来也可能说是最好的材料。
  • 增强型GaN HEMT的漏极电流特性 增强型GaN基高电子迁移率晶体管(HEMT)已经采用两种不同的结构开发出来。这两种增强型结构是金属-绝缘层-半导体(MIS)结构和栅极注入晶体管(GIT)结构。MIS结构具有受电压驱动的小栅极漏电流,而GIT则具有脊形结构和高阈值电压。两者也都有一些缺点。MIS对栅极干扰的可靠性较低,阈值电压较低,而GIT的栅极开关速度较慢,栅极漏电流较大。
  • M2 Pro 和 M2 Max 或是苹果首款采用台积电3nm 工艺的 M1 Pro 和 M1 Max 最多可配置 10 核 CPU 和 32 核 GPU。借助 M2 Pro 和 M2 Max,Apple 有望突破这一门槛,为这两个领域带来更多的核心数量。目前M2 Pro相关的爆料很少,但据称M2 Max 有12 核 GPU 和 38 核 GPU。12 核 CPU 将包括 10 个性能核心和两个能效核心。
广告
热门推荐
广告
广告
EE直播间
在线研讨会
广告
广告
面包芯语
广告
向右滑动:上一篇 向左滑动:下一篇 我知道了