广告

MLPerf 3.0基准测试结果公布,英伟达H100和L4 GPU性能领跑

2023-04-07 11:16:55 综合报道 阅读:
据EDN电子技术设计报道,在最新一轮的 MLPerf 测试中,运行于DGX H100系统中的NVIDIA H100 Tensor Core GPU在每个人工智能推论测试中均实现了最高性能。

据EDN电子技术设计报道,在最新一轮的 MLPerf 测试中,运行于DGX H100系统中的NVIDIA H100 Tensor Core GPU在每个人工智能推论测试中均实现了最高性能。xYVednc

MLCommons每6个月发布新一轮人工智能推理处理基准测试。英伟达及其合作伙伴在MLPerf 3.0中运行并提交了基准测试,包括图像分类、对象检测、推荐、语音识别、NLP(自然语言处理)和3D分割。xYVednc

这一轮MLPerf的新测试成员分别是致力于边缘图像分类和数据中心的美国机器学习初创公司SiMa.ai和美国AI解决方案提供创企Neuchips。xYVednc

xYVednc

英伟达H100 GPU性能提高54%

英伟达H100 Tensor Core GPU在每次AI推理测试中都展现出最高性能。得益于软件优化,该GPU的性能比去年9月份首次亮相时提高了54%。英伟达拥有比硬件工程师更多的软件工程师是有原因的。xYVednc

在医疗保健领域,H100 GPU自9月以来在医疗成像的MLPerf基准3D-UNet (医学图像分割)上实现了31% 的效能增长。xYVednc

xYVednc

凭借其Transformer 引擎,基于Hopper 架构的H100 GPU 在BERT 方面表现优异,BERT 是基于Transformer 的大型语言模型,是现今生成式人工智能获得广泛应用的关键基础。xYVednc

生成式人工智能能让使用者能够快速创建文本、图像、3D 模型等等,这种能力从新创企业到云服务提供商都在快速采用,以开创新的商业模式并加速现有商业模式的发展。目前数亿人正在使用像ChatGPT 这样的生成式人工智能工具(也是一种Transformer 模型),期望获得即时回应。xYVednc

在这个人工智能的iPhone 时代,推论的效能至关重要。深度学习现在几乎被应用到各个领域,从工厂到线上推荐系统,对推理效能有着永无止境的需求。xYVednc

L4 GPU速度出众

NVIDIA L4 Tensor Core GPU在MLPerf 测试中首次亮相,其速度是上一代T4 GPU 的3倍以上。这些加速器采用低调外形封装,其设计旨在为几乎所有伺服器提供高吞吐量和低延迟。xYVednc

L4 GPU 运行所有MLPerf 工作负载。由于他们支援关键的FP8 格式,他们在效能要求极高的BERT 模型上的结果尤其令人惊叹。xYVednc

xYVednc

除了出色的人工智能效能外,L4 GPU 还能提供高达10 倍更快的图像解码速度,高达3.2 倍更快的影片处理速度以及超过4 倍更快的图形和即时渲染效能。xYVednc

两周前的GTC上即宣布,已可从主要系统制造商和云端服务供应商获得这些加速器。L4 GPU 是NVIDIA 在GTC 推出的最新人工智能推理平台产品组合的最新成员。xYVednc

在BERT测试中,远端NVIDIA DGX A100系统的表现达到了其最大本地性能的96%,速度变慢的部分原因是它们需要等待CPU 完成某些任务。而在仅由GPU 处理的ResNet-50 电脑视觉测试中,它们达到了100% 的最佳表现。这两个结果在很大程度上要归功于NVIDIA Quantum Infiniband网络、NVIDIA ConnectX SmartNIC和NVIDIA GPUDirect等软件。xYVednc

另外,NVIDIA Jetson AGX Orin 系统模组的能效和性能表现,与前一年的结果相较,分别提高了63% 和81%。Jetson AGX Orin 可在有限空间以低功率水平(包括仅由电池供电的系统)提供人工智能推论。xYVednc

xYVednc

对于需要更小模块且功耗更低的应用,Jetson Orin NX 16G 在其首次亮相的基准测试中表现出色。它提供的性能比上一代Jetson Xavier NX 处理器高出多达3.2 倍。xYVednc

广大的NVIDIA AI生态系

从MLPerf 的测试结果便能看出NVIDIA AI 获得业界最广泛的机器学习生态系支持。xYVednc

本轮有10 家公司在基于NVIDIA 平台上提交了结果。他们来自Microsoft Azure 云端服务和系统制造商,包括像是由华硕(ASUS)、戴尔科技集团(Dell Technologies)、技嘉(GIGABYTE)、新华三集团(H3C)、联想(Lenovo)、宁畅信息产业(北京)有限公司(Nettrix)、美超微(Supermicro)和超聚变数字技术有限公司(xFusion)。xYVednc

它们的测试结果显示,无论是在云端或在用户自己的资料中心伺服器上,使用NVIDIA AI 获得绝佳效能。xYVednc

责编:Demi
  • 微信扫一扫
    一键转发
  • 最前沿的电子设计资讯
    请关注“电子技术设计微信公众号”
  • 用水泥和炭黑制造储能超级电容器 一项新的研究表明,人类最普遍的两种历史材料,水泥和炭黑(类似于非常细的木炭),可能会成为新型低成本储能系统的基础。该技术可以在可再生能源供应出现波动的情况下使能源网络保持稳定,从而促进太阳能、风能和潮汐能等可再生能源的使用。
  • 一种用于电路板回收的新基材:遇水能溶 英国的Jiva Materials公司开发了一种新型的PCB基材Soluboard,这种基材是由天然纤维包裹在一种无卤的聚合物中制成的,与行业内经常使用的FR-4基材不同,这种材料只要在90摄氏度左右的热水中浸泡30分钟,就可以分层溶解···
  • 美国公司声称发现室温超导材料,被授予了高于室温的第二 位于美国佛罗伦萨州的Taj Quantum的公司在社交媒体宣布,被授予了高于室温的第二类超导体专利。据称,这种独特的 II 型超导体(专利号:17249094)可在较宽的温度范围内工作,包括远高于室温的温度,从约 -100° F (-73° C) 到约 302° F (150° C) - 这是一种特性这在超导体世界中并不常见。
  • 俄罗斯“贝加尔湖”基准测试对比英特尔和华为芯片,惨败 俄罗斯服务器处理器 Baikal-S 的开发人员将其性能与美国和中国的同类芯片进行了比较。涉及六个流行指标。
  • 麻省理工发现新型量子磁铁释放电子潜力 研究人员发现了如何控制异常霍尔效应和贝里曲率来制造用于计算机、机器人和传感器的柔性量子磁体。
  • 电池能用三十年?美国Ener Venue称推出革命性电池技术 三元锂离子电池的理论寿命约为800次循环,磷酸铁锂约为2000次,而钛酸锂据说可以达到1万次循环,也就是说常规普通人使用的锂离子电池每天完全充放电三次,最多也就能用上几年的时间。虽然相较于铅酸电池200-300次的循环寿命来说,这已经是很大幅度的提升了,但现在有一家公司宣称他们的电池可以充放电30000次,每天充放电三次,能用30年。
  • 测试中比友商温度低14度,一加天工散热系统怎么做到的? 7月27日,一加在2023年ChinaJoy上发布了全球首创的散热技术,即航天级三维立体散热系统“天工散热系统”,这是一加的又一次新的尝试,让我们一起来了解一下。
  • 万物电气化:探索绿色未来之路 在本文中,我们将重点介绍美国年度脱碳展望(ADP)2022报告中的一些重要发现。本报告着眼于实现净零经济的各种情景。我们在本文中重点关注的方法称为“中心情景”,它遵循到2050年实现净零排放的时间表。
  • 韩国造世界首个室温超导体,闹剧还是新的未来? 7月22日,韩国的一个科研团队在预印本网站arXiv平台上上传了两篇论文,声称发现了世界上首个常压室温超导体,这种材料是一种改性铅磷灰石名为LK-99,超导临界温度在127摄氏度,即400K以上,而且在常压下就具备超导性。
  • 下一个医疗前沿:网联可穿戴设备 医疗和消费级可穿戴设备将继续增强连接性和电池寿命,以实现对血压、体温和身体水分等多种生物标志物的实时和非侵入性监测。
  • 瑞能半导体全球首座模块工厂在上海湾区高新区正式投入 瑞能微恩半导体暨瑞能金山模块厂开业典礼在上海湾区高新区隆重举行,标志着瑞能全球首座模块工厂正式投入运营,将主要生产应用于消费、通讯、新能源以及汽车相关的各类型功率模块产品,串联客户和生态圈,积极推动行业高质量发展。
  • TI无线MCU创新方案,助力用户加速拥抱物联网 7月21日,由AspenCore主办的“2023全球MCU生态发展大会”在深圳罗湖君悦酒店隆重举行,特邀请到MCU领域的领军企业之一德州仪器(TI)参加了“无线MCU分论坛”,论坛上,TI无线产品工程师魏天华分享了主题为“创新型无线解决方案,助力不断发展的互联世界”的演讲,为现场观众带来了TI最新的无线MCU系列,以及对于这一市场的深刻思考。
广告
热门推荐
广告
广告
EE直播间
在线研讨会
广告
广告
面包芯语
广告
向右滑动:上一篇 向左滑动:下一篇 我知道了