MLPerf 3.0基准测试结果公布，英伟达H100和L4 GPU性能领跑-EDN 电子技术设计

 据EDN电子技术设计报道，在最新一轮的 MLPerf 测试中，运行于DGX H100系统中的NVIDIA H100 Tensor Core GPU在每个人工智能推论测试中均实现了最高性能。

据EDN电子技术设计报道，在最新一轮的 MLPerf 测试中，运行于DGX H100系统中的NVIDIA H100 Tensor Core GPU在每个人工智能推论测试中均实现了最高性能。TN7ednc

MLCommons每6个月发布新一轮人工智能推理处理基准测试。英伟达及其合作伙伴在MLPerf 3.0中运行并提交了基准测试，包括图像分类、对象检测、推荐、语音识别、NLP（自然语言处理）和3D分割。TN7ednc

这一轮MLPerf的新测试成员分别是致力于边缘图像分类和数据中心的美国机器学习初创公司SiMa.ai和美国AI解决方案提供创企Neuchips。TN7ednc

TN7ednc

英伟达H100 GPU性能提高54%

英伟达H100 Tensor Core GPU在每次AI推理测试中都展现出最高性能。得益于软件优化，该GPU的性能比去年9月份首次亮相时提高了54%。英伟达拥有比硬件工程师更多的软件工程师是有原因的。TN7ednc

在医疗保健领域，H100 GPU自9月以来在医疗成像的MLPerf基准3D-UNet (医学图像分割)上实现了31% 的效能增长。TN7ednc

TN7ednc

凭借其Transformer 引擎，基于Hopper 架构的H100 GPU 在BERT 方面表现优异，BERT 是基于Transformer 的大型语言模型，是现今生成式人工智能获得广泛应用的关键基础。TN7ednc

生成式人工智能能让使用者能够快速创建文本、图像、3D 模型等等，这种能力从新创企业到云服务提供商都在快速采用，以开创新的商业模式并加速现有商业模式的发展。目前数亿人正在使用像ChatGPT 这样的生成式人工智能工具（也是一种Transformer 模型），期望获得即时回应。TN7ednc

在这个人工智能的iPhone 时代，推论的效能至关重要。深度学习现在几乎被应用到各个领域，从工厂到线上推荐系统，对推理效能有着永无止境的需求。TN7ednc

L4 GPU速度出众

NVIDIA L4 Tensor Core GPU在MLPerf 测试中首次亮相，其速度是上一代T4 GPU 的3倍以上。这些加速器采用低调外形封装，其设计旨在为几乎所有伺服器提供高吞吐量和低延迟。TN7ednc

L4 GPU 运行所有MLPerf 工作负载。由于他们支援关键的FP8 格式，他们在效能要求极高的BERT 模型上的结果尤其令人惊叹。TN7ednc

TN7ednc

除了出色的人工智能效能外，L4 GPU 还能提供高达10 倍更快的图像解码速度，高达3.2 倍更快的影片处理速度以及超过4 倍更快的图形和即时渲染效能。TN7ednc

两周前的GTC上即宣布，已可从主要系统制造商和云端服务供应商获得这些加速器。L4 GPU 是NVIDIA 在GTC 推出的最新人工智能推理平台产品组合的最新成员。TN7ednc

在BERT测试中，远端NVIDIA DGX A100系统的表现达到了其最大本地性能的96％，速度变慢的部分原因是它们需要等待CPU 完成某些任务。而在仅由GPU 处理的ResNet-50 电脑视觉测试中，它们达到了100％的最佳表现。这两个结果在很大程度上要归功于NVIDIA Quantum Infiniband网络、NVIDIA ConnectX SmartNIC和NVIDIA GPUDirect等软件。TN7ednc

另外，NVIDIA Jetson AGX Orin 系统模组的能效和性能表现，与前一年的结果相较，分别提高了63% 和81%。Jetson AGX Orin 可在有限空间以低功率水平（包括仅由电池供电的系统）提供人工智能推论。TN7ednc

TN7ednc

对于需要更小模块且功耗更低的应用，Jetson Orin NX 16G 在其首次亮相的基准测试中表现出色。它提供的性能比上一代Jetson Xavier NX 处理器高出多达3.2 倍。TN7ednc

广大的NVIDIA AI生态系

从MLPerf 的测试结果便能看出NVIDIA AI 获得业界最广泛的机器学习生态系支持。TN7ednc

本轮有10 家公司在基于NVIDIA 平台上提交了结果。他们来自Microsoft Azure 云端服务和系统制造商，包括像是由华硕（ASUS）、戴尔科技集团（Dell Technologies）、技嘉（GIGABYTE）、新华三集团（H3C）、联想（Lenovo）、宁畅信息产业（北京）有限公司（Nettrix）、美超微（Supermicro）和超聚变数字技术有限公司（xFusion）。TN7ednc

它们的测试结果显示，无论是在云端或在用户自己的资料中心伺服器上，使用NVIDIA AI 获得绝佳效能。TN7ednc

责编：Demi

阅读全文，请先

产业前沿处理器/DSP 人工智能

上一篇： 这个四足机器人可在各种地形上踢足球 下一篇： 针对高压应用优化宽禁带半导体器件

微信扫一扫
一键转发
最前沿的电子设计资讯
请关注“电子技术设计微信公众号”

匠芯创M7000系列远超传统微秒级芯片，响应速度不到300纳 M7000 系列芯片已在人形机器人、机器人关节、高功率伺服驱动器等多个领域实现落地应用，与众多头部企业展开紧密合作···
ST移动安全解决方案：构建全场景安全连接生态随着移动设备的普及与应用场景的复杂化，移动安全体系正经历关键变革——从早期依赖手机SIM卡的单一安全架构，逐步向融合NFC近场通信、嵌入式安全元件（eSE）及嵌入式SIM卡（eSIM）的多元技术体系演进。
电力电子科学笔记：金属电导率与索末菲模型与Drude-Lorentz模型相比，索末菲模型向前迈出了决定性的一步。
10BASE-T1S：利用下一代以太网引领智能工厂革新在本文中，我们将探讨为什么10BASE-T1S，作为一种单对以太网标准，成为了替代传统以太网和硬连线解决方案用于工业自动化的首选通信协议。
LM317恒流源加电容是好是坏？工程师必看的电流源设计陷如果在地和LM317的ADJ引脚之间增加一个电容，可以减少电源产生的流向负载的纹波电流，同时降低负载的阻抗，那么它到底是一个更好还是更坏的“恒流源”？
5个必备的FPGA设计小贴士在本文中，我们将分享一些有用的技巧，帮助您快速开始设计，避免常见的设计陷阱。通过掌握这些关键技巧，可以确保您在开发工业设备、医疗设备、智能家居设备、自动驾驶汽车和机器人应用时，更顺利、更高效的进行设计流程，最终成功实现FPGA设计···
扔掉复杂触发器！仅用两个反相器实现电源锁存最近有很多有趣的设计实例，将便宜的瞬时触点开关设计用在开/关电源控制电路上···
用PWM编程LM317恒流源：多方案汇总本文显示了一种新的拓扑结构，它采用了一种更灵活的方法使Iout可被编程。
电力电子科学笔记：齐纳二极管和狄拉克脉冲在本文中，我们将研究二极管在狄拉克脉冲反向偏压下的行为，然后再研究齐纳二极管的特殊情况。
基于SRAM的FPGA技术创新：快速安全启动机制深度解析在可编程逻辑器件领域，基于SRAM的FPGA经常被误解···
振动测试如何巩固电子制造的质量保证振动分析并非测试产品质量的唯一方法。然而，它在行业中的应用范围远不止于生产线的末端检测，通过在多个领域实施振动分析，电子企业可以从中获益良多。
车载测试技术解析：聚焦高带宽、多通道同步采集与协议分如何在高速信号捕捉、多通道同步采集以及复杂协议解码之间取得平衡，成为汽车行业的技术人员面临的共同挑战。本文将从测试难点和解决方案角度，探讨解决方案中涉及的关键技术点。

25年第19周新能源周销量：不同价格带的车型走势解析本周插混与增程车型市场呈现出“两极化”趋势：一方面，10-15万元级的主流家用轿车与SUV销量强劲；另一方面，20万元
拆解报告：甲骨文3060W碳化硅服务器电源模块甲骨文服务器电源模块输入输出均为专用接口，采用热拔插设计。电源模块支持200-277V交流和240-380V直流输入，输
评测：森海塞尔ACCENTUM Open真无线耳机半入耳机森海塞尔ACCENTUM Open 真无线耳机采用半入耳式设计，搭配约4.4克的重量，佩戴舒适。耳机充电盒轻盈小巧，携带外
人形机器人如何做到“手眼”协同+“大小脑”协同？人形机器人正站在“走出实验室”的临界点。从本体制造、控制系统、核心零部件到应用场景拓展，技术与产业生态
南非2025年4月：奇瑞和长城汽车快速上升 2025年4月的南非车市增长，马恒达和现代的强劲回归是一个信号，而中国品牌的集体崛起，则预示着未来竞争将更加多
4月新能源车领跑汽车出口增长，中国汽车走向全球的新引擎 2025年开年以来的出口数据呈现出清晰的结构升级路径。新能源产品在出口中扮演的角色日益重要，不再只是锦上添
拆解报告：vivo手机原装90W氮化镓闪充充电器 vivo 90W氮化镓闪充充电器采用经典直板造型设计，同时附带一条专门量身定制的8.5A大电流数据线，配合信号屏蔽层
拆解报告：HONOR荣耀手环10 荣耀手环10在外观方面，延续了上代的轻薄双曲面设计，同时采用全新的双色NCVM镀膜工艺，使之更加的时尚精致。标配
2025年4月中国车企加速渗透土耳其市场：比亚迪Seal U打响突围战 2025年4月，土耳其市场的爆发式增长为全球车企提供了重要信号：新兴市场正在进入电动化转型的加速期，而土耳其作
2025年第19周新能源周销量：问界起势 2025年第19周，中国乘用车市场的周度销量达到44.4万辆，其中新能源车占比突破50%，达22.3万辆，占比50.2%。比亚迪体
2024年4月汽车市场终端数据：自主崛起、新势力分化、合资承压从整体销量数据来看，4 月汽车终端销量达 169.7 万，同比增长 9.3% ，在目前的价格力度下，这个销售数字差强人意。2
拆解报告：华为750W钛金牌服务器电源华为这款服务器电源型号为PAC750S12-TE，支持220V交流或240V直流输入，输出电压为12V，输出电流为62.5A，输出端设有

史密斯英特康推出新一代“ DaVinci Gen V”测试插座史密斯英特康推出新一代“ DaVinci Gen V”测试插座，为人工智能、6G通信及先进计算应用领域的芯片提供超
意法半导体高集成度低边电流测量放大器简化高准确度电流检测意法半导体的 TSC1801低边电流测量放大器集成了设定增益所需的匹配电阻，从而简化了电路设计，节省了物料清单
意法半导体推出创新的、带有可改变存储配置存储器的车规微控制器新推出的Stellar微控制器内置了xMemory技术，它为正在发展的软件定义汽车以及不断进化的电动汽车架构提供了一
新系列串口EEPROM内置唯一ID码，适合设备识别、溯源和可持续性应用意法半导体 (ST) 推出了一系列内置128位唯一只读ID码 (UID) 的串口EEPROM芯片，以满足市场对产品识别、溯
Vishay新添增强短瞬态脉冲防护性能的经AEC-Q200认证的厚膜功率电这些器件采用夹片式TO-247 封装形式，可直接安装在散热器上，具有高达 75 J/0.1 s的高脉冲吸收能力和 150
凉棚集成Nordic 技术实现Matter over Thread连接为家庭和企业 StruXure+ 凉棚和小屋系列集成 Nordic 的 nRF5340 SoC以提供无缝的 Matter over Thread 连接
智能楼宇技术全球领导者与Nordic Semiconductor携手合作确保楼业界连手推动NR+成为智能楼宇的全球连接标准···
Cadence 率先推出 eUSB2V2 IP 解决方案，助力打造高速连接新范 Cadence 在业内率先推出 eUSB2V2 IP，此 IP 基于先进的台积公司 N3P 工艺，符合最新的嵌入式 USB2 版
纳芯微发布双通道电流检测放大器NSCSA285，赋能工业与能源管理近日，上海 —— 纳芯微电子（简称“纳芯微”）发布全新高精度双通道电流检测放大器NSCSA285系列···
攻克PWM高频瞬态干扰难题！纳芯微发布车规级电流检测放大器NSCSA24 近日，纳芯微发布全新车规级双向电流检测放大器NSCSA240-Q1系列，专为汽车高压PWM系统打造解决方案···
TE Connectivity 推出INMORO系列：致力于满足中国市场需求而打造的连接和传感解决方案提供商泰科电子（TE Connectivity，以下简称 TE）工业事业部隆重推出INMORO 系列，致力于满足中
破解汽车与工业等应用新挑战，TDK展示多传感器融合与AI+发展趋势在新能源汽车应用中，热管理系统既要能高效地冷却和加热电池、电机与OBC等车辆核心部件，确保其处于最佳运行温

热门评论
最新评论

换一换

杂志声明

MLPerf 3.0基准测试结果公布，英伟达H100和L4 GPU性能领跑

英伟达H100 GPU性能提高54%

L4 GPU速度出众

广大的NVIDIA AI生态系