ChatGPT背后：微软耗资数亿美元，用数万英伟达A100打造的超级计算机-EDN 电子技术设计

 EDN曾报道OpenAI的ChatGPT最终将需要超过3万块Nvidia显卡的算力以维持运行。近日，这一分析得到了微软方面的验证。

在EDN电子技术设计此前的报道中提到，TrendForce估计OpenAI的ChatGPT最终将需要超过3万块Nvidia显卡的算力以维持运行。nCqednc

近日，这一分析得到了微软方面的验证。nCqednc

周一，微软在官博上连发两文，亲自解密这台超级昂贵的超级计算机，以及Azure的重磅升级——加入成千上万张英伟达最强的H100显卡以及更快的InfiniBand网络互连技术。nCqednc

nCqednc

微软指出，建造大型超级计算机能够允许 OpenAI 和其他依赖 Azure 的公司训练更大、更复杂的AI模型，并加速推出生成式AI应用。负责云计算和AI业务的微软副总裁Scott Guthrie表示，该公司在这个项目上花费了数亿美元。虽然这对于微软来说只是九牛一毛，但这无疑表明该公司对人工智能领域的热情，并愿意在该领域投入更多的资金。nCqednc

该超级计算机使用数千个 NVIDIA A100 GPU 和 InfiniBand 网络来训练 ChatGPT

在第一篇博文中，微软揭示了 OpenAI 的 ChatGPT 背后的 NVIDIA 超级计算技术的强大功能。nCqednc

微软推出了 ND H100 v5 虚拟机，它支持按需大小不等的 8 到数千个 NVIDIA H100 GPU，这些 GPU 通过 NVIDIA Quantum-2 InfiniBand 网络互连。与我们上一代 ND A100 v4 VM 相比，客户将看到人工智能模型的性能显着提高，这些创新技术包括：nCqednc

8个NVIDIA H100 Tensor Core GPU通过下一代NVSwitch和NVLink 4.0互联
每个GPU有400 Gb/s的NVIDIA Quantum-2 CX7 InfiniBand，每个虚拟机有3.2Tb/s的无阻塞胖树型网络
NVSwitch和NVLink 4.0在每个虚拟机的8个本地GPU之间具有3.6TB/s的双向带宽
第四代英特尔至强可扩展处理器
PCIE Gen5到GPU互连，每个GPU有64GB/s带宽
16通道4800MHz DDR5 DIMM

Azure HPC+AI 首席产品经理 Matt Vegas表示，对于 Microsoft 和 Inflection、NVIDIA 和 OpenAI 等致力于大规模部署的组织，此产品将启用一类新的大规模 AI 模型。nCqednc

“NVIDIA 和 Microsoft Azure 通过多代产品合作，为全球企业带来领先的 AI 创新。“NVIDIA 超大规模和高性能计算副总裁 Ian Buck 表示，NDv5 H100 虚拟机将有助于推动生成人工智能应用程序和服务的新时代。nCqednc

NVIDIA 表示，ND H100 v5 现已提供预览版，并将成为 Azure 产品组合中的标准产品，让任何人都能在云中释放 AI at Scale 的潜力。nCqednc

nCqednc

采用 NVIDIA 的新 H100 GPU 和 Quantum-2 InfiniBand 网络来加速生成 AI

在第二篇博文中，微软宣布推出集成最新 NVIDIA H100 Tensor Core GPU 和 NVIDIA Quantum-2 InfiniBand 网络的新虚拟机。nCqednc

虚拟机是 Microsoft 向客户提供基础设施的方式，可以根据任何 AI 任务的规模进行扩展。Azure 的新 ND H100 v5 虚拟机为 AI 开发人员提供了卓越的性能和跨数千个 GPU 的扩展。nCqednc

该基础设施包括数以千计的 NVIDIA AI 优化 GPU，这些 GPU 在基于 NVIDIA Quantum InfiniBand 通信的高吞吐量、低延迟网络中连接在一起，用于高性能计算。nCqednc

"微软Azure高性能计算和人工智能产品负责人Nidhi Chappell说："肯定有一个强大的推动力，让更大的模型训练更长的时间，这意味着你不仅需要拥有最大的基础设施，你必须能够长期可靠地运行它。nCqednc

数亿投资，上万颗芯片支撑的算力

2019 年，当微软向 ChatGPT 开发商 OpenAI 投资 10 亿美元时，它同意为这家人工智能研究创业公司打造一台庞大的尖端超级计算机。唯一的问题是：微软没有 OpenAI 需要的那样的东西，也无法完全确定它能在 Azure 云服务中构建这么大的东西而不会破坏它。nCqednc

当时，OpenAI 正试图训练一套规模越来越大的人工智能程序，也就是“模型”，后者正在吸收越来越大的数据量，学习越来越多的参数。这些参数是人工智能系统通过训练和再训练得出的变量。这意味着，OpenAI 需要在很长一段时间内使用强大的云计算服务。nCqednc

“我们从研究中学到的一件事是，模型越大，拥有的数据越多，训练时间越长，模型的准确性就越好，”微软 Azure high 产品负责人 Nidhi Chappell 说。“因此，肯定有强烈的推动力让更大的模型接受更长时间的训练，这意味着你不仅需要拥有最大的基础设施，还必须能够长时间可靠地运行它。 ”nCqednc

为了应对这一挑战，微软必须想方设法将数以万计的 Nvidia A100 图形芯片（用于训练 AI 模型的主力）串在一起，并改变其在机架上放置服务器以防止断电的方式。nCqednc

负责云计算和人工智能的微软执行副总裁斯科特·格思里 (Scott Guthrie) 表示该项目成本“可能大于”数亿美元。nCqednc

“我们构建了一个可以在非常大的范围内运行并且可靠的系统架构。这就是导致 ChatGPT 成为可能的原因，”Microsoft Azure AI 基础设施总经理 Nidhi Chappell 说。“这是从中得出的一个模型。还会有很多很多其他人。”nCqednc

ChatGPT 靠的是超级计算机训练

OpenAI 总裁兼联合创始人 Greg Brockman 表示：“与 Azure 共同设计超级计算机对于扩展我们苛刻的 AI 培训需求、使我们在 ChatGPT 等系统上的研究和调整工作成为可能至关重要。”nCqednc

为了训练一个大型语言模型，计算工作量被分配到一个集群中的数千个 GPU 上。在此计算的某些阶段（称为 allreduce），GPU 会交换有关它们已完成工作的信息。InfiniBand 网络加速了这一阶段，该阶段必须在 GPU 开始下一个计算块之前完成。nCqednc

“因为这些工作涉及数千个 GPU，所以你需要确保拥有可靠的基础设施，然后你需要在后端拥有网络，这样你才能更快地沟通，并能够连续几周这样做，”Chappell 说。“这不是你只需购买一大堆 GPU，将它们连接在一起就可以开始协同工作的东西。为了获得最佳性能，需要进行大量系统级优化，这需要几代人积累的丰富经验。”nCqednc

系统级优化包括能够有效利用 GPU 和网络设备的软件。在过去几年中，Microsoft 开发的软件技术提高了使用数万亿参数训练模型的能力，同时降低了在生产中训练和服务它们的资源需求和时间。nCqednc

微软及其合作伙伴也一直在逐步增加 GPU 集群的容量，发展 InfiniBand 网络。nCqednc

微软 AI 平台公司副总裁 Eric Boyd 表示，如今，这种针对大型语言模型训练优化的 Azure 基础设施可通过云中的 Azure AI 超级计算功能获得。该资源提供了 GPU、网络硬件和虚拟化软件的组合，以提供为下一波 AI 创新提供动力所需的计算。nCqednc

据称，针对 AI 优化的基础架构现在已成为整个 Azure 云计算结构的标准配置，其中包括针对 AI 工作负载优化的虚拟机组合、连接的计算和存储资源。nCqednc

微软云和人工智能集团执行副总裁 Scott Guthrie 表示，构建这种基础设施释放了 OpenAI 的 ChatGPT 和新的 Microsoft Bing 等产品中的人工智能功能。nCqednc

参考链接：nCqednc

Azure previews powerful and scalable virtual machine series to accelerate generative AInCqednc

How Microsoft’s bet on Azure unlocked an AI revolutionnCqednc

责编：Demi

阅读全文，请先

夏菲

Aspencore助理产业分析师，专注行业市场前沿及技术发展趋势。

进入专栏

产业前沿处理器/DSP 人工智能

上一篇： iPhone 15将用USB-C口充电，还会不会受到MFi认证限制？ 下一篇： 国产SSD主控芯片发布，让存算一体与可信计算兼得

微信扫一扫
一键转发
最前沿的电子设计资讯
请关注“电子技术设计微信公众号”

匠芯创M7000系列远超传统微秒级芯片，响应速度不到300纳 M7000 系列芯片已在人形机器人、机器人关节、高功率伺服驱动器等多个领域实现落地应用，与众多头部企业展开紧密合作···
ST移动安全解决方案：构建全场景安全连接生态随着移动设备的普及与应用场景的复杂化，移动安全体系正经历关键变革——从早期依赖手机SIM卡的单一安全架构，逐步向融合NFC近场通信、嵌入式安全元件（eSE）及嵌入式SIM卡（eSIM）的多元技术体系演进。
电力电子科学笔记：金属电导率与索末菲模型与Drude-Lorentz模型相比，索末菲模型向前迈出了决定性的一步。
10BASE-T1S：利用下一代以太网引领智能工厂革新在本文中，我们将探讨为什么10BASE-T1S，作为一种单对以太网标准，成为了替代传统以太网和硬连线解决方案用于工业自动化的首选通信协议。
LM317恒流源加电容是好是坏？工程师必看的电流源设计陷如果在地和LM317的ADJ引脚之间增加一个电容，可以减少电源产生的流向负载的纹波电流，同时降低负载的阻抗，那么它到底是一个更好还是更坏的“恒流源”？
5个必备的FPGA设计小贴士在本文中，我们将分享一些有用的技巧，帮助您快速开始设计，避免常见的设计陷阱。通过掌握这些关键技巧，可以确保您在开发工业设备、医疗设备、智能家居设备、自动驾驶汽车和机器人应用时，更顺利、更高效的进行设计流程，最终成功实现FPGA设计···
扔掉复杂触发器！仅用两个反相器实现电源锁存最近有很多有趣的设计实例，将便宜的瞬时触点开关设计用在开/关电源控制电路上···
用PWM编程LM317恒流源：多方案汇总本文显示了一种新的拓扑结构，它采用了一种更灵活的方法使Iout可被编程。
电力电子科学笔记：齐纳二极管和狄拉克脉冲在本文中，我们将研究二极管在狄拉克脉冲反向偏压下的行为，然后再研究齐纳二极管的特殊情况。
基于SRAM的FPGA技术创新：快速安全启动机制深度解析在可编程逻辑器件领域，基于SRAM的FPGA经常被误解···
振动测试如何巩固电子制造的质量保证振动分析并非测试产品质量的唯一方法。然而，它在行业中的应用范围远不止于生产线的末端检测，通过在多个领域实施振动分析，电子企业可以从中获益良多。
车载测试技术解析：聚焦高带宽、多通道同步采集与协议分如何在高速信号捕捉、多通道同步采集以及复杂协议解码之间取得平衡，成为汽车行业的技术人员面临的共同挑战。本文将从测试难点和解决方案角度，探讨解决方案中涉及的关键技术点。

25年第19周新能源周销量：不同价格带的车型走势解析本周插混与增程车型市场呈现出“两极化”趋势：一方面，10-15万元级的主流家用轿车与SUV销量强劲；另一方面，20万元
拆解报告：甲骨文3060W碳化硅服务器电源模块甲骨文服务器电源模块输入输出均为专用接口，采用热拔插设计。电源模块支持200-277V交流和240-380V直流输入，输
评测：森海塞尔ACCENTUM Open真无线耳机半入耳机森海塞尔ACCENTUM Open 真无线耳机采用半入耳式设计，搭配约4.4克的重量，佩戴舒适。耳机充电盒轻盈小巧，携带外
人形机器人如何做到“手眼”协同+“大小脑”协同？人形机器人正站在“走出实验室”的临界点。从本体制造、控制系统、核心零部件到应用场景拓展，技术与产业生态
南非2025年4月：奇瑞和长城汽车快速上升 2025年4月的南非车市增长，马恒达和现代的强劲回归是一个信号，而中国品牌的集体崛起，则预示着未来竞争将更加多
4月新能源车领跑汽车出口增长，中国汽车走向全球的新引擎 2025年开年以来的出口数据呈现出清晰的结构升级路径。新能源产品在出口中扮演的角色日益重要，不再只是锦上添
拆解报告：vivo手机原装90W氮化镓闪充充电器 vivo 90W氮化镓闪充充电器采用经典直板造型设计，同时附带一条专门量身定制的8.5A大电流数据线，配合信号屏蔽层
拆解报告：HONOR荣耀手环10 荣耀手环10在外观方面，延续了上代的轻薄双曲面设计，同时采用全新的双色NCVM镀膜工艺，使之更加的时尚精致。标配
2025年4月中国车企加速渗透土耳其市场：比亚迪Seal U打响突围战 2025年4月，土耳其市场的爆发式增长为全球车企提供了重要信号：新兴市场正在进入电动化转型的加速期，而土耳其作
2025年第19周新能源周销量：问界起势 2025年第19周，中国乘用车市场的周度销量达到44.4万辆，其中新能源车占比突破50%，达22.3万辆，占比50.2%。比亚迪体
2024年4月汽车市场终端数据：自主崛起、新势力分化、合资承压从整体销量数据来看，4 月汽车终端销量达 169.7 万，同比增长 9.3% ，在目前的价格力度下，这个销售数字差强人意。2
拆解报告：华为750W钛金牌服务器电源华为这款服务器电源型号为PAC750S12-TE，支持220V交流或240V直流输入，输出电压为12V，输出电流为62.5A，输出端设有

史密斯英特康推出新一代“ DaVinci Gen V”测试插座史密斯英特康推出新一代“ DaVinci Gen V”测试插座，为人工智能、6G通信及先进计算应用领域的芯片提供超
意法半导体高集成度低边电流测量放大器简化高准确度电流检测意法半导体的 TSC1801低边电流测量放大器集成了设定增益所需的匹配电阻，从而简化了电路设计，节省了物料清单
意法半导体推出创新的、带有可改变存储配置存储器的车规微控制器新推出的Stellar微控制器内置了xMemory技术，它为正在发展的软件定义汽车以及不断进化的电动汽车架构提供了一
新系列串口EEPROM内置唯一ID码，适合设备识别、溯源和可持续性应用意法半导体 (ST) 推出了一系列内置128位唯一只读ID码 (UID) 的串口EEPROM芯片，以满足市场对产品识别、溯
Vishay新添增强短瞬态脉冲防护性能的经AEC-Q200认证的厚膜功率电这些器件采用夹片式TO-247 封装形式，可直接安装在散热器上，具有高达 75 J/0.1 s的高脉冲吸收能力和 150
凉棚集成Nordic 技术实现Matter over Thread连接为家庭和企业 StruXure+ 凉棚和小屋系列集成 Nordic 的 nRF5340 SoC以提供无缝的 Matter over Thread 连接
智能楼宇技术全球领导者与Nordic Semiconductor携手合作确保楼业界连手推动NR+成为智能楼宇的全球连接标准···
Cadence 率先推出 eUSB2V2 IP 解决方案，助力打造高速连接新范 Cadence 在业内率先推出 eUSB2V2 IP，此 IP 基于先进的台积公司 N3P 工艺，符合最新的嵌入式 USB2 版
纳芯微发布双通道电流检测放大器NSCSA285，赋能工业与能源管理近日，上海 —— 纳芯微电子（简称“纳芯微”）发布全新高精度双通道电流检测放大器NSCSA285系列···
攻克PWM高频瞬态干扰难题！纳芯微发布车规级电流检测放大器NSCSA24 近日，纳芯微发布全新车规级双向电流检测放大器NSCSA240-Q1系列，专为汽车高压PWM系统打造解决方案···
TE Connectivity 推出INMORO系列：致力于满足中国市场需求而打造的连接和传感解决方案提供商泰科电子（TE Connectivity，以下简称 TE）工业事业部隆重推出INMORO 系列，致力于满足中
破解汽车与工业等应用新挑战，TDK展示多传感器融合与AI+发展趋势在新能源汽车应用中，热管理系统既要能高效地冷却和加热电池、电机与OBC等车辆核心部件，确保其处于最佳运行温

热门评论
最新评论

换一换

杂志声明

ChatGPT背后：微软耗资数亿美元，用数万英伟达A100打造的超级计算机

该超级计算机使用数千个 NVIDIA A100 GPU 和 InfiniBand 网络来训练 ChatGPT

采用 NVIDIA 的新 H100 GPU 和 Quantum-2 InfiniBand 网络来加速生成 AI

数亿投资，上万颗芯片支撑的算力

ChatGPT 靠的是超级计算机训练