PCIe结构和RAID如何在GPUDirect存储中释放全部潜能-EDN 电子技术设计

 随着更快的图形处理单元（GPU）能够提供明显更高的计算能力，存储设备和GPU存储器之间的数据路径瓶颈已经无法实现最佳应用性能。

随着更快的图形处理单元（GPU）能够提供明显更高的计算能力，存储设备和GPU存储器之间的数据路径瓶颈已经无法实现最佳应用性能。NVIDIA的Magnum IO GPUDirect存储解决方案通过在存储设备和GPU存储器之间实现直接路径，可以极大地帮助解决该问题。然而，同等重要的是要使用容错系统来优化其已经非常出色的能力，从而确保在发生灾难性故障时备份关键数据。该解决方案通过PCIe^®结构连接逻辑RAID卷，在PCIe 4.0规范下，这可以将数据速率提高到26 GB/s。为了解如何实现这些优势，首先需要检查该解决方案的关键组件及其如何协同工作来提供结果。VzRednc

Magnum IO GPUDirect存储

Magnum IO GPUDirect存储解决方案的关键优势是其能够消除主要性能瓶颈之一，方法是不使用CPU中的系统存储器将数据从存储设备加载到GPU中进行处理。通常将数据移动到主机存储器并传送到GPU，这依赖于CPU系统存储器中的回弹缓冲区，在数据传送到GPU之前，会在其中创建数据的多个副本。但是，通过这种路径移动大量数据会产生延迟时间，降低GPU性能，并在主机中占用许多CPU周期。借助Magnum IO GPUDirect存储解决方案，无需访问CPU并避免了回弹缓冲区效率低下（图1 ）。VzRednc

VzRednc

图1.Magnum IO GPUDirect存储解决方案无需访问CPU，避免了从数据路径回弹缓冲VzRednc

性能直接随着传送数据量的增加而提高，传送数据量则随着人工智能（AI）、机器学习（ML）、深度学习（DL）和其他数据密集型应用所需的大型分布式数据集呈指数级增长。当数据在本地存储或远程存储时，可以实现这些优势，从而允许以比CPU存储器中的页面缓存更快的速度访问数拍字节的远程存储。 VzRednc

优化RAID性能

该解决方案中的下一个元素是包括RAID功能，用于保持数据冗余和容错能力。虽然软件RAID可以提供数据冗余，但底层软件RAID引擎仍然使用精简指令集计算机（RISC）架构进行操作，例如奇偶校验计算。当比较高级RAID级别（例如RAID 5和RAID 6）的写I/O延迟时间时，硬件RAID仍然比软件RAID快得多，因为提供了专用处理器来执行这些操作和回写高速缓存。在流传输应用中，软件RIAD的长期RIAD响应时间会导致数据堆积在高速缓存中。硬件RAID解决方案不存在缓存数据堆积问题，并且具有专门的备用电池，可以防止出现灾难性系统掉电时数据丢失的情况。VzRednc

标准硬件RAID虽然减轻了主机的奇偶校验管理负担，但大量数据仍需经过RAID控制器才能发送到NVMe^®驱动器，导致数据路径更加复杂。针对此问题的解决方案是NVMe优化的硬件RAID，该解决方案提供了简化的数据路径，无需经过固件或RAID片上控制器即可传送数据。它还允许维护基于硬件的保护和加密服务。VzRednc

混合PCIe结构

PCIe Gen 4现在是存储子系统内的基本系统互连接口，但标准PCIe交换网具有与前几代相同的基于树的基本层级。这意味着，主机间通信需要非透明桥接（NTB）来实现跨分区通信，这使其变得复杂，特别是在多主机多交换网配置中。Microchip的PAX PCIe高级结构交换网等解决方案能够克服这些限制，因为它们支持冗余路径和循环，而这是使用传统PCIe无法实现的。VzRednc

结构交换网具有两个独立的域，主机虚拟域（专用于每个物理主机）和结构域（包含所有端点和结构链路）。来自主机域的事务会在结构域中转换为ID和地址，反之，结构域中通信的非分层路由也是如此。这样，系统中的所有主机便可共享连接到交换网和端点的结构链路。VzRednc

在嵌入式CPU上运行的结构固件通过可配置的下行端口数虚拟化符合PCIe标准的交换网。因此，交换网将始终显示为具有直连端点的标准单层PCIe设备，而与这些端点在结构中的位置无关。由于结构交换网会拦截来自主机的所有配置平面通信（包括PCIe枚举过程）并选择最佳路径，因此它可以实现这一点。这样，GPU等端点便可绑定到域中的任何主机（图2）。VzRednc

VzRednc

图2.交换网固件虚拟化的主机域显示为每个主机符合PCIe标准的单层交换网VzRednc

在以下示例（图3 ）中，我们给出了双主机PCIe结构引擎设置。此处，我们可以看到，结构虚拟化允许每个主机看到一个透明PCIe拓扑，其中包含一个上行端口、三个下行端口和三个连接到它们的端点，并且主机可以正确枚举它们。图3中的有趣之处是具有一个包含两个虚拟功能的SR-IOV SSD，通过Microchip的PCIe高级结构交换网，同一驱动器的虚拟功能可以共享给不同的主机。VzRednc

VzRednc

图3.双主机PCIe®结构引擎VzRednc

这种PAX结构交换网解决方案还支持在各结构之间直接跨域点对点传输，因此可减少根端口阻塞并进一步缓解CPU性能瓶颈，如图4所示。VzRednc

VzRednc

图4.通过结构路由通信，可减少根端口阻塞VzRednc

性能优化

在探索了NVMe驱动器和GPU之间数据传输的性能优化过程中涉及的所有组件之后，现在可以结合使用这些组件来实现预期的结果。说明这一点的最佳方式是利用图示演示各个步骤，图5显示了主机CPU及其根端口以及可实现最佳结果的各种配置。VzRednc

如 REF _Ref90992504 \h VALUE 图5 左侧所示，尽管使用的是高性能NVMe控制器，但由于根端口的开销，PCI Gen 4 x 4（4.5 GB/s）的最大数据速率也限制为3.5 GB/s。不过，通过RAID（逻辑卷）同时聚合多个驱动器（如右侧所示），SmartRAID控制器可为四个NVMe驱动器各创建两个RAID卷，并通过根端口创建传统PCIe点对点路由。这会将数据速率提高到9.5 GB/s。VzRednc

但是，利用跨域点对点传输（底部的图），可以通过结构链路而不是根端口来路由通信，从而实现26 GB/s的速率，这是使用SmartROC 3200 RAID控制器可达到的最高速率。在最后一个场景中，交换网提供不受固件影响的直接数据路径，并且仍然保持基于硬件的RAID保护和加密服务，同时充分利用GPUDirect存储的全部潜能。VzRednc

VzRednc

图5.实现26 GB/s的路径VzRednc

总结

高性能PCIe结构交换网（例如Microchip的PAX）允许多主机共享支持单根I/O虚拟化（SR-IOV）的驱动器，以及动态划分可在多个主机之间共享的GPU和NVMe SSD池。Microchip的PAX结构交换网可以将端点资源动态重新分配给需要这些资源的任何主机。VzRednc

这种解决方案还使用了SmartROC 3200 RAID控制器系列支持的SmartPQI驱动程序，因此无需自定义驱动程序。Microchip的SmartROC 3200 RAID控制器是目前惟一能够提供最高传输速率（即26 GB/s）的设备。它具有极低的延迟时间，可向主机提供最多16个PCIe Gen 4通道，并向后兼容PCIe Gen 2。与Microchip基于Flashtec^®系列的NVMe SSD结合使用时，可在多主机系统中发挥PCIe和Magnum IO GPUDirect存储的全部潜能。总体而言，上述所有特性使其能够构建一种强大的系统，该系统可以满足AI、ML、DL以及其他高性能计算应用的实时需求。VzRednc

作者：Microchip技术工程师Wilson Kwong；Microchip产品营销经理Sandeep DattaprasadVzRednc

责编：Franklin

阅读全文，请先

接口/总线处理器/DSP 缓存/存储技术技术实例

上一篇： 低于1mΩ电阻兼具电流检测优势与挑战 下一篇： 马桶变身“健康监测站”、手指血压仪、自拍测心率，盘点CES 2023上的那些医疗创新

微信扫一扫
一键转发
最前沿的电子设计资讯
请关注“电子技术设计微信公众号”

客户的咖啡机卡住了：一个PUT拯救一条PCB产线的故事我曾担任工程师，在一家电子代工服务公司的工程部门工作，我们部门负责为生产线设计测试设备，同时也协助客户解决产品问题，当时生产的产品是一种咖啡机的PCB组件···
Cadence 率先推出 eUSB2V2 IP 解决方案，助力打造高 Cadence 在业内率先推出 eUSB2V2 IP，此 IP 基于先进的台积公司 N3P 工艺，符合最新的嵌入式 USB2 版本 2 标准，可以为笔记本电脑、AI 视频设备和先进的图像信号处理器（ISP）系统提供前所未有的功能，改变了计算设备···
意法半导体65W GaN变换器为注重成本的应用提供节省空目标应用锁定快充、适配器和家电电源···
Molex莫仕应对超大规模数据中心的增长，推出高性能、低创新型扩束光学(EBO)技术提升了可靠性，并降低了清洁、检查与维护的需求，采用3M™ EBO插芯有助于简化部署、提升效率、减少清洁和维护需求，从而降低总体拥有成本(TCO)，设计灵活，可将12、16或144根光纤集于单个连接器中的选项，简化了布线，同时提高光纤密度，使用带3M EBO插芯的EBO连接器，可为机架内数据中心应用节省85%部署时间···
2025年及未来半导体行业的八大趋势从近期的历史来看，未来一年及以后，科技领域将取得一些惊人的进步，变革的步伐将继续加快···
Molex莫仕发布创新型MMCX同轴电源解决方案，确保在动态创新的连接技术解决了传统MMCX连接器存在的间歇性电源供应和信号中断问题，适用于航空航天和国防、农业、汽车、工业自动化和电信等领域的关键传感器和视频应用设备，向后兼容IEC 61169-52 MMCX插孔插座，有助于快速无缝的升级产品，无需对现有基础设施进行重大改造，紧凑、节省空间的设计符合对小型化的需求，同时通过同轴电源供电简化产品设计，降低系统复杂性···
Microchip推出全新Switchtec™ PCIe® 4.0 16通道 PCI100x系列器件可为任何需要加速或专用计算的应用提供高性能和成本效益···
AI驱动高效的半导体连接方案需求，Credo实现快速增长在互联速率没有超过100G的那个年代，传统的无源连接线缆被称为DAC，也就是无源铜缆，用户将其服务器连接到交换机的传统方法之一就是采用DAC来做互联。随着数据数率自400G、800G到1.6T的往上递增，信号格式从NRZ向PAM4转变，DAC线缆就会变得越来越粗重，这是因为它们的信号随速率提升衰减太快了，没办法在高速连接中规模商用。
东芝率先推出内置硬件逻辑的CXPI响应器接口IC，缩短汽车已可提供汽车CXPI响应器接口IC样品···
泰克率先推出拥有七米电缆的商用有源单端探头 TAP150 泰克 TAP1500L 为客户提供了一款灵活而不损性能的解决方案···
中国电动汽车市场零售渗透率超过50%，Molex莫仕引领小型 Molex 莫仕通过微型设计推动电动汽车技术进步，引领交通运输变革···
Vishay推出采用数字输入输出接口的25 MBd光耦，简化设计器件脉宽失真低至6 ns，供电电流仅为2 mA，工作温度高达+110 °C，适于各种工业应用···

25年第19周新能源周销量：不同价格带的车型走势解析本周插混与增程车型市场呈现出“两极化”趋势：一方面，10-15万元级的主流家用轿车与SUV销量强劲；另一方面，20万元
拆解报告：甲骨文3060W碳化硅服务器电源模块甲骨文服务器电源模块输入输出均为专用接口，采用热拔插设计。电源模块支持200-277V交流和240-380V直流输入，输
评测：森海塞尔ACCENTUM Open真无线耳机半入耳机森海塞尔ACCENTUM Open 真无线耳机采用半入耳式设计，搭配约4.4克的重量，佩戴舒适。耳机充电盒轻盈小巧，携带外
人形机器人如何做到“手眼”协同+“大小脑”协同？人形机器人正站在“走出实验室”的临界点。从本体制造、控制系统、核心零部件到应用场景拓展，技术与产业生态
南非2025年4月：奇瑞和长城汽车快速上升 2025年4月的南非车市增长，马恒达和现代的强劲回归是一个信号，而中国品牌的集体崛起，则预示着未来竞争将更加多
4月新能源车领跑汽车出口增长，中国汽车走向全球的新引擎 2025年开年以来的出口数据呈现出清晰的结构升级路径。新能源产品在出口中扮演的角色日益重要，不再只是锦上添
拆解报告：vivo手机原装90W氮化镓闪充充电器 vivo 90W氮化镓闪充充电器采用经典直板造型设计，同时附带一条专门量身定制的8.5A大电流数据线，配合信号屏蔽层
拆解报告：HONOR荣耀手环10 荣耀手环10在外观方面，延续了上代的轻薄双曲面设计，同时采用全新的双色NCVM镀膜工艺，使之更加的时尚精致。标配
2025年4月中国车企加速渗透土耳其市场：比亚迪Seal U打响突围战 2025年4月，土耳其市场的爆发式增长为全球车企提供了重要信号：新兴市场正在进入电动化转型的加速期，而土耳其作
2025年第19周新能源周销量：问界起势 2025年第19周，中国乘用车市场的周度销量达到44.4万辆，其中新能源车占比突破50%，达22.3万辆，占比50.2%。比亚迪体
2024年4月汽车市场终端数据：自主崛起、新势力分化、合资承压从整体销量数据来看，4 月汽车终端销量达 169.7 万，同比增长 9.3% ，在目前的价格力度下，这个销售数字差强人意。2
拆解报告：华为750W钛金牌服务器电源华为这款服务器电源型号为PAC750S12-TE，支持220V交流或240V直流输入，输出电压为12V，输出电流为62.5A，输出端设有

史密斯英特康推出新一代“ DaVinci Gen V”测试插座史密斯英特康推出新一代“ DaVinci Gen V”测试插座，为人工智能、6G通信及先进计算应用领域的芯片提供超
意法半导体高集成度低边电流测量放大器简化高准确度电流检测意法半导体的 TSC1801低边电流测量放大器集成了设定增益所需的匹配电阻，从而简化了电路设计，节省了物料清单
意法半导体推出创新的、带有可改变存储配置存储器的车规微控制器新推出的Stellar微控制器内置了xMemory技术，它为正在发展的软件定义汽车以及不断进化的电动汽车架构提供了一
新系列串口EEPROM内置唯一ID码，适合设备识别、溯源和可持续性应用意法半导体 (ST) 推出了一系列内置128位唯一只读ID码 (UID) 的串口EEPROM芯片，以满足市场对产品识别、溯
Vishay新添增强短瞬态脉冲防护性能的经AEC-Q200认证的厚膜功率电这些器件采用夹片式TO-247 封装形式，可直接安装在散热器上，具有高达 75 J/0.1 s的高脉冲吸收能力和 150
凉棚集成Nordic 技术实现Matter over Thread连接为家庭和企业 StruXure+ 凉棚和小屋系列集成 Nordic 的 nRF5340 SoC以提供无缝的 Matter over Thread 连接
智能楼宇技术全球领导者与Nordic Semiconductor携手合作确保楼业界连手推动NR+成为智能楼宇的全球连接标准···
Cadence 率先推出 eUSB2V2 IP 解决方案，助力打造高速连接新范 Cadence 在业内率先推出 eUSB2V2 IP，此 IP 基于先进的台积公司 N3P 工艺，符合最新的嵌入式 USB2 版
纳芯微发布双通道电流检测放大器NSCSA285，赋能工业与能源管理近日，上海 —— 纳芯微电子（简称“纳芯微”）发布全新高精度双通道电流检测放大器NSCSA285系列···
攻克PWM高频瞬态干扰难题！纳芯微发布车规级电流检测放大器NSCSA24 近日，纳芯微发布全新车规级双向电流检测放大器NSCSA240-Q1系列，专为汽车高压PWM系统打造解决方案···
TE Connectivity 推出INMORO系列：致力于满足中国市场需求而打造的连接和传感解决方案提供商泰科电子（TE Connectivity，以下简称 TE）工业事业部隆重推出INMORO 系列，致力于满足中
破解汽车与工业等应用新挑战，TDK展示多传感器融合与AI+发展趋势在新能源汽车应用中，热管理系统既要能高效地冷却和加热电池、电机与OBC等车辆核心部件，确保其处于最佳运行温

热门评论
最新评论

换一换

杂志声明

PCIe结构和RAID如何在GPUDirect存储中释放全部潜能

Magnum IO GPUDirect存储

优化RAID性能

混合PCIe结构

性能优化

总结