AI推动着存储器互连的不断演进-EDN 电子技术设计

 为了满足人工智能（AI）和机器学习应用的需求，位置这个词被越来越多地应用于数据存储。但解决这种位置的挑战不只是存储器供应商应做的工作，与AI相关的供应商也扮演着重要角色。尽管存储距离计算越来越近，但解决方案的很大一部分在于存储互连。

位置、位置、位置，这并不只是房地产界的核心词。为了满足人工智能（AI）和机器学习应用的需求，这个词被越来越多地应用于数据存储，如数据存储的位置以及存放数据的存储器。gYxednc

但解决这种位置的挑战不只是存储器供应商应做的工作，与AI相关的供应商也扮演着重要角色。尽管存储距离计算越来越近，但解决方案的很大一部分在于存储互连。Rambus研究员Steve Woo最近在AI硬件峰会上主持了一次在线圆桌论坛，讨论了存储器互连的挑战和解决方案，他说：“我们都在为AI的不同方面而工作。”gYxednc

Marvell的ASIC事业部CTO Igor Arsovski在17年前曾经做过SRAM设计工程师。他说，慕尼黑啤酒节（Oktoberfest）因为新冠肺炎疫情取消了，而把存储互连比做啤酒很合适。参加啤酒节，可以很容易喝到啤酒。“而SRAM就好像近在身边的啤酒一样。它随手可得，不需要耗费多少能量，而且只要您需要，它就在那儿，就像拥有一个不错的高性能加速器。”但是，如果没有足够的存储空间，就需要走远一点，同时也需要花费更多能量来获取它，就好像必须走更远才能买到大桶啤酒一样。gYxednc

Arsovski 说，对存储器而言，大桶啤酒就好像高带宽存储器（HBM），它正越来越多地被AI所采用。“访问这种存储器需要花费约60倍的能量。那里容量虽然大得多，但访问它的带宽却很少。”将啤酒类比扩展到LPDDR之类的技术，这种技术比SRAM更先进。他说：“LPDDR功耗明显更高，但容量更大。这就像沿着那条路走到您最喜爱的酒吧，在那里有几桶啤酒等着您。”gYxednc

Arsovski表示，下一代加速器的发展方向是将那些存储器放在加速器正上方，让存储离计算更近。MLCommons执行董事David Kanter补充说，这个啤酒类比概述了不同的封装途径以及在何处安放不同的硅片。MLCommons是一个提供机器学习标准和AI推理基准的组织，其成员涵盖学术界和工业界。他说道：“这使我们对不同的工作负载有非常全面的了解。MLCommons正在开始采取一些措施，其中重点之一就是建立咨询委员会，以吸收特定应用领域的一些资深专家。”gYxednc

Kanter说，对存储器而言，整个系统环境至关重要。“您必须考虑系统要实现什么，这将决定要考虑的问题。”他说，当涉及到存储器的位置和连接时，芯片、封装和电路板都是必须考虑的要素。“在阵列结构、单元类型以及距离方面，有很多地方可以优化。”gYxednc

Kanter说，明白哪里需要带宽以及非易失性也是关键的考量因素。“希望这将引导做出正确的选择。”gYxednc

对于那些传统上并不属于存储系统构建流程的公司而言，这些考量因素至关重要。Google软件工程师Sameer Kumar花费大量时间在编译器和可扩展系统上，这些系统的网络和存储带宽对不同的机器学习模型非常重要，包括其大规模批量操作的能力。他说：“人工智能训练涉及许多存储方面的优化，”这是在编译器中获得极高效率的最关键步骤，它意味着存储也需要更加智能。gYxednc

Woo认为，数据移动实际上已经开始主宰AI应用的某些阶段，所以存储互连变得越来越重要。“性能和能效成为日益重要的问题”，提高数据速率极具挑战性，因为所有人都希望将数据移动速度加倍，能效也加倍。“我们以前所依赖的许多技巧和技术都已不再适用，或者正在被慢慢淘汰。我们有极好的机会来思考新的体系架构，并在移动数据的方式上进行创新。”gYxednc

Woo表示，创新不仅在存储器件本身上，而且还包括封装，以及堆叠等新技术。在创新的同时，还要确保数据的安全性，这是Rambus目前越来越关注的。gYxednc

Rambus感受到业界对3D堆栈的极大兴趣，但如果带宽不随堆栈容量增加而相应增加的话，其可用性会受到限制。（图片来源：Rambus）gYxednc

Arsovski表示，Marvell花费了大量时间为客户建立AI系统，为客户提供带宽相关信息，如每个芯片边缘有多少带宽可以用于数据移动，以及有多少带宽可以用于访问存储器。他说：“到目前为止，我们已经可以看到，客户需要更多的存储带宽和更多的I / O带宽。如果看看封装级别的互连，可以看到存在很大的不匹配。我们现在已经到达瓶颈，高端芯片-芯片连接的需求压力持续增大。”gYxednc

Arsovski表示，从存储器的角度来看，对于那些无法在裸片上直接构建AI模型的设计师来说，其下一步考虑应该是HBM或GDDR。但是也有很多转而采用3D堆叠，以尝试获得更大的带宽，因为在芯片边缘移动数据的容量有限。“客户希望得到越来越多的I/O带宽，而我们在边缘数据移动上遇到了瓶颈。”gYxednc

Kanter说，即使在机器学习的世界中，也存在着“很大的多样性”，这对生态系统既有制约，也有促进，记住这一点很重要。对于常规DRAM来说，随机查找庞大的数据结构不适合单个节点，这意味着如果您想将数据真正保存在存储器中，则需要构建一个非常大的系统集群。他说：“与传统的面向视觉的模型相比，其特征和属性完全不同。在存储方面要牢记这一多样性，这一点非常重要。”gYxednc

Kanter说，当需要将大量存储和计算整合在一起时，就需要互连了。“要进行大规模训练，迫切需要既适合客户又适合要解决问题的互连方案。”他说，对于前沿应用来说，互连将特别重要。“如果您只想为一个小型网络训练一个GPU，那么关键因素可能就是存储带宽。”gYxednc

Kumar说，更多的存储带宽可以实现不同种类的优化，但是如果模型特别受存储限制，就有必要引入更多的计算。“如果有更多的存储吞吐量可用，甚至有更多的互连吞吐量可用，将可能会使模型设计更加灵活，而且可以启用新功能，并一起构建各种类型的模型。”gYxednc

Woo表示，Rambus感受到大家对3D堆栈兴趣浓厚，但随着堆栈越来越高，增加进出堆栈的带宽也变得越来越困难。“如果只是增加堆栈容量，但没有增加相应的带宽，那方案的实用性就成问题了。”gYxednc

他说，关键点在于寻找合适的方案，既能保持填充频率，又能利用堆叠能效方面的优势，从而使带宽与容量和堆叠之间具有相对恒定的比率。gYxednc

Kumar和Arsovski都认为需要一个平衡、可扩展的系统，这种系统具有精心设计的软件堆栈。 Arsovski说，“我们所说的是一种可以良好扩展的类脑结构。”它必须低功耗且具有大量连接，而现在，3D堆叠是我们能做到最接近的结构，但仍然存在功耗、封装和机械结构方面的挑战。 “我们需要研究出一个高度并行的系统，其每个层级的功耗都极低，而不必担心要为冷却耗费数千瓦的功率。”gYxednc

他说，是时候开始寻找适合AI系统的下一个基本构建模块了。“一直以来，我们都采用晶体管作为基本单元，迄今为止，它们都发挥出色。我们通常会依赖我们所知道和喜爱的技术，并且希望它持续发展。但现在我们需要重头开始设计了。”gYxednc

(参考原文: AI Drives Memory Interconnect Evolution)gYxednc

责编：Amy GuangYxednc

阅读全文，请先

Gary Hilson

EE Times特约编辑。Gary Hilson是一位自由撰稿人和编辑，曾为北美地区的印刷和电子出版物撰写过大量稿件。他感兴趣的领域包括软件、企业级和网络技术、基础研究和教育市场，以及可持续交通系统和社会新闻。他的文章发表于Network Computing，InformationWeek，Computing Canada，Computer Dealer News，Toronto Business Times，Strategy Magazine和Ottawa Citizen。

进入专栏

人工智能缓存/存储技术产业前沿

上一篇： 三星的6亿像素传感器计划及ISOCELL技术 下一篇： IoT设备安全性设计的八项原则

微信扫一扫
一键转发
最前沿的电子设计资讯
请关注“电子技术设计微信公众号”

2025松山湖中国IC创新高峰论坛：继续聊聊机器人去年的主题是智慧机器人，今年的主题仍然聚焦于机器人身上，不过变为了具身智慧机器人……
鹏瞰TS-PON Gen2芯片，用光协议重塑机器人“神经网络” TS-PON Gen2芯片是一款灵活的软件定义 SoC，适用于多种场景。它基于无源光网（PON）技术，具备高带宽（目前10G，未来可拓展至25G、50G）、低时延（微秒级）、高确定性等特性···
让人形机器人“耳聪目明”，昆泰芯KTM5900磁性编码器解编码器芯片作为机器人的核心传感器之一，对于提升机器人的感知能力、安全性和生产效率具有重要意义···
如何让具身机器人“看”得清？思特威给出了这个答案相比于滚动快门传感器，全局快门传感器能够同时曝光整个画面，有效避免了运动过程中产生的图像形变，为机器视觉提供高精度、无畸变的图像···
极海推出全球首款双核Cortex-M52实时控制MCU/DSP 随着机器人技术的不断发展，其应用领域从传统的工业制造逐步拓展至医疗、农业等多个新兴领域，这对机器人的控制系统提出了更高的要求，当前机器人控制系统当前主要面临高爆发、高动态、高精度和高安全这四方面的挑战···
比人类更灵活？先楫HPM6E8Y机器人关节控制解决方案 HPM6E8Y通过硬件加速器将电机控制算法执行时间缩短至2.8μs，以全链路高实时通信与多轴协同能力，开启机器人关节“芯”时代。
为旌科技感算控一体化芯片落地，带来6倍效率提升？具身智能的本质是‘大脑（认知）+小脑（控制）+感官（感知）’的协同进化，需要芯片层面实现三者深度融合。
爱芯元智发布AX8850：让AI算力更便宜，让智能更可及爱芯元智希望把算力做得更加便宜具智价比，普惠AI，让我们的边缘智能更加触手可及···
万有引力EB100芯片亮相，空间计算走向低功耗新时代？ EB100芯片将为XR和机器人行业带来更好、更低功耗的空间计算和显示能力，开启空间计算时代的无限可能···
芯驰D9 Max：为具身智能而生的高性能SoC，一颗芯片顶五颗我们希望以1个芯片完成5个芯片完成的事情。当应用发生爆炸性的变化，融合一定是一个非常大的趋势，而且融合的过程会使软件的开发更简单，系统的开发更简单，成本控制得更好···
情境感知AI：利用FPGA技术增强边缘智能现场可编程门阵列（FPGA）的灵活性、现场升级能力和互操作性，结合其低功耗、低延迟和并行处理能力，使其成为开发者克服挑战并优化情境边缘AI应用的关键工具。
ADAS 系统中的传感器创新如何在道路交通中挽救生命在本文中，我们将探讨 ADAS 在提高道路安全方面的作用，以及各种对实现这一目标至关重要的传感器技术。

25年第19周新能源周销量：不同价格带的车型走势解析本周插混与增程车型市场呈现出“两极化”趋势：一方面，10-15万元级的主流家用轿车与SUV销量强劲；另一方面，20万元
拆解报告：甲骨文3060W碳化硅服务器电源模块甲骨文服务器电源模块输入输出均为专用接口，采用热拔插设计。电源模块支持200-277V交流和240-380V直流输入，输
评测：森海塞尔ACCENTUM Open真无线耳机半入耳机森海塞尔ACCENTUM Open 真无线耳机采用半入耳式设计，搭配约4.4克的重量，佩戴舒适。耳机充电盒轻盈小巧，携带外
人形机器人如何做到“手眼”协同+“大小脑”协同？人形机器人正站在“走出实验室”的临界点。从本体制造、控制系统、核心零部件到应用场景拓展，技术与产业生态
南非2025年4月：奇瑞和长城汽车快速上升 2025年4月的南非车市增长，马恒达和现代的强劲回归是一个信号，而中国品牌的集体崛起，则预示着未来竞争将更加多
4月新能源车领跑汽车出口增长，中国汽车走向全球的新引擎 2025年开年以来的出口数据呈现出清晰的结构升级路径。新能源产品在出口中扮演的角色日益重要，不再只是锦上添
拆解报告：vivo手机原装90W氮化镓闪充充电器 vivo 90W氮化镓闪充充电器采用经典直板造型设计，同时附带一条专门量身定制的8.5A大电流数据线，配合信号屏蔽层
拆解报告：HONOR荣耀手环10 荣耀手环10在外观方面，延续了上代的轻薄双曲面设计，同时采用全新的双色NCVM镀膜工艺，使之更加的时尚精致。标配
2025年4月中国车企加速渗透土耳其市场：比亚迪Seal U打响突围战 2025年4月，土耳其市场的爆发式增长为全球车企提供了重要信号：新兴市场正在进入电动化转型的加速期，而土耳其作
2025年第19周新能源周销量：问界起势 2025年第19周，中国乘用车市场的周度销量达到44.4万辆，其中新能源车占比突破50%，达22.3万辆，占比50.2%。比亚迪体
2024年4月汽车市场终端数据：自主崛起、新势力分化、合资承压从整体销量数据来看，4 月汽车终端销量达 169.7 万，同比增长 9.3% ，在目前的价格力度下，这个销售数字差强人意。2
拆解报告：华为750W钛金牌服务器电源华为这款服务器电源型号为PAC750S12-TE，支持220V交流或240V直流输入，输出电压为12V，输出电流为62.5A，输出端设有

史密斯英特康推出新一代“ DaVinci Gen V”测试插座史密斯英特康推出新一代“ DaVinci Gen V”测试插座，为人工智能、6G通信及先进计算应用领域的芯片提供超
意法半导体高集成度低边电流测量放大器简化高准确度电流检测意法半导体的 TSC1801低边电流测量放大器集成了设定增益所需的匹配电阻，从而简化了电路设计，节省了物料清单
意法半导体推出创新的、带有可改变存储配置存储器的车规微控制器新推出的Stellar微控制器内置了xMemory技术，它为正在发展的软件定义汽车以及不断进化的电动汽车架构提供了一
新系列串口EEPROM内置唯一ID码，适合设备识别、溯源和可持续性应用意法半导体 (ST) 推出了一系列内置128位唯一只读ID码 (UID) 的串口EEPROM芯片，以满足市场对产品识别、溯
Vishay新添增强短瞬态脉冲防护性能的经AEC-Q200认证的厚膜功率电这些器件采用夹片式TO-247 封装形式，可直接安装在散热器上，具有高达 75 J/0.1 s的高脉冲吸收能力和 150
凉棚集成Nordic 技术实现Matter over Thread连接为家庭和企业 StruXure+ 凉棚和小屋系列集成 Nordic 的 nRF5340 SoC以提供无缝的 Matter over Thread 连接
智能楼宇技术全球领导者与Nordic Semiconductor携手合作确保楼业界连手推动NR+成为智能楼宇的全球连接标准···
Cadence 率先推出 eUSB2V2 IP 解决方案，助力打造高速连接新范 Cadence 在业内率先推出 eUSB2V2 IP，此 IP 基于先进的台积公司 N3P 工艺，符合最新的嵌入式 USB2 版
纳芯微发布双通道电流检测放大器NSCSA285，赋能工业与能源管理近日，上海 —— 纳芯微电子（简称“纳芯微”）发布全新高精度双通道电流检测放大器NSCSA285系列···
攻克PWM高频瞬态干扰难题！纳芯微发布车规级电流检测放大器NSCSA24 近日，纳芯微发布全新车规级双向电流检测放大器NSCSA240-Q1系列，专为汽车高压PWM系统打造解决方案···
TE Connectivity 推出INMORO系列：致力于满足中国市场需求而打造的连接和传感解决方案提供商泰科电子（TE Connectivity，以下简称 TE）工业事业部隆重推出INMORO 系列，致力于满足中
破解汽车与工业等应用新挑战，TDK展示多传感器融合与AI+发展趋势在新能源汽车应用中，热管理系统既要能高效地冷却和加热电池、电机与OBC等车辆核心部件，确保其处于最佳运行温

热门评论
最新评论

换一换

杂志声明

AI推动着存储器互连的不断演进