4Gbps！HBM2E内存接口再现性能标杆-EDN 电子技术设计

 近年来，随着内存带宽逐渐成为影响人工智能持续增长的关键焦点领域之一，以高带宽内存(HBM、HBM2、HBM2E)和GDDR开始逐渐显露头角，成为搭配新一代AI/ML加速器和专用芯片的新型内存解决方案。

人工智能/机器学习(AI/ML)在全球范围内的迅速兴起，正推动着制造业、交通、医疗、教育和金融等各个领域的惊人发展。从2012年到2019年，人工智能训练能力增长了30万倍，平均每3.43个月翻一番，就是最有力的证明。支持这一发展速度需要的远不止摩尔定律，人工智能计算机硬件和软件的各个方面都需要不断的快速改进。XrZednc

XrZednc

2012-2019年，人工智能训练能力增长30万倍(图片来源：openai.com)XrZednc

而中国作为全球人工智能发展最快的国家之一，正备受瞩目。根据德勤最新发布的统计预测数据显示，2020年全球人工智能市场规模将达到6800亿元人民币，复合增长率(CAGR)达26%。而中国人工智能市场的表现尤为突出，2019年末已经达到了510亿元人民币的市场规模，人工智能企业超过2600家。预计到2020年，中国AI市场规模将达到710亿元人民币，五年间(2015-2020)的复合增长率高达44.5%。XrZednc

近年来，中国正在积极推动人工智能与实体经济的融合，从而实现产业的优化升级。2017年7月，国务院印发了《新一代人工智能发展规划》，这一规划与2015年5月发布的《中国制造2025》共同构成了中国人工智能战略的核心。这份具有里程碑意义的规划，对人工智能发展进行了战略性部署，力争到2030年把中国建设成为世界主要人工智能创新中心。此外，2020年还是中国的新基建元年，而人工智能作为一大重点板块，势必成为新基建的核心支撑。XrZednc

内存带宽将是影响AI发展的关键因素

“内存带宽将成为人工智能持续增长的关键焦点领域之一。”Rambus IP核产品营销高级总监 Frank Ferro日前在接受《电子工程专辑》采访时表示，以先进的驾驶员辅助系统(ADAS)为例，L3级及更高级别系统的复杂数据处理需要超过200GB/s的内存带宽。这些高带宽是复杂AI/ML算法的基本需求，自驾过程中需要这些算法快速执行大量计算并安全地执行实时决策。而在L5级，如果车辆要能够独立地对交通标志和信号的动态环境做出反应，以便准确地预测汽车、卡车、自行车和行人的移动，将需要超过500GB/s的内存带宽。XrZednc

XrZednc

不同ADAS级别对存储带宽的要求(图片来源：anandtech.com)XrZednc

鉴于此，高带宽内存(HBM、HBM2、HBM2E)和GDDR开始逐渐显露头角，成为搭配新一代AI/ML加速器和专用芯片的新型内存解决方案。他说过去几年内，HBM、HMC、PAM4等标准在市场上展开了激烈的竞争，但从目前的发展态势来看，还是HBM占据了更多的市场份额。不过他同时也坦承，由于汽车安全等级要求很高，考虑到HBM本身采用的是复杂的2.5D架构，再结合DRAM设备，所以目前为止在汽车市场上并没有得到突破性的应用，相比之下，GDDR反而会是比较好的解决方案。XrZednc

高带宽内存(HBM)于2013年推出，是一种高性能3D堆栈SDRAM构架。与前一代产品一样，HBM2为每个堆栈包含最多8个内存芯片，同时将管脚传输速率翻倍，达到2Gbps。HBM2实现每个封装256GB/s的内存带宽(DRAM堆栈)，采用HBM2规格，每个封装支持高达8GB的容量。XrZednc

2018年末，JEDEC宣布推出HBM2E规范，以支持增加的带宽和容量。当传输速率上升到每管脚3.6Gbps时，HBM2E可以实现每堆栈461GB/s的内存带宽。此外，HBM2E支持12个DRAM的堆栈，内存容量高达每堆栈24GB。XrZednc

XrZednc

单一DRAM堆栈的HBM2E内存系统(图片来源：Rambus)XrZednc

HBM2E提供了达成巨大内存带宽的能力。连接到一个处理器的四块HBM2E内存堆栈将提供超过1.8TB/s的带宽。通过3D堆叠内存，可以以极小的空间实现高带宽和高容量需求。进一步，通过保持相对较低的数据传输速率，并使内存靠近处理器，总体系统功率得以维持在较低水位。XrZednc

坦率的说，采用HBM的设计的代价是增加复杂性和成本，因此Frank Ferro并不建议在人工智能推理应用中使用HBM技术。然而，对于人工智能训练应用，HBM2E的优点使其成为一个更好的选择。它的性能非常出色，所增加的采用和制造成本可以透过节省的电路板空间和电力相互的缓解。在物理空间日益受限的数据中心环境中，HBM2E紧凑的体系结构提供了切实的好处。它的低功率意味着它的热负荷较低，在这种环境中，冷却成本通常是几个最大的运营成本之一。官方数据显示，Rambus IP系统以及IP产品在实验室经过了非常严苛的环境测试，确保从零下50到125摄氏度范围内均能够正常运行。XrZednc

同时，Frank Ferro也不认为在芯片上采取分布式内存的方法会给HBM2E和GDDR长期的发展带来影响。原因在于尽管SRAM的速度和延迟性都高于DRAM，但在固定的芯片面积上能安装的SRAM数量却非常少，很多情况下为了满足人工智能训练的需求，一部分SRAM设备不得不装在芯片之外，这就是问题所在。但总体来说，这两种方案属于从不同角度出发解决同一个问题，两者之间是互补而非相互阻碍。XrZednc

创纪录的性能

针对高带宽和低延迟进行了优化，Rambus HBM2E内存接口解决方案实现了创纪录的4Gbps性能。该解决方案由完全集成且经过验证的PHY和内存控制器IP组成，搭配SK Hynix 3.6Gbps运行速度的HBM2E DRAM，在物理层面实现了完整的集成互联，可以从单个HBM2E设备提供460GB/s的带宽，这也被Frank Ferro视作其HBM2E 产品的核心差异化优势之一。这意味着，除了提供完整的内存子系统、硬核PHY和时序收敛外，用户额外需要的系统级支持、工具套件和技术服务也都包含在内，集成难度和设计时间得以大幅度下降。XrZednc

XrZednc

Rambus HBM2E 4Gbps发送端眼图(图片来源：Rambus)XrZednc

从2017年正式投产HBM解决方案以来，Rambus目前已经拥有第三代PHY和第二代内存控制器IP，全球范围内的成功案例项目超过50个。除了4Gbps HBM2E外，Rambus在其他不同工艺节点的产品还包括采用Global Foundries 12nm/14nm工艺的HBM2，速度为2.0 Gbps/s；采用Global Foundries 12LP+和三星14nm/11nm工艺的HBM2E产品。XrZednc

不可否认，4.0Gbps是一个全新的行业标杆。在这一过程中，Rambus与SK hynix和Alchip展开了合作，采用台积电N7工艺和CoWoS®先进封装技术，实现了HBM2E 2.5D系统在硅中验证Rambus HBM2E PHY和内存控制器IP。Alchip与Rambus的工程团队共同设计，负责中介层和封装基板的设计。XrZednc

“在我们提供的完整参考设计框架中，最重要的一点就是如何更好地对中介层进行完整的设计和表征化处理，以确保信号完整性。此外，我们还协助用户对每个信号通道进行仿真分析，通过Lab Station工具对内存子系统进行最优化设计，并提供在SI高速信号完整性和电源完整性方面的经验等等。”Frank Ferro说Rambus的初衷，不仅仅只是扮演IP供应商的角色，更是希望在系统层面降低用户设计难度。XrZednc

信号完整性之所以如此重要，是因为HBM作为高速内存接口，在与中介层互联的过程中包括至少上千条不同的数据链路，必须要确保所有链路的物理空间得到良好的控制，整个信号的完整性也必须得到验证。因此，Rambus的做法如果从表征化层面来讲，不但需要对整个中介层的材料做出非常精细的选择，还要考虑渐进层的厚度以及整个电磁反射相关的物理参数，并在此基础上进行完整的分析和仿真，以实现信号一致性的处理。XrZednc

XrZednc

HBM2E内存接口子系统示例XrZednc

燧原科技是Frank Ferro在发布会上提及的中国合作伙伴。在此次合作中，燧原科技为自己下一代人工智能训练芯片选择了Rambus HBM2 PHY和内存控制器IP，可实现2Tb/s的性能。而在今年4月和5月，长鑫存储、兆易创新两家公司还分别和Rambus签署了DRAM(动态随机存取存储)与RRAM(电阻式随机存取存储器，也可写作ReRAM)技术专利授权。XrZednc

Rambus大中华区总经理 Raymond Su表示，通过对IP控制器公司Northwest Logic和Verimatrix安全IP业务部门的收购，Rambus实现了在内存IP层面提供一站式采购和“turn key”服务的目标。接下来，在中国市场，公司将紧密地与云厂商、OEM和ODM合作，推动整个内存产业生态系统的建设。XrZednc

本文为电子技术设计原创文章，未经授权禁止转载。请尊重知识产权，违者本司保留追究责任的权利。

阅读全文，请先

邵乐峰

暂无简介...

进入专栏

缓存/存储技术接口/总线产业前沿

上一篇： 13年，那些我们看着长大的iPhone 下一篇： 苹果A15芯片将采用什么制程？5nm or 3nm？

微信扫一扫
一键转发
最前沿的电子设计资讯
请关注“电子技术设计微信公众号”

基于SRAM的FPGA技术创新：快速安全启动机制深度解析在可编程逻辑器件领域，基于SRAM的FPGA经常被误解···
AI时代的氮化镓：市场与技术将走向何方？ AI时代，氮化镓、碳化硅这样类新兴技术也正与AI挂钩，因为AI基础设施的算力、电源需求都不同于往常。为此，我们采访了英飞凌高级副总裁、氮化镓业务负责人Johannes Schoiswohl，谈了谈氮化镓市场与技术的未来…
意法半导体推出创新的、带有可改变存储配置存储器的车新推出的Stellar微控制器内置了xMemory技术，它为正在发展的软件定义汽车以及不断进化的电动汽车架构提供了一个更为简单且具有更强可扩展性的计算平台，可改变存储配置让汽车厂商能够不断开发创新应用，包括更多需要大容量内存的人工智能应用，xMemory基于意法半导体专有相变存储器 (PCM) 技术，2025年底投产···
新系列串口EEPROM内置唯一ID码，适合设备识别、溯源和可意法半导体 (ST) 推出了一系列内置128位唯一只读ID码 (UID) 的串口EEPROM芯片，以满足市场对产品识别、溯源和维修的需求···
JEDEC最终确定HBM4标准，内存大厂的更新进度如何？近日，JEDEC宣布发布HBM4 DRAM标准，为AI和HPC提供更高的带宽、效率和容量···
中国“破晓(PoX)”皮秒闪存器件问世，问鼎全球最快近日，复旦大学的研究团队研制出一款名为“破晓(PoX)”的皮秒闪存器件，打破了现有存储速度的理论极限···
SiC MOSFET 如何提高 AI 数据中心的电源转换能效随着数据中心耗电量急剧增加，行业更迫切地需要能够高效转换电力的功率半导体···
DRAM基础知识：通过优化外围晶体管实现热稳定性 DRAM位单元具有一种非常基本的结构，由一个电容器(1C)和一个集成在电容器附近的晶体管(1T)组成···
Certus-N2的边缘网络奇旅随着“下一代小型FPGA平台”Nexus™ 2和基于该平台的首个器件系列Certus™-N2通用FPGA的面世，莱迪思(Lattice)公司在小型FPGA领域的领先地位再次得到强化···
用上Zen5架构，AMD第五代霄龙嵌入式处理器有多强？如今的嵌入式计算市场正经历着巨大的变革，人工智能驱动的网络流量激增、数据爆炸式增长以及工业边缘算力需求的扩张，让传统嵌入式处理器面临着前所未有的性能与可靠性挑战···
释放AI潜能，Arm计算平台构建计算与存储的未来当下，我们正处在激动人心的人工智能 (AI) 技术变革初期阶段。随着自然语言、多模态大模型以及生成式 AI 技术的加速演进，AI 正以前所未有的速度重塑各行各业···
兆易创新推出GD25NE系列SPI NOR Flash：专为1.2V SoC 业界领先的半导体器件供应商兆易创新GigaDevice宣布推出专为1.2V SoC应用打造的双电压供电SPI NOR Flash产品——GD25NE系列···

25年第19周新能源周销量：不同价格带的车型走势解析本周插混与增程车型市场呈现出“两极化”趋势：一方面，10-15万元级的主流家用轿车与SUV销量强劲；另一方面，20万元
拆解报告：甲骨文3060W碳化硅服务器电源模块甲骨文服务器电源模块输入输出均为专用接口，采用热拔插设计。电源模块支持200-277V交流和240-380V直流输入，输
评测：森海塞尔ACCENTUM Open真无线耳机半入耳机森海塞尔ACCENTUM Open 真无线耳机采用半入耳式设计，搭配约4.4克的重量，佩戴舒适。耳机充电盒轻盈小巧，携带外
人形机器人如何做到“手眼”协同+“大小脑”协同？人形机器人正站在“走出实验室”的临界点。从本体制造、控制系统、核心零部件到应用场景拓展，技术与产业生态
南非2025年4月：奇瑞和长城汽车快速上升 2025年4月的南非车市增长，马恒达和现代的强劲回归是一个信号，而中国品牌的集体崛起，则预示着未来竞争将更加多
4月新能源车领跑汽车出口增长，中国汽车走向全球的新引擎 2025年开年以来的出口数据呈现出清晰的结构升级路径。新能源产品在出口中扮演的角色日益重要，不再只是锦上添
拆解报告：vivo手机原装90W氮化镓闪充充电器 vivo 90W氮化镓闪充充电器采用经典直板造型设计，同时附带一条专门量身定制的8.5A大电流数据线，配合信号屏蔽层
拆解报告：HONOR荣耀手环10 荣耀手环10在外观方面，延续了上代的轻薄双曲面设计，同时采用全新的双色NCVM镀膜工艺，使之更加的时尚精致。标配
2025年4月中国车企加速渗透土耳其市场：比亚迪Seal U打响突围战 2025年4月，土耳其市场的爆发式增长为全球车企提供了重要信号：新兴市场正在进入电动化转型的加速期，而土耳其作
2025年第19周新能源周销量：问界起势 2025年第19周，中国乘用车市场的周度销量达到44.4万辆，其中新能源车占比突破50%，达22.3万辆，占比50.2%。比亚迪体
2024年4月汽车市场终端数据：自主崛起、新势力分化、合资承压从整体销量数据来看，4 月汽车终端销量达 169.7 万，同比增长 9.3% ，在目前的价格力度下，这个销售数字差强人意。2
拆解报告：华为750W钛金牌服务器电源华为这款服务器电源型号为PAC750S12-TE，支持220V交流或240V直流输入，输出电压为12V，输出电流为62.5A，输出端设有

史密斯英特康推出新一代“ DaVinci Gen V”测试插座史密斯英特康推出新一代“ DaVinci Gen V”测试插座，为人工智能、6G通信及先进计算应用领域的芯片提供超
意法半导体高集成度低边电流测量放大器简化高准确度电流检测意法半导体的 TSC1801低边电流测量放大器集成了设定增益所需的匹配电阻，从而简化了电路设计，节省了物料清单
意法半导体推出创新的、带有可改变存储配置存储器的车规微控制器新推出的Stellar微控制器内置了xMemory技术，它为正在发展的软件定义汽车以及不断进化的电动汽车架构提供了一
新系列串口EEPROM内置唯一ID码，适合设备识别、溯源和可持续性应用意法半导体 (ST) 推出了一系列内置128位唯一只读ID码 (UID) 的串口EEPROM芯片，以满足市场对产品识别、溯
Vishay新添增强短瞬态脉冲防护性能的经AEC-Q200认证的厚膜功率电这些器件采用夹片式TO-247 封装形式，可直接安装在散热器上，具有高达 75 J/0.1 s的高脉冲吸收能力和 150
凉棚集成Nordic 技术实现Matter over Thread连接为家庭和企业 StruXure+ 凉棚和小屋系列集成 Nordic 的 nRF5340 SoC以提供无缝的 Matter over Thread 连接
智能楼宇技术全球领导者与Nordic Semiconductor携手合作确保楼业界连手推动NR+成为智能楼宇的全球连接标准···
Cadence 率先推出 eUSB2V2 IP 解决方案，助力打造高速连接新范 Cadence 在业内率先推出 eUSB2V2 IP，此 IP 基于先进的台积公司 N3P 工艺，符合最新的嵌入式 USB2 版
纳芯微发布双通道电流检测放大器NSCSA285，赋能工业与能源管理近日，上海 —— 纳芯微电子（简称“纳芯微”）发布全新高精度双通道电流检测放大器NSCSA285系列···
攻克PWM高频瞬态干扰难题！纳芯微发布车规级电流检测放大器NSCSA24 近日，纳芯微发布全新车规级双向电流检测放大器NSCSA240-Q1系列，专为汽车高压PWM系统打造解决方案···
TE Connectivity 推出INMORO系列：致力于满足中国市场需求而打造的连接和传感解决方案提供商泰科电子（TE Connectivity，以下简称 TE）工业事业部隆重推出INMORO 系列，致力于满足中
破解汽车与工业等应用新挑战，TDK展示多传感器融合与AI+发展趋势在新能源汽车应用中，热管理系统既要能高效地冷却和加热电池、电机与OBC等车辆核心部件，确保其处于最佳运行温

热门评论
最新评论

换一换

杂志声明

4Gbps！HBM2E内存接口再现性能标杆

内存带宽将是影响AI发展的关键因素

创纪录的性能