广告

三星如何给内存加上AI? 

2021-08-24 阅读:
三星首次成功将基于PIM的高带宽存储器(HBM-PIM)整合到商用化加速器系统中,并扩大PIM应用范围至DRAM模组和移动内存,从而加速实现内存和逻辑的融合。

近期,三星在Hot Chips 33会议上展示了其在内存内处理(PIM)技术方面的最新进展。Uw7ednc

Hot Chips 33会议作为半导体行业的重要会议,每年都会有备受瞩目的微处理器和IC创新产品亮相。Uw7ednc

三星半导体 HBM-PIMUw7ednc

三星发布的信息包括,三星首次成功将基于PIM的高带宽存储器(HBM-PIM)整合到商用化加速器系统中,并扩大PIM应用范围至DRAM模组和移动内存,从而加速实现内存和逻辑的融合。Uw7ednc

三星首次将HBM-PIM集成到AI加速器中Uw7ednc

今年2月,三星推出了其首个HBM-PIM(Aquabolt-XL),将AI处理能力整合到三星HBM2 Aquabolt中,以增强超级计算机和AI应用的高速数据处理能力。随后,HBM-PIM在赛灵思(Xilinx)Virtex Ultrascale+(Alveo)AI加速器中进行了测试,它提升了近2.5倍的系统性能,并降低超过60%的能耗。Uw7ednc

“HBM-PIM是三星首个在客户AI加速器系统中进行了测试的AI定制内存解决方案,显示出巨大的商业潜力。”三星电子DRAM产品和技术高级副总裁Nam Sung Kim表示,“随着技术标准化发展,该技术应用将会进一步扩大,扩展至用于下一代超级计算机和AI应用的HBM3,甚至用于设备上AI的移动存储器,以及用于数据中心的存储器模块。”Uw7ednc

“赛灵思一直与三星电子合作,从Virtex UltraScale+ HBM系列开始,为数据中心、网络和实时信号处理应用提供高性能解决方案。近期,双方又推出了令人振奋的Versal HBM系列产品。”赛灵思产品规划部高级总监Arun Varadarajan Rajagopal表示,“很高兴能与三星继续开展合作,我们帮助评估HBM-PIM系统在AI应用中实现重大性能,及能效提升的潜力。”Uw7ednc

PIM驱动的DRAM模块Uw7ednc

加速DIMM(AXDIMM)能在DRAM模块内进行“处理”,尽可能减少CPU和DRAM之间的大量数据交换,以提升AI加速器系统的能源效率。由于缓冲芯片内嵌有AI引擎,AXDIMM可对多个内存排列(DRAM芯片组)并行处理,而非每次仅访问一组,从而大大提升了系统性能和效率。由于AXDIMM模块能保留传统DIMM的外形尺寸,因此它能在不修改系统的情况下直接替换。目前,AXDIMM正在客户的服务器上进行测试,能够在基于AI的推荐应用中,提供大约2倍的性能,并使整个系统的能耗减少40%。Uw7ednc

三星半导体 AXDIMMUw7ednc

“思爱普(SAP)一直为SAP-HANA在内存内数据库(IMDB)应用方面与三星开展合作。”思爱普HANA核心研究与创新主管Oliver Rebholz表示,“根据性能预测和潜在的整合方案,我们预计内存内数据库管理(IMDBMS)的性能会有明显改善,并通过AXDIMM上的分解计算,实现更高能效。思爱普希望继续与三星在该领域进行合作。”Uw7ednc

移动存储器将AI从数据中心带到设备上Uw7ednc

三星LPDDR5-PIM移动存储器,可在不连接数据中心的情况下,提供独立的AI功能。模拟测试表明,LPDDR5-PIM在用于语音识别、翻译和聊天机器人等应用时,可提升1倍以上的性能,同时减少60%以上的能耗。Uw7ednc

激发生态系统活力Uw7ednc

三星计划通过与其他行业领导者合作,在2022年上半年实现PIM平台标准化,从而扩展AI内存产品组合。三星还将继续努力,培养一个高度健全的PIM生态系统,以确保整个内存市场的广泛适用性。Uw7ednc

*实际性能可能因设备和用户环境而异Uw7ednc

*本文中的产品图片以及型号、数据、功能、性能、规格参数、特点和其他产品信息(包括但不限于产品的优势、组件、性能、可用性和能力)等仅供参考,三星有可能对上述内容进行改进,且均无需通知或不受约束即可变更,具体信息请参照产品实物、产品说明书。除非经特殊说明,本文中所涉及的数据均为三星内部测试结果,本文中涉及的对比均为与三星产品相比较。Uw7ednc

 Uw7ednc

责编:胡安Uw7ednc

  • 模拟测试表明,在语音识别、翻译和聊天机器人等应用中,LPDDR5中的PIM技术可以将性能提高一倍以上,同时减少60%以上的能源使用量。”
  • 三星还没有透露这种内存何时会出现在智能手机上,目前只知道它的目标是在2022年上半年完成PIM技术的标准化。
  • 目前还不清楚这项技术有多强大,是否能处理图像处理和计算机视觉等更高级的任务。毕竟,许多智能手机的芯片组不仅能够运行高级机器学习任务,而且几乎所有旗舰设备都有专门的人工智能芯片。但是,理论上讲,具有processing-in-memory技术支持的RAM对于廉价手机来说是理想的,这样手机厂商就可以选择更便宜的芯片,让“智能”RAM来承担一些繁重的工作。
本文为EDN电子技术设计 原创文章,禁止转载。请尊重知识产权,违者本司保留追究责任的权利。
  • 微信扫一扫
    一键转发
  • 最前沿的电子设计资讯
    请关注“电子技术设计微信公众号”
  • 嵌入式FPGA IP时代终于来了? 嵌入式FPGA (eFPGA)由于可为AI工作负载提供支持与灵活度,这项业务正开始掀起波澜。如今,在将FPGA功能整合至SoC设计时,eFPGA可让设计者定义FPGA逻辑数、内存以及DSP处理能力...
  • Facebook正独立研发AI芯片,为视频需求自主造芯 据知情人士透露,Facebook正在开发新的机器学习芯片,其中一款AI推理芯片主要用于推荐算法等;另一款则主要进行视频转码任务,提高Facebook用户观看录制和直播视频的质量。如果Facebook成功,其芯片将会在性能有所提升的同时,变得更加便宜。同时,自研芯片还有助于Facebook降低数据中心的碳排放,并减少对英特尔、高通等芯片厂商的依赖。
  • 符合IEPE标准的CbM机器学习赋能平台 在工业应用中,基于振动检测的机器状态监控(CbM)越来越重要。公司寻求优化机械寿命和性能并降低拥有成本,同时有些企业试图围绕此类信息的提供开发新的业务模式。为了准确表示需要监控的机械,必须收集大数据集以确定设备在正常工作模式下和故障情况下的基线工作点。一旦收集到这些数据,便可创建算法或阈值检测例程来为该设备提供正确的分析。
  • 座头鲸基于LoRa的网关式智能产品赋能冷链物流行业物联 座头鲸将LoRa等最新物联网技术,与其在物联网智能硬件、定位导航和数据分析等领域的先进技术与经验相结合,为冷链产业全流程监控提供了端到端解决方案。
  • Microchip推出业界最紧凑的1.6T以太网PHY,可为云数据中 通过转换到112G PAM4接口速率,META-DX2L使路由器、交换机和线卡的带宽翻倍
  • 凌华科技推出边缘视觉分析软件开发套件EVA SDK加速边 EVA SDK助力用户在开发两周内即可完成边缘AI视觉应用概念验证
广告
热门推荐
广告
广告
EE直播间
在线研讨会
广告
广告
面包芯语
广告
向右滑动:上一篇 向左滑动:下一篇 我知道了