广告

三星想把PIM用于HBM之外的领域

2021-08-30 17:35:46 Gary Hilson 阅读:
如何看待带有 HBM2-PIM 的 Aquabolt-XL 用于机器学习(ML ) 加速器和其他人工智能 (AI) 应用。

三星在使内存处理 (PIM) 技术成为主流方面又迈出了一步。其支持 PIM 的高带宽内存 (HBM-PIM) 首次成功集成到商业化加速器系统中,这是将 PIM 技术集成到其他内存类型的愿景的一部分。5loednc

今年2月,三星推出了其首个HBM-PIM(Aquabolt-XL),将AI处理能力整合到三星HBM2 Aquabolt中,以增强超级计算机和AI应用的高速数据处理能力。随后,HBM-PIM在赛灵思(Xilinx)Virtex Ultrascale+(Alveo)AI加速器中进行了测试,它提升了近2.5倍的系统性能,并降低超过60%的能耗。5loednc

三星内存业务部高级副总裁 Nam Sung Kim 概述了公司如何看待带有 HBM2-PIM 的 Aquabolt-XL 用于机器学习(ML ) 加速器和其他人工智能 (AI) 应用。5loednc

他表示,由于各种物理和热限制,新兴 ML 和 AI 应用的内存带宽需求快速增长,且更加昂贵和耗电。“由于PCB导线和芯片封装、及功率的限制,继续增加带宽变得非常困难和昂贵。”5loednc

5loednc

图:Nam Sung Kim。5loednc

Kim 表示,通过让处理器更接近内存,PIM 可以提高受内存限制的工作负载的性能和能源效率。5loednc

虽然PIM 并不是一个新想法,但对主机处理器和/或应用代码进行必要更改是阻碍行业广泛采用的一个关键障碍。5loednc

Aquabolt-XL瞄准是低算术密度的内存绑定负载,例如语音识别和自然语言处理,但 Kim 表示它并不打算与 AI 加速器中的机器学习竞争。相反,它旨在补充处理器的计算能力。“我们可以针对各种工作负载提高系统的性能和效率。”5loednc

图:三星的 Aquabolt-XL HBM2-PIM 的架构是 HBM2 的直接替代品,并与符合 JEDEC 的 HBM2 内存控制器完全兼容。(图片来源:三星5loednc

PIM应用之外的HBM5loednc

三星也在 HBM 之外寻找 PIM 应用程序。Kim 表示,公司正在使用 PIM 以加速 DIMM (AXDIMM) 的形式为 DRAM 模块本身提供处理能力。这最大限度地减少了 CPU 和 DRAM 之间的大量数据移动,以提高 AI 加速器系统的能效。5loednc

由于 AI 引擎内置于缓存芯片内部,AXDIMM 可以并行处理多个内存列(一组 DRAM 芯片),而不是一次只访问一个列。5loednc

图:与 HBM-PIM 一样,三星的 AXDIMM 可以作为 DRAM 替代品使用,无需任何系统修改,并且在缓存芯片中内置了一个 AI 引擎来执行多个内存列的并行处理。(图片来源:三星)5loednc

 5loednc

胡安节选编译自 EETimes,Samsung Expands PIM Ambitions 。5loednc

本文为电子技术设计原创文章,未经授权禁止转载。请尊重知识产权,违者本司保留追究责任的权利。
Gary Hilson
EE Times特约编辑。Gary Hilson是一位自由撰稿人和编辑,曾为北美地区的印刷和电子出版物撰写过大量稿件。 他感兴趣的领域包括软件、企业级和网络技术、基础研究和教育市场,以及可持续交通系统和社会新闻。 他的文章发表于Network Computing,InformationWeek,Computing Canada,Computer Dealer News,Toronto Business Times,Strategy Magazine和Ottawa Citizen。
  • 微信扫一扫
    一键转发
  • 最前沿的电子设计资讯
    请关注“电子技术设计微信公众号”
  • Nothing Phone 1 官方承认品控缺陷,但拆解后有新发现 前一加手机联合创始人裴宇创立的 Nothing 公司在国外备受关注,但Nothing Phone 1发布之后却被网友爆料大量翻车现场。目前官方也已承认了Nothing Phone 1 在前摄开孔位置附近出现了坏点或绿晕的问题。但Nothing Phone 1也并非一无是处,著名的 JerryRigEverything 耐用性测试就称其“超级坚固”。
  • 拆解一个中国产的“树莓派”开发笔记本,售价279美元值 “树莓派”在全球市越来越受欢迎,甚至有家长开始让孩子用树莓派学习开发产品。有中国厂商嗅到,率先开发出了基于“树莓派”笔记本——CrowPi L ,外观看和普通笔记本差不多, 但却是基于树莓派Raspberry Pi 4B 开发板的套件,专为 STEM 教育而设计,带有可选的电子模块和教程。EDN发现有外媒对其进行了拆解,接下来将这篇拆解文章分享给大家:
  • 售价将超50万美元,乔布斯的Apple-1原型机电路板长什么 这块在 1976 年由史蒂夫-沃兹尼亚克手工焊接的 Apple Computer A 印刷电路板被史蒂夫-乔布斯用来向保罗-特雷尔演示 Apple-1 电脑,后者是加州山景城 The Byte Shop 的老板。这台原型机在“苹果车库”里保存了很多年,然后在大约 30 年前由史蒂夫-乔布斯交给了它现在的主人。当时,乔布斯已被苹果公司赶走。乔布斯当时认为这个原型不是要供奉的东西,而是要被重新利用的东西。
  • iFixit 拆解M2 MacBook Ai:没有散热器,但有用途不明的加 日前,iFixit发表了M2 MacBook Air的拆解视频,表示在M2 MacBook Air 中发现了新增的端口,以及加速度计。
  • M2 Pro 和 M2 Max 或是苹果首款采用台积电3nm 工艺的 M1 Pro 和 M1 Max 最多可配置 10 核 CPU 和 32 核 GPU。借助 M2 Pro 和 M2 Max,Apple 有望突破这一门槛,为这两个领域带来更多的核心数量。目前M2 Pro相关的爆料很少,但据称M2 Max 有12 核 GPU 和 38 核 GPU。12 核 CPU 将包括 10 个性能核心和两个能效核心。
  • “智能家居”未来将可通过呼吸控制操作 凯斯西储大学的研究人员创造了一个简单的原型设备,使用户能够通过改变他们的呼吸模式来控制“智能家居”。这种自供电装置可放入鼻孔,并有可能提高行动不便或无法清晰说话的人的生活质量。如果个人呼吸困难,它也可以编程为医务人员提供自动警报。
  • 适用于CSP GaN FET的简单高性能散热管理解决方案 本文将演示芯片级封装(CSP) GaN FET提供的散热性能为什么至少能与硅MOSFET相当,甚至更胜一筹。GaN FET由于其卓越的电气性能,尺寸可以减小,从而能在不违背温度限制的同时提高功率密度。本文还将通过PCB布局的详细3D有限元仿真对这种行为进行展示,同时还会提供实验验证,对分析提供支持。
  • 研究人员开发出新设计框架,用于构建下一代模拟计算芯片 印度科学研究所 (IISc) 的研究人员开发了一种设计框架,用于构建下一代模拟计算芯片组,与目前大多数电子设备中的数字芯片相比,该芯片组速度更快、功耗更低。
  • 小米12s系列发布:首款徕卡品牌、1 英寸摄像头传感器、 继一加牵手哈苏(HASSELBLAD)以及 Vivo 牵手蔡司之后,小米和徕卡在今年早些时候也宣布建立合作伙伴关系。小米在六月底宣布,小米 12S 系列将成为该交易的第一批手机,就在昨日,小米举办了小米12S系列新品发布会,包括小米12S、小米12S Pro、小米12S Ultra三款手机,这三款手机均提供徕卡 Summicron 镜头以减少眩光并提高透光率,同时还提供徕卡成像配置文件。
  • 雷军官宣自研电池管理芯片“澎湃 G1”,及小米 12S系列 今日(7月1日),雷军在个人微博官宣新的自研芯片——小米澎湃G1电池管理芯片,该芯片将于7月4日与小米12S系列共同发布。此外,还分享了小米电池技术新进展、小米自研FBO焕新存储技术以及最新升级的叶脉冷泵散热技术。
  • AI视觉芯片如何赋能两轮车出行? 6月29日,在由全球领先的专业电子机构媒体AspenCore和深圳市新一代信息通信产业集群联合主办的“2022国际AIoT生态发展大会-智慧两轮车分论坛”中,嘉楠科技副总裁汤炜伟以《勘智AI视觉芯,赋能智眼两轮行》为主题,向大家分享了嘉楠地芯片设计创新历程,及其RISCV架构AI芯片技术路线图,并以具体案例展示AI视觉芯片如何赋能两轮车出行。
  • Arm发布第二代 Armv9 CPU及首款移动端支持光追的GPU 日前,Arm推出了基于Armv9架构新一代的CPU,包括Arm Cortex-X3、Arm Cortex-A715等,同时还带来了其首款在移动端支持硬件光线追踪的GPU——Immortalis GPU。这是自Arm去年3月发布全新v9架构、5月发布第一代基于v9架构产品后的第二次更新。
广告
热门推荐
广告
广告
EE直播间
在线研讨会
广告
广告
面包芯语
广告
向右滑动:上一篇 向左滑动:下一篇 我知道了