8位浮点数成功训练出深度神经网络AI芯片-EDN 电子技术设计

 IBM研究人员开发出使用8位浮点数成功训练DNN的数字AI芯片，同时可在深度学习模型上保持原有的准确性，而其模拟AI芯片也采用了8位精度的内存乘法与相变内存...

随着在美国旧金山举行的国际电子组件会议(IEDM)以及在加拿大蒙特利尔举行的神经信息处理系统大会(NeurlPS)双双启动，对于任何希望迎头赶上人工智能(AI)研发进展步伐的人来说，最近正是把握庞大机会的最佳时刻。gugednc

例如，IBM研究人员介绍其打造数字和模拟AI芯片的新AI途径。IBM声称其数字AI芯片首次展现“使用8位浮点数成功训练深度神经网络(DNN)，同时在一系列深度学习模型和数据集上完整保持准确性(accuracy)。”gugednc

另外，IBM研究人员在IEDM还展示了一款模拟AI芯片，采用了8位精度(precision)的内存(in-memory)乘法以及相变内存。gugednc

IBM Research-Almaden副总裁兼实验室主任Jeffrey Welser在接受《EE Times》访问时指出，“我们确实认为目前进行中的这些工作——例如试图降低精度以提高性能提升并降低功率——对于持续推进AI非常重要。”。gugednc

这一点至关重要。Weiser解释说，因为这个世界正从“狭义AI”(narrow AI)转变为“广义AI”(broad AI)，例如我们从“用AI在因特网上辨识猫”进展到“分析医学影像，或者我们希望能够将文本和成像信息整合在一起，以提出解决方案”。gugednc

他补充说：“所有这些更广泛的问题需要更大的神经网络、更大的数据集和多模态数据集...... （为此），我们需要改变架构和硬件来实现这一切。”gugednc

Weiser认为IBM发表的两篇论文可看出“一连串有趣的进展”，有助于使业界走向（广义AI）的未来。gugednc

市场研究公司Linley Group总裁兼首席分析师Linley Gwennap说：“机器学习继续迅速发展。现有硬件无法有效处理研究人员建构的最大神经网络，因此他们正在寻找各种新方法来提高性能和效率。”gugednc

Gwennap补充说，这些新的发展将会对于硬件供应商带来巨大压力，因为芯片公司“必须灵活、快速地在这个混乱的市场中生存”。gugednc

AI的GPU时代结束

IBM大胆预测GPU在AI领域的主导地位即将结束。gugednc

Welser说：“GPU能够为绘图处理进行大量的平行矩阵乘法运算。这种矩阵乘法恰巧与神经网络所需的完全相同。”在他看来，“这有点巧合，但它非常重要。因为没有那些（GPU），我们永远无法达到我们目前已在AI实现的性能。”但是，Welser补充说，“随着我们更能掌握关于如何实现AI的更多知识，目前也正着手寻找方法设计一种更高效的硬件。”gugednc

降低精度

提高效率的途径之一是降低AI处理所需的精度。gugednc

Welser解释说，“几年前我们开始意识到一个大方向是，虽然习惯于非常精确的计算——以32位计算浮点作为标准，甚至64位，才能为真正准确的计算类型倍增精度，但这一点在AI中并不一定非常重要。”gugednc

他强调，在AI中，“对于神经网络在意的是当你展示一个影像或单词时，它是否能得到正确的答案。当我们问它是猫还是狗时，它回答说是一只猫。如果答案正确，你并不一定会注意到其间进行的所有计算过程。”gugednc

理想情况下，AI应该模仿人眼。Welser说：“如果你从一扇起雾的窗子看出去，你看到一个人走在街上。这是一个低度定位的影象...但是你可能经常会说‘喔，那是我妈走过来了！’所以，只要你得到正确的答案，视觉影像是否正确精准其实是无关紧要的。”gugednc

他解释说，这就解释了AI处理中精度逐渐较低的趋势。gugednc

Welser继续说道：“对于32位计算，我必须在32位上进行计算。如果我们可以在16位上进行，那基本上只需要一半的计算能力，或者可能是芯片面积的一半甚至更少。如果你可以再降低至8位或4位，那就更好了。”他说，“所以，这让我在面积、功率、性能和吞吐量方面获得了巨大的胜利——我们能够以多快的速度完成这一切。”gugednc

gugednc

（来源：IBM Research）gugednc

然而，Welser坦承，“很长一段时间，我们认为我们必须持续使用32位精度进行AI培训，当时别无他法。”gugednc

2015年，IBM Research发表了针对传统CMOS技术的新型数据流相关文章，推出为AI模型训练与推论而降低精度的途径。IBM展示以16位精度的训练模型，其准确度约相当于32位训练模型，而不至于牺牲准确度。gugednc

从那时起，IBM观察到“降低精度的方法很快地被采纳为业界标准，16位训练和8位推论如今已经司空见惯，并促使新创公司和创投业者(VC)投资大量涌入，投入打造降低精度的AI芯片。”尽管存在这样一种新兴趋势，但由于人们需要保持模型的高准确度，因此，小于16位的“训练”几乎不可能实现。gugednc

如何实现？

Welser说IBM开发一连串让研究人员可应用于AI处理的方法，实现了这一目的。例如，他说，“我们确实有一部份以8位来做，有些部份采用16位进行累积，而其他部份则以不同组件实现，所以不至于失去精度。”gugednc

换句话说，比起普遍将8位计算应用于整个操作，IBM团队的研究成果更加复杂，但研究人员找到了各种方法组合，分别应用于流程的不同部份。gugednc

Welser证实，“没错，这完全正确。例如，我们现在可以使用8位进行所有的权重更新过程，但仍然使用16位进行一些加法和累积步骤过程。事实证明这非常重要，因为16位加法比16位乘法更容易，所以实际上以16位的方式执行它是有帮助的。”gugednc

也许更重要的是，正如Welser所指出的，IBM的研究成果关键在于“提出一种数据流架构，让数据以非常流畅的方式流经芯片，而且以这种方式运行最终也不至于造成瓶颈。”gugednc

最后，“我们证明您可以有效地使用8位浮点，以取得较过去人们使用16位或32位相同的准确度。”gugednc

8位操作的障碍？

Linley Group的Gwennap表示，最新的GPU和AI芯片支持使用IEEE定义格式的16位浮点(FP16)。gugednc

然而，他补充说，“尽管如此，大多数开发人员还在使用FP32训练神经网络。”他说，“8位FP的问题在于缺乏标准格式，只有几种可能的指数组合和有意义的尾数。在标准(IEEE或某些非正式协议)建立之前，芯片制造商将发现难以在硬件中有效实施。”gugednc

那么在商业世界多久才开始使用8位精度进行训练？Welser说目前还不得而知，因为“我们现在看到第一次使用16位技术的情况越来越多，但是产业界大部份还是着眼于32位…。”gugednc

然而，他强调说他并未看到任何降低精度的实际障碍，“只要我们能够显示出相同输出的结果。”他指出，从用户的角度来看，“如果芯片速度更快、耗功更低，价格更便宜，而且也能得到同样的答案，就没什么好计较的了。”gugednc

当然，在其下的软件基础设施修改必发挥作用。gugednc

Welser证实，“你必须拥有能够降低精度的软件或算法，使其得以正确执行。”由于现在所有的软件架构都是为使用GPU和32位而建构的，“所有的一切都必须为接受16位或8位而进行修改。”gugednc

在用户存取实际硬件之前，业界可能持续使用已知的内容。gugednc

8位精度的内存乘法

IBM在IEDM展示该公司所谓的8位精度内存乘法以及设计中的相变内存(PCM)。gugednc

gugednc

在IEDM上，IBM科学家发表了一项关于新型内存内运算(in-memory computing；IMC)装置的研究，它比起当今的商业技术达到了更低100-1000倍的运算能耗级。该组件非常适用于边缘AI应用，例如自动驾驶、医疗保健监控和安全性（来源：IBM Research）gugednc

工程界已经意识到，降低能耗的关键是尽量减少运算架构中出现数据必须从内存移至处理器进行运算的机会。这种移动需要耗负大量的时间和精力。gugednc

对于更高效AI处理的需求促使许多人致力于研究内存内运算。Mythic在追逐这一点的AI芯片新创公司中脱颖而出，但其后还可能出现更多竞争对手。gugednc

在Welser看来，模拟技术“很自然地适于边缘AI。」正如从运算发展史的观察，模拟运算需要低功耗，证明它具有高能效。但它也不准确。”Welser说：“这就是为什么数字运算最终胜过模拟运算。”gugednc

但是，Tirias Research首席分析师Kevin Krewell表示，模拟正在回归中，因为“内存内运算与模拟运算可以相互搭配。”他解释说：“内存数组保持神经网络权重，模拟组件则执行总和和触发。”gugednc

Krewell补充说，“挑战在于保持模拟的正确校准，以及过程和温度变化的准确性。此外，内存和模拟组件也不像数字组件那样扩展。”gugednc

权重是内存的阻值

同样地，Welser解释说，模拟运算中神经网络使用的权重是“存在于内存内部的阻值”。它们不必移入和移出，都是固定的。Welser说：“换句话说，由于采用内存内运算架构，内存单元兼作处理器，有效地实现了储存和运算的双重任务。”gugednc

然而，Welser所说的挑战是：“我们将要使用的是什么阻值状态？它能使我们在训练时将其设置为各种不同的阻值吗？它必须够准确才可用。”gugednc

Welser解释说，虽然数字AI硬件会降低精度，但模拟至今一直受到内部精度相对较低的限制，从而影响了模型精度。gugednc

在开发接近8位精度的能力时，IBM使用了相变内存(PCM)。Welser说，PCM长久以来一直用于模拟内存。在此情况下，“我们使用PCM来回储存更多不同的阻值。更重要的是，我们正使用一种新颖的架构。”gugednc

IBM的论文详细介绍在纯量乘法运算中实现8位精度的技术。该公司声称，这导致“以往的模拟芯片准确度提高了大约一倍，而且也比同类精度的数字架构功耗更低33倍”。gugednc

Gwennap坦言IBM已经在PCM上研究一段时间了，但他称之为“仅仅是一项研究计划”。gugednc

Gwennap认为这种PCM途径的最大挑战在于可制造性。“模拟特性因不同的晶体管以及产在线的不同芯片而异，这就是为什么大多数产业都使用较不易受这种变化影响的数字电路。”gugednc

《EE Times》向Linley Group和IBM分别询问了商用AI芯片(如Mythic)使用内存内运算架构的情况。Gwennap说：“Mythic似乎最接近于将这项技术投入生产，但即使如此也还需要至少一年的时间。”gugednc

IBM承认，“Mythic采用了一种专注于使用内存内运算的有趣方法。”然而，IBM也指出，Mythic的芯片“仅适用于推论应用”。gugednc

根据IBM发言人，IBM的不同之处是：“我们相信完整的AI解决方案需要加速推论和训练。我们正在开发可用于推论和训练的非挥发性内存组件，并使其发展得更成熟。”gugednc

（原文发表于ASPENCORE旗下EDN姐妹网站EETimes，参考链接：IBM Guns for 8-bit AI Breakthroughs，编译：Susan Hong，EET Taiwan）gugednc

本文为电子技术设计原创文章，未经授权禁止转载。请尊重知识产权，违者本司保留追究责任的权利。

阅读全文，请先

Junko Yoshida

ASPENCORE全球联席总编辑，首席国际特派记者。曾任把口记者（beat reporter）和EE Times主编的Junko Yoshida现在把更多时间用来报道全球电子行业，尤其关注中国。她的关注重点一直是新兴技术和商业模式，新一代消费电子产品往往诞生于此。她现在正在增加对中国半导体制造商的报道，撰写关于晶圆厂和无晶圆厂制造商的规划。此外，她还为EE Times的Designlines栏目提供汽车、物联网和无线/网络服务相关内容。自1990年以来，她一直在为EE Times提供内容。

进入专栏

人工智能产业前沿处理器/DSP

上一篇： 用10美元给机器打造一个数字鼻子！ 下一篇： 自动驾驶时代，传感器百家争鸣

微信扫一扫
一键转发
最前沿的电子设计资讯
请关注“电子技术设计微信公众号”

2025松山湖中国IC创新高峰论坛：继续聊聊机器人去年的主题是智慧机器人，今年的主题仍然聚焦于机器人身上，不过变为了具身智慧机器人……
鹏瞰TS-PON Gen2芯片，用光协议重塑机器人“神经网络” TS-PON Gen2芯片是一款灵活的软件定义 SoC，适用于多种场景。它基于无源光网（PON）技术，具备高带宽（目前10G，未来可拓展至25G、50G）、低时延（微秒级）、高确定性等特性···
让人形机器人“耳聪目明”，昆泰芯KTM5900磁性编码器解编码器芯片作为机器人的核心传感器之一，对于提升机器人的感知能力、安全性和生产效率具有重要意义···
如何让具身机器人“看”得清？思特威给出了这个答案相比于滚动快门传感器，全局快门传感器能够同时曝光整个画面，有效避免了运动过程中产生的图像形变，为机器视觉提供高精度、无畸变的图像···
极海推出全球首款双核Cortex-M52实时控制MCU/DSP 随着机器人技术的不断发展，其应用领域从传统的工业制造逐步拓展至医疗、农业等多个新兴领域，这对机器人的控制系统提出了更高的要求，当前机器人控制系统当前主要面临高爆发、高动态、高精度和高安全这四方面的挑战···
比人类更灵活？先楫HPM6E8Y机器人关节控制解决方案 HPM6E8Y通过硬件加速器将电机控制算法执行时间缩短至2.8μs，以全链路高实时通信与多轴协同能力，开启机器人关节“芯”时代。
为旌科技感算控一体化芯片落地，带来6倍效率提升？具身智能的本质是‘大脑（认知）+小脑（控制）+感官（感知）’的协同进化，需要芯片层面实现三者深度融合。
爱芯元智发布AX8850：让AI算力更便宜，让智能更可及爱芯元智希望把算力做得更加便宜具智价比，普惠AI，让我们的边缘智能更加触手可及···
万有引力EB100芯片亮相，空间计算走向低功耗新时代？ EB100芯片将为XR和机器人行业带来更好、更低功耗的空间计算和显示能力，开启空间计算时代的无限可能···
芯驰D9 Max：为具身智能而生的高性能SoC，一颗芯片顶五颗我们希望以1个芯片完成5个芯片完成的事情。当应用发生爆炸性的变化，融合一定是一个非常大的趋势，而且融合的过程会使软件的开发更简单，系统的开发更简单，成本控制得更好···
情境感知AI：利用FPGA技术增强边缘智能现场可编程门阵列（FPGA）的灵活性、现场升级能力和互操作性，结合其低功耗、低延迟和并行处理能力，使其成为开发者克服挑战并优化情境边缘AI应用的关键工具。
ADAS 系统中的传感器创新如何在道路交通中挽救生命在本文中，我们将探讨 ADAS 在提高道路安全方面的作用，以及各种对实现这一目标至关重要的传感器技术。

25年第19周新能源周销量：不同价格带的车型走势解析本周插混与增程车型市场呈现出“两极化”趋势：一方面，10-15万元级的主流家用轿车与SUV销量强劲；另一方面，20万元
拆解报告：甲骨文3060W碳化硅服务器电源模块甲骨文服务器电源模块输入输出均为专用接口，采用热拔插设计。电源模块支持200-277V交流和240-380V直流输入，输
评测：森海塞尔ACCENTUM Open真无线耳机半入耳机森海塞尔ACCENTUM Open 真无线耳机采用半入耳式设计，搭配约4.4克的重量，佩戴舒适。耳机充电盒轻盈小巧，携带外
人形机器人如何做到“手眼”协同+“大小脑”协同？人形机器人正站在“走出实验室”的临界点。从本体制造、控制系统、核心零部件到应用场景拓展，技术与产业生态
南非2025年4月：奇瑞和长城汽车快速上升 2025年4月的南非车市增长，马恒达和现代的强劲回归是一个信号，而中国品牌的集体崛起，则预示着未来竞争将更加多
4月新能源车领跑汽车出口增长，中国汽车走向全球的新引擎 2025年开年以来的出口数据呈现出清晰的结构升级路径。新能源产品在出口中扮演的角色日益重要，不再只是锦上添
拆解报告：vivo手机原装90W氮化镓闪充充电器 vivo 90W氮化镓闪充充电器采用经典直板造型设计，同时附带一条专门量身定制的8.5A大电流数据线，配合信号屏蔽层
拆解报告：HONOR荣耀手环10 荣耀手环10在外观方面，延续了上代的轻薄双曲面设计，同时采用全新的双色NCVM镀膜工艺，使之更加的时尚精致。标配
2025年4月中国车企加速渗透土耳其市场：比亚迪Seal U打响突围战 2025年4月，土耳其市场的爆发式增长为全球车企提供了重要信号：新兴市场正在进入电动化转型的加速期，而土耳其作
2025年第19周新能源周销量：问界起势 2025年第19周，中国乘用车市场的周度销量达到44.4万辆，其中新能源车占比突破50%，达22.3万辆，占比50.2%。比亚迪体
2024年4月汽车市场终端数据：自主崛起、新势力分化、合资承压从整体销量数据来看，4 月汽车终端销量达 169.7 万，同比增长 9.3% ，在目前的价格力度下，这个销售数字差强人意。2
拆解报告：华为750W钛金牌服务器电源华为这款服务器电源型号为PAC750S12-TE，支持220V交流或240V直流输入，输出电压为12V，输出电流为62.5A，输出端设有

史密斯英特康推出新一代“ DaVinci Gen V”测试插座史密斯英特康推出新一代“ DaVinci Gen V”测试插座，为人工智能、6G通信及先进计算应用领域的芯片提供超
意法半导体高集成度低边电流测量放大器简化高准确度电流检测意法半导体的 TSC1801低边电流测量放大器集成了设定增益所需的匹配电阻，从而简化了电路设计，节省了物料清单
意法半导体推出创新的、带有可改变存储配置存储器的车规微控制器新推出的Stellar微控制器内置了xMemory技术，它为正在发展的软件定义汽车以及不断进化的电动汽车架构提供了一
新系列串口EEPROM内置唯一ID码，适合设备识别、溯源和可持续性应用意法半导体 (ST) 推出了一系列内置128位唯一只读ID码 (UID) 的串口EEPROM芯片，以满足市场对产品识别、溯
Vishay新添增强短瞬态脉冲防护性能的经AEC-Q200认证的厚膜功率电这些器件采用夹片式TO-247 封装形式，可直接安装在散热器上，具有高达 75 J/0.1 s的高脉冲吸收能力和 150
凉棚集成Nordic 技术实现Matter over Thread连接为家庭和企业 StruXure+ 凉棚和小屋系列集成 Nordic 的 nRF5340 SoC以提供无缝的 Matter over Thread 连接
智能楼宇技术全球领导者与Nordic Semiconductor携手合作确保楼业界连手推动NR+成为智能楼宇的全球连接标准···
Cadence 率先推出 eUSB2V2 IP 解决方案，助力打造高速连接新范 Cadence 在业内率先推出 eUSB2V2 IP，此 IP 基于先进的台积公司 N3P 工艺，符合最新的嵌入式 USB2 版
纳芯微发布双通道电流检测放大器NSCSA285，赋能工业与能源管理近日，上海 —— 纳芯微电子（简称“纳芯微”）发布全新高精度双通道电流检测放大器NSCSA285系列···
攻克PWM高频瞬态干扰难题！纳芯微发布车规级电流检测放大器NSCSA24 近日，纳芯微发布全新车规级双向电流检测放大器NSCSA240-Q1系列，专为汽车高压PWM系统打造解决方案···
TE Connectivity 推出INMORO系列：致力于满足中国市场需求而打造的连接和传感解决方案提供商泰科电子（TE Connectivity，以下简称 TE）工业事业部隆重推出INMORO 系列，致力于满足中
破解汽车与工业等应用新挑战，TDK展示多传感器融合与AI+发展趋势在新能源汽车应用中，热管理系统既要能高效地冷却和加热电池、电机与OBC等车辆核心部件，确保其处于最佳运行温

热门评论
最新评论

换一换

杂志声明

8位浮点数成功训练出深度神经网络AI芯片