广告

英伟达、英特尔、ARM 将他们的AI未来押在FP8上

2022-09-19 16:02:19 综合报道 阅读:
据EDN电子技术设计报道,近日Arm、英特尔和NVIDIA携手发布了一份新的白皮书,描述了 8 位浮点规范和相应变体的概念,称为 FP8,具有变体 E5M2 和 E4M3,以提供可用于人工智能 (AI) 推理和训练的标准。期能通过8位元浮点运算的格式来改善运算性能,并将其作为AI通用的交换格式,提升深度学习训练推理速度;而该白皮书也已提交给电机电子工程师协会(Institute of Electrical and Electronics Engineers, IEEE)。

据EDN电子技术设计报道,近日Arm、英特尔和NVIDIA携手发布了一份新的白皮书,描述了 8 位浮点规范和相应变体的概念,称为 FP8,具有变体 E5M2 和 E4M3,以提供可用于人工智能 (AI) 推理和训练的标准。期能通过8位元浮点运算的格式来改善运算性能,并将其作为AI通用的交换格式,提升深度学习训练推理速度;而该白皮书也已提交给电机电子工程师协会(Institute of Electrical and Electronics Engineers, IEEE)。hnSednc

英伟达、ARM 和英特尔将目光投向 FP8“8 位浮点”,为他们未来的 AI 努力

从理论上讲,这三个科技巨头之间的这种新的跨行业规范将允许人工智能模型在硬件平台上工作和运行,将加速人工智能软件的开发。hnSednc

人工智能创新在软件和硬件方面已经愈加重要,在过去几年中,对 AI 计算的要求也持续增加,在解决计算差距方面,降低深度学习中对数值精度的要求,从而提高内存和计算效率,是目前AI 领域研究的重点之一。hnSednc

hnSednc

图片来源:“深度学习的 FP8 格式”,来自 NVIDIA、Arm 和英特尔。hnSednc

英特尔打算在其涵盖处理器、显卡和众多 AI 加速器的路线图中支持 AI 格式的规范。该公司正在开发一种加速器,即 Habana Gaudi 深度学习加速器。降低精度方法的承诺允许在专注于提高计算效率的深度学习神经网络中挖掘固有的抗噪声特性。hnSednc

hnSednc

图片来源:“深度学习的 FP8 格式”,来自 NVIDIA、Arm 和英特尔。hnSednc

新的 FP8 规范将减少与当前 IEEE 754 浮点格式的偏差,在软件和硬件之间保持舒适的水平,利用当前的 AI 实现,加速采用并提高开发人员的生产力。hnSednc

hnSednc

hnSednc

NVIDIA认为,拥有一种公用的交换格式,将能推动软件与硬件平台的互动,进而加快AI运算发展。也因此,NVIDIA、Intel和Arm携手合作,共同撰写FP8 Formats for Deep Learning白皮书,通过描述8位元浮点运算规格,提供一个共同的交换格式加速AI训练、推理。hnSednc

NVIDIA进一步解释,FP8规范有两个变体,分别是E5M2和E4M3,可最大限度减少与现有的IEEE 754浮点格式的偏差,能为AI训练、推理发展带来更大的自由度,得以在硬件与软件间取得良好平衡,以改善开发者的生产效率。hnSednc

根据实验结果,在广泛的训练架构中,像是Transformer,FP8训练的准确性都类似16位元结果,但却有更好的性能。譬如NVIDIA Hopper便利用新的FP8格式,在BERT高精度模型上实现了4.5倍的加速。hnSednc

NVIDIA强调,与Intel、Arm合作撰写FP8 Formats for Deep Learning白皮书,是希望通过开放、免费授权的方式,提供一个通用、可维持准确性的交换格式,以加速AI发展,并让AI模型在所有硬件平台上都能有一致、高效的表现。hnSednc

责编:Demi
  • 微信扫一扫
    一键转发
  • 最前沿的电子设计资讯
    请关注“电子技术设计微信公众号”
  • 3分钟充满电,新固态锂金属电池成为电动汽车新选择 这款电池使用的是纯金属形式的锂,而不是目前市场上电动汽车电池所用的锂离子。在实验室中,该团队的电池原型实现了充电速度快至3分钟的,并且在生命周期内可循环超过1万次。研究人员表示,目前,即使是同类中最好的电池也只有2000—3000次充电循环,这项技术可能会“改变游戏规则”。
  • 高通骁龙8 Gen 2 或推出两种型号 据EDN电子技术设计了解,高通骁龙8 Gen 2 很可能会在11月15日至17日高通举行的年度 Snapdragon 峰会期间发布,据最新消息称,该公司可能正在准备两种变体,每种变体适用于不同级别的 Android 智能手机。
  • 东芝设计一种双传感耦合器,在量子计算机结构方面取得突 东芝公司最近设计了一种双传感耦合器,可以完全开启和关闭频率明显不同的量子比特之间的耦合。完全打开可以实现强耦合的高速量子计算的同时完全关闭则可以消除残余耦合,从而提高量子计算速度和精度。
  • 谷歌与美国政府合作开发开源芯片 谷歌和美国商务部的国家标准与技术研究院 (NIST) 周三 签署了一项联合研发协议 ,根据该协议,谷歌将资助开源芯片的生产,这些芯片可供学术和小型企业研究人员用于构建各种的新兴应用。
  • 用交通状况鸟瞰图来辅助提升自动驾驶安全性 慕尼黑工业大学 (TUM) 的研究人员与行业合作伙伴合作开发了一种技术,以基于车载传感器输入和交通状况鸟瞰图来补充车辆视角。这提高了道路安全,包括自动驾驶。
  • 芯片,举足轻重到底有多重? 近几年,芯片成为全球瞩目的焦点。新冠疫情导致的供应链危机,以及汽车智能化的快速发展,让芯片的价格持续暴涨。同时,由于众所周知的原因,中美两国在半导体芯片领域不断加大投资。而美国利用在半导体技术方面的优势,也在不断用政策手段限制中国芯片行业的发展。在这种大背景下,中国企业能否在半导体芯片领域有所突破,打破美国的技术垄断?各国在半导体领域的投资热潮,会不会导致产能过剩?
  • 台积电2nm将于2025年量产,ASML高NA EUV芯片制造机2024 今日,台积电负责研发和技术的高级副总裁Y.J. Mii博士透露,台湾半导体制造公司(TSMC)将在2024年收购ASML的高NA EUV芯片制造机,目标是在2025年量产其2纳米(nm)半导体制造工艺。
  • 苹果A16 Bionic架构优化,多核性能提高了14% 据EDN电子技术设计了解,苹果最新的A16 Bionic虽然使用与A15 Bionic相同数量的内核,但A16 Bionic在架构方面进行了优化。
  • 基于苹果A13仿生芯片,S8芯片配备与S6/S7相同CPU Apple Watch Series 6、Apple Watch Series 7、Apple Watch Series 8、Apple Watch Ultra和第二代Apple Watch SE都采用完全相同的CPU。
  • eSIM与SIM有什么区别?能否终结物理SIM卡? 嵌入式 SIM (eSIM) 是一种采用物理 SIM 卡中通常存在的电路并将其永久安装到移动设备中的技术。通过设置例程(通常涉及来自运营商的二维码),移动设备无需物理 SIM 卡即可加入运营商网络。
  • 英特尔演示世界最高速度WiFi 7,速度超5Gbps Intel基于酷睿笔记本电脑展示了Wi-Fi 7的演示,其Wi-Fi 7解决方案连接到了博通的Wi-Fi 7接入点。
  • 号称史上最硬智能手表,Apple Watch Ultra维修费用超售 苹果带来了全新的 Apple Watch Ultra 运动手表,被称为史上最坚固、最硬的Apple Watch。然而,每个硬件都有极限,如果你不小心损坏它,它可能会花费499 美元的维修费用,这几乎是这款智能手表60%的售价。
广告
热门推荐
广告
广告
EE直播间
在线研讨会
广告
广告
面包芯语
广告
向右滑动:上一篇 向左滑动:下一篇 我知道了