广告

英伟达、英特尔、ARM 将他们的AI未来押在FP8上

2022-09-19 16:02:19 综合报道 阅读:
据EDN电子技术设计报道,近日Arm、英特尔和NVIDIA携手发布了一份新的白皮书,描述了 8 位浮点规范和相应变体的概念,称为 FP8,具有变体 E5M2 和 E4M3,以提供可用于人工智能 (AI) 推理和训练的标准。期能通过8位元浮点运算的格式来改善运算性能,并将其作为AI通用的交换格式,提升深度学习训练推理速度;而该白皮书也已提交给电机电子工程师协会(Institute of Electrical and Electronics Engineers, IEEE)。

据EDN电子技术设计报道,近日Arm、英特尔和NVIDIA携手发布了一份新的白皮书,描述了 8 位浮点规范和相应变体的概念,称为 FP8,具有变体 E5M2 和 E4M3,以提供可用于人工智能 (AI) 推理和训练的标准。期能通过8位元浮点运算的格式来改善运算性能,并将其作为AI通用的交换格式,提升深度学习训练推理速度;而该白皮书也已提交给电机电子工程师协会(Institute of Electrical and Electronics Engineers, IEEE)。OOrednc

英伟达、ARM 和英特尔将目光投向 FP8“8 位浮点”,为他们未来的 AI 努力

从理论上讲,这三个科技巨头之间的这种新的跨行业规范将允许人工智能模型在硬件平台上工作和运行,将加速人工智能软件的开发。OOrednc

人工智能创新在软件和硬件方面已经愈加重要,在过去几年中,对 AI 计算的要求也持续增加,在解决计算差距方面,降低深度学习中对数值精度的要求,从而提高内存和计算效率,是目前AI 领域研究的重点之一。OOrednc

OOrednc

图片来源:“深度学习的 FP8 格式”,来自 NVIDIA、Arm 和英特尔。OOrednc

英特尔打算在其涵盖处理器、显卡和众多 AI 加速器的路线图中支持 AI 格式的规范。该公司正在开发一种加速器,即 Habana Gaudi 深度学习加速器。降低精度方法的承诺允许在专注于提高计算效率的深度学习神经网络中挖掘固有的抗噪声特性。OOrednc

OOrednc

图片来源:“深度学习的 FP8 格式”,来自 NVIDIA、Arm 和英特尔。OOrednc

新的 FP8 规范将减少与当前 IEEE 754 浮点格式的偏差,在软件和硬件之间保持舒适的水平,利用当前的 AI 实现,加速采用并提高开发人员的生产力。OOrednc

OOrednc

OOrednc

NVIDIA认为,拥有一种公用的交换格式,将能推动软件与硬件平台的互动,进而加快AI运算发展。也因此,NVIDIA、Intel和Arm携手合作,共同撰写FP8 Formats for Deep Learning白皮书,通过描述8位元浮点运算规格,提供一个共同的交换格式加速AI训练、推理。OOrednc

NVIDIA进一步解释,FP8规范有两个变体,分别是E5M2和E4M3,可最大限度减少与现有的IEEE 754浮点格式的偏差,能为AI训练、推理发展带来更大的自由度,得以在硬件与软件间取得良好平衡,以改善开发者的生产效率。OOrednc

根据实验结果,在广泛的训练架构中,像是Transformer,FP8训练的准确性都类似16位元结果,但却有更好的性能。譬如NVIDIA Hopper便利用新的FP8格式,在BERT高精度模型上实现了4.5倍的加速。OOrednc

NVIDIA强调,与Intel、Arm合作撰写FP8 Formats for Deep Learning白皮书,是希望通过开放、免费授权的方式,提供一个通用、可维持准确性的交换格式,以加速AI发展,并让AI模型在所有硬件平台上都能有一致、高效的表现。OOrednc

责编:Demi
  • 微信扫一扫
    一键转发
  • 最前沿的电子设计资讯
    请关注“电子技术设计微信公众号”
  • 复旦大学研究人员发明晶圆级硅基二维互补叠层晶体管 复旦大学研究团队将新型二维原子晶体引入传统的硅基芯片制造流程,实现了晶圆级异质CFET技术。相比于硅材料,二维原子晶体的单原子层厚度使其在小尺寸器件中具有优越的短沟道控制能力。
  • 西工大打破吉尼斯世界纪录,扑翼式无人机单次充电飞行15 据西北工业大学官宣其扑翼式无人机单次充电飞行时间获得新的吉尼斯世界纪录,认定的纪录时间为 2 小时 34 分 38 秒 62(突破 154 分钟)。本次刷新世界纪录的“云鸮”扑翼式无人机采用了高升力大推力柔性扑动翼设计、高效仿生驱动系统设计和微型飞控导航一体化集成等关键技术,翼展 1.82m,空载起飞重量为 1kg,手抛起飞,滑翔降落,能够按设定航线自主飞行,飞行过程中能实时变更航线。
  • 麻省理工开发出纸一样薄的太阳能电池,每公斤功率是传统 麻省理工学院称其工程师开发出超轻织物太阳能电池,可以快速轻松地将任何表面变成电源。这些耐用、灵活的太阳能电池比人的头发丝细得多,粘在坚固、轻便的织物上,使其易于安装在固定表面上。它们的重量是传统太阳能电池板的百分之一,每公斤产生的功率是传统太阳能电池板的18倍。
  • 英特尔展示下一代半导体器件技术,计划2030年实现万亿级 日前,英特尔在IEDM上展示多项与半导体制造技术相关的研究成果:3D封装技术的新进展,可将密度再提升10倍;超越RibbonFET,用于2D晶体管微缩的新材料,包括仅三个原子厚的超薄材料;能效和存储的新可能,以实现更高性能的计算;量子计算的新进展。此外,英特尔表示,目标是在2030年实现在单个封装中集成一万亿个晶体管。
  • 湖南大学:基于2D的范德华异质结构,可用于晶体管及存储器 电子工程研究的一个关键目标是开发高性能和高能效的计算设备,这意味着它们可以快速计算信息,同时消耗很少的能量。一种可能的方法是将执行逻辑操作的单元和存储组件组合到一个设备中。
  • 上海特斯拉前员工:Model Y生产中降低某项重要工艺规格, 据EDN电子技术设计了解,12月8日上午,账号为Laniakea_1188的微博用户公开举报特斯拉,称上海特斯拉在Model Y车型生产过程中,降低某项重要工艺规格问题线索,并指出如果该项变化的风险评估、白车身验证、整车验证不充分,将不能排除影响承载式车身强度乃至整车安全性的可能。
  • 矽递科技为荷兰养猪场打造基于LoRa®和LoRaWAN®的环 通过物联网技术监测养殖环境,为生猪健康提供有效保障
  • 在美国企业抵制之下,美国将放宽联邦机构及承包商使用中 这议案被视为美国《国防授权法案》(NDAA)的一项修正案,遭到美国商会和其他贸易组织的抵制。这些组织在上个月的一封信中称,企业要确定大量电子产品中的芯片是否是中国企业制造的,成本将很高,难度也很大。
  • 兆易创新瞄准4大行业入局模拟芯片,电源管理全产品组合 随着可穿戴设备、汽车电子、物联网、云计算等新兴应用的蓬勃发展,以及用户对于智能化生活越来越高的追求,同时伴随着工业、储能、5G通信等数字行业的产业升级和持续扩容,作为连接真实世界和数字世界的模拟芯片产品愈发展现广阔的应用潜力,并且市场规模持续增长。
  • 宝马要做太阳能汽车,大众入局氢能源,车企分开走不同新能 在目前的汽车市场中,新能源汽车已成大势所趋,虽然目前以电动汽车和混动汽车为主流,但受电池技术的限制,消费者仍期待更长的续航,更环保的能源也成了厂商关注的焦点,因此氢能源汽车和太阳能汽车也开始走入风口。
  • 台积电1nm制程工艺已实现技术突破,正谋划建1nm工艺工厂 近日有报道称台积电正积极推进1nm制程工艺,并们已在谋划1nm制程工艺工厂的建设事宜,以便按计划量产。早前EDN美国版曾报道台积电1nm制程工艺已实现技术突破,且逐渐成形。
  • 三星黑科技,突破指纹识别区域限制 三星正在研发一项屏幕指纹解锁的新技术,这项新技术可将指纹识别覆盖整个屏幕,无论用户手指放在屏幕的哪个位置,均能实现解锁。
广告
热门推荐
广告
广告
EE直播间
在线研讨会
广告
广告
面包芯语
广告
向右滑动:上一篇 向左滑动:下一篇 我知道了