广告

Arm新发布的AI 加速器和参考设计平台强在哪?

2024-04-15 11:00:11 夏菲 阅读:
近年来,随着Transformer和大型模型的发展,AI 模型的普适性、多模态支持,以及模型微调效率都有了质的突破,此外,低功耗的 AI 加速器和专用芯片被集成到终端设备中,边缘智能正变得越来越自主且强大。在这个人人随身携带“超级计算机”的时代,Arm技术在推动技术革新中发挥着举足轻重的作用。

随着网络和互联网技术的飞速进步,物联网的概念逐渐兴起。通过采用Wi-Fi、蓝牙、ZigBee、窄带物联网、LoRa等多种连接技术,各类设备已经实现了广泛的相互连接与通信,进一步地推动了边缘计算设备的普及。Qwkednc

边缘设备智能化的演进,可追溯至早期的嵌入式系统,例如家庭空调、电表等,它们内置嵌入式处理器,以实现基础的控制与管理。同时,得益于机器学习和人工智能技术的进步,智能设备不仅执行任务的能力增强,更获得了学习与适应的能力。Qwkednc

近年来,随着Transformer和大型模型的发展,AI 模型的普适性、多模态支持,以及模型微调效率都有了质的突破,此外,低功耗的 AI 加速器和专用芯片被集成到终端设备中,边缘智能正变得越来越自主且强大。Qwkednc

在这个人人随身携带“超级计算机”的时代,Arm技术在推动技术革新中发挥着举足轻重的作用。Qwkednc

持续十余年投资边缘 AI

过去十年中,Arm在边缘AI领域不断探索并持续推动创新。Qwkednc

最初,Arm聚焦在优化各类传感器必需的嵌入式处理器上,致力于实现超低成本、低功耗和小面积,并支持控制级代码的开发。Qwkednc

其中包括 Cortex-M 处理器、Cortex-A 处理器,加强对 AI 和机器学习 (ML) 在边缘侧的支持。通过为 Cortex M 引入 Helium 矢量指令级,为嵌入式设备的数字信号处理 (DSP) 和 ML 带来显著的性能提升,目前搭载 Helium 技术的 Arm 处理器包括Cortex-M52、Cortex -M55、Cortex-M85。Qwkednc

在Cortex-A应用处理器方面,这种增强是更广泛的。比如 SVE、SVE2 矢量扩展在 AI 方面的增强,以及 SME 对矩阵计算的优化,及通过向量点积 (Dot Product) 等新指令增强 CPU 处理器对边缘 AI 和数据处理的支持。Qwkednc

Qwkednc

图:Arm 赋能边缘 AI 持续创新Qwkednc

随着物联网的蓬勃发展,边缘算力和安全性日显重要。为顺应这一趋势,Arm积极推出创新技术,如Armv8-M和Arm TrustZone,显著提升了边缘设备的计算能力和安全性。Qwkednc

为满足日益增长的边缘与端侧AI推理需求,Arm在嵌入式领域进一步引入了Armv8.1-M架构,并结合Arm Helium技术,使CPU能够更加高效地执行计算密集型的AI推理算法。随后,为满足更高性能和更复杂的AI工作负载,Arm又推出了Arm Ethos系列AI加速器。Qwkednc

随着系统功能的增强,其复杂性也在不断提升。为了充分释放AI处理的潜能,软硬件的协同工作显得尤为重要。Qwkednc

Arm物联网事业部业务拓展副总裁马健表示:“Arm 不仅仅聚焦处理器 IP,更是在软件与工具链方面加强投资,确保我们领先于行业,以满足更简单、快速的高性能边缘 AI 系统的开发需求,支持诸多 AI 算子与应用在 Arm 计算平台上的优化运行,使边缘 AI 在 Arm 平台上枝繁叶茂。”Qwkednc

从电子爱好者、初创企业到全球最大的微控制器(MCU)和消费电子供应商,智能物联网市场正日益聚集在Arm平台上。Arm持续推动着边缘AI的创新发展,并在其软硬件计算平台上催生了大量创新解决方案。马健透露,目前,全球约有 90% 的 AI 都运行在基于 Arm 架构的 CPU 上Qwkednc

更高算力的 Ethos-U85 NPU AI 加速器

随着生成式AI和大模型在物联网中的广泛应用,未来每个家庭都将拥有一个“家庭大脑”,而现有的家庭网关也将得到更强大的AI支持。这种发展趋势将使得多模态AI和自然语言交互成为可能,但同时也对大模型、多模态支持以及AI算力提出了更高的要求。Qwkednc

为了满足这些需求, Arm 发布了更高算力的 Ethos-U85 NPU AI 加速器。Qwkednc

Qwkednc

图:Arm Ethos-U85 提供卓越的神经网络加速功能Qwkednc

与上一代产品相比,Ethos-U85性能提升四倍,能效提高 20%,支持从 128 到 2048 个 MAC 单元的配置,在最高性能配置下提供 4TOPs 的 AI 算力。Qwkednc

Ethos-U85的显著特征之一,是支持了TensorFlow Lite和PyTorch等AI框架。在算子支持方面,Ethos-U85支持Transformer 架构和卷积神经网络 (CNN) 以实现 AI 推理。Qwkednc

马健进一步指出:“基于 Transformer 的模型具有优异的泛化功能,它将更快地驱动新 AI 应用的发展。Transformer 在视觉和生成式 AI 用例中,比如视频理解、图文结合,图像增强与生成、图像分类和目标检测等方面都极有价值。Transformer 架构网络的注意力机制容易利用并行计算来实现,提高硬件使用效率,使得这些模型能够部署在计算资源有限的边缘设备上。开发者可以通过选用针对 Transformer 架构网络优化的设计,发掘边缘 AI 的新机遇,使这些应用享有更快的推理、更优化的模型性能和可扩展性。”Qwkednc

Ethos-U85不仅为低功耗MCU系统中的AI提供了强大的加速能力,更在高性能边缘计算领域展现出卓越的应用潜力。随着边缘计算系统的不断发展,应用处理器、标准操作系统如Linux,以及高级开发语言的广泛部署,已成为行业新趋势。这一模式极大地促进了云原生开发和云边端负载调度的效率,特别是在处理数据量激增的AI应用系统中表现尤为突出。Qwkednc

Ethos-U85的出现,恰好迎合了这一市场需求。结合Arm领先的Armv9 Cortex-A CPU,Ethos-U85为基于应用处理器的智能物联网平台上运行的AI任务提供了前所未有的加速体验。Qwkednc

在工业机器视觉、边缘网关、可穿戴设备以及消费类机器人等应用领域,Ethos-U85的高效能边缘推理能力得到了充分体现。其强大的计算性能和优化的能耗比,使得这些设备能够在处理复杂AI任务时保持高效稳定,进一步提升了用户体验和设备性能。Qwkednc

Ethos-U85的亮点不仅体现在硬件上,还在软件工具链的一致性、易用性方面都有非常强大的优势。Qwkednc

马健表示:“Arm 生态系统合作伙伴们在使用最新的 Ethos-U85 时,可沿用之前 Ethos 的一系列工具链,例如 Vela Compiler 以及 ML Evaluation Kit 都可从此前推出的 Ethos-U55 和 Ethos-U65 延展到 Ethos-U85 上,为开发者提供一致性的无缝开发体验。”Qwkednc

迄今,Arm Ethos NPU 系列产品已有逾 20 家授权许可合作伙伴,其中包括恩智浦半导体 (NXP) 的 i.MX 系列、瑞萨电子 (Renesas) 的 RA8 系列、英飞凌 (Infineon) 的 PSoC Edge 和 Alif Semiconductor 的 Ensemble 等量产芯片解决方案。而 Alif Semiconductor 和英飞凌还是全新 Arm Ethos-U85 NPU 的早期采用者。Qwkednc

全新物联网参考设计平台Arm Corstone-320 

在万物智能的驱动下,无处不在的MCU和嵌入式系统对性能和AI加速的需求与日俱增。为了顺应这一趋势,同时帮助合作伙伴简化系统开发流程,加快产品上市时间,Arm推出了全新的智能物联参考设计平台 —— Arm Corstone-320。Qwkednc

Qwkednc

图:Arm 助力加速边缘 AI 设备部署进程Qwkednc

Corstone-320 包含了Arm Cortex-M 系列最高性能的嵌入式处理器 Cortex-M85,以及全新的 Ethos-U85 NPU AI 加速器。Qwkednc

随着视觉在多模态感知中的重要性日益凸显,边缘MCU和传感器系统对视觉和图像感知的依赖也在不断加深。为满足这一需求,Corstone-320还特别集成了Arm Mali-C55 ISP,以实现针对视觉应用的低功耗系统优化。Qwkednc

据马健介绍,该设计是基于实际工作负载开发的,参考用例包括部署在智能家居中的电池供电摄像系统,以及在工业和零售系统中的低帧率网络摄像头。同时,Corstone-320 参考设计提供了有安全保证的软硬件组合,使得在此参考设计基础上开发的合作伙伴们能够顺利地通过 PSA Certified Level 2 认证,实现对区域和全球安全标准的合规。Arm坚信通过 Corstone-320 预先集成、预先验证的参考设计模版,Arm 定能帮助合作伙伴减少边缘智能芯片开发的成本和时间。Qwkednc

正如此前推出的Arm物联网参考设计一样,Corstone-320 不仅仅提供芯片计算子系统 IP 组合,还附带了软件、AI 模型库和开发工具,以实现软件的复用,同时也利用了 Arm 强大的生态系统。Qwkednc

Corstone-320还附带了仿真 Corstone-320 完整系统的 Arm 虚拟硬件,以及单独的 CPU 和 NPU 的固定虚拟平台 (FVP) 模型,以简化开发并加速产品设计,支持软硬件并行协同开发。Qwkednc

总的来看,该参考设计平台涵盖了软件、工具和支持,其中包括 Arm 虚拟硬件。该平台的软硬件结合特性将使开发者能够在物理芯片就绪前便启动软件开发工作。马健强调:“这种提供边缘 AI 和智能物联网计算子系统全套软硬件和工具链的方法,使得我们的合作伙伴能够在一系列性能点上快速开发,并聚焦于打造差异化价值。”Qwkednc

边缘 AI 既带来了机遇,也带来了挑战

随着大模型和生成式AI的兴起,边缘AI领域迎来巨大的变革,用户体验的不断提升、数据量的急剧增长,以及企业对数据价值的深刻认识,都将推动行业发生翻天覆地的变化。Qwkednc

在边缘AI芯片和系统的设计过程中,如何在计算能力和能效之间找到恰当的平衡点,一直是业界面临的挑战。高性能处理能力常伴随着高功耗,而边缘设备对功耗和成本有着严格的限制。同时,随着边缘数据处理的增多,数据安全和隐私保护问题也日益凸显,这对芯片设计的加密和安全功能提出了更高的要求。此外,边缘应用场景的多样性以及传统物联网市场的碎片化现象,也使得软件定义和移植性成为必不可少的考量因素。Qwkednc

马健表示,为了帮助整个边缘AI生态应对这些挑战,Arm在IP、参考设计和软件标准上进行了持续投入。Qwkednc

全新的 Ethos-U85 和 Corstone-320 参考设计平台,满足了边缘 AI 用例对更高性能计算的需求,为最新的 AI 模型、框架提供了原生支持,并沿用 Arm 软件与 AI 开发者已经熟知的工具链,具有投资复用、上手容易等优势。这些最新的产品与参考设计加入了Arm丰富的 IP 产品和技术组合中,使 Arm 技术能够覆盖更广泛、多样化的智能物联网应用,并满足最新边缘 AI 市场的性能、成本和能效需求。Qwkednc

马健总结道:“我坚信,只有 Arm 才拥有如此丰富的经验和领先的技术广度,能够最有力地支持我们的合作伙伴们拥抱边缘 AI 机遇。边缘 AI 生态系统正在聚焦于 Arm,将Arm 作为实现商业成功的首选平台。”Qwkednc

责编:Ricardo
本文为电子技术设计原创文章,未经授权禁止转载。请尊重知识产权,违者本司保留追究责任的权利。
夏菲
Aspencore助理产业分析师,专注行业市场前沿及技术发展趋势。
  • 微信扫一扫
    一键转发
  • 最前沿的电子设计资讯
    请关注“电子技术设计微信公众号”
广告
热门推荐
广告
广告
EE直播间
在线研讨会
广告
广告
面包芯语
广告
向右滑动:上一篇 向左滑动:下一篇 我知道了