用于端点AI加速的10大处理器-EDN 电子技术设计

 人工智能和机器学习应用的加速是一个相对较新的领域，各种各样的处理器不断涌现，加速了几乎所有神经网络的处理工作。本文列出了目前市场上有代表性的10款AI加速处理器。

人工智能和机器学习应用的加速是一个相对较新的领域，各种各样的处理器不断涌现，加速了几乎所有神经网络的处理工作。无论是处理器巨头还是行业新贵，都在尽力提供差异化产品——或是针对不同的垂直市场、应用领域或功率预算，或是具有不同的价位。本文列出了目前市场上有代表性的10款AI加速处理器。Dyuednc

应用处理器

英特尔Movidius Myriad X

Myriad X由爱尔兰初创公司Movidius开发，该公司于2016年被英特尔收购。Myriad X是Movidius的第三代视觉处理单元，也是首款搭载专用神经网络计算引擎的处理器，可提供1TOPS的运算能力，专门用于深度神经网络（DNN）计算。神经网络计算引擎与高吞吐量智能存储器件直接连接，避免了数据传输时的任何存储瓶颈。Myriad X支持FP16和INT8计算，拥有一个内核群（包含16个专有SHAVE内核），以及升级扩展版的视觉加速器。Dyuednc

Myriad X可用于第二代英特尔神经计算棒（NCS2），NCS2实际上是外形跟U盘一样的评估平台。它可以插入任何工作站，使AI和计算机视觉应用能够快速启动并在专用的Movidius硬件上运行。Dyuednc

恩智浦半导体i.MX 8M Plus

i.MX 8M Plus是一款异构应用处理器，采用芯原的专用神经网络加速器IP（Vivante VIP8000）。它为消费者及工业物联网端点设备提供2.3TOPS的推理加速能力，足以完成多个物体的识别、40,000个单词的语音识别，甚至还可以对医学影像进行分类（MobileNet v1每秒对500个影像进行分类）。Dyuednc

Dyuednc

图1：恩智浦的i.MX 8M Plus是该公司首款搭载专用神经网络加速器的应用处理器，专为物联网应用而设计。（图片来源：恩智浦半导体）Dyuednc

除神经网络处理器以外，i.MX 8M Plus还搭载运行速度为2GHz的4核Arm Cortex-A53子系统，以及Cortex-M7实时子系统。针对视觉应用，它提供两个图像信号处理器，可以支持两个立体视觉高清相机或一个12MP相机。针对语音应用，它提供一个800MHz HiFi4音频数字信号处理器（DSP），可用于语音数据的预处理和后处理。Dyuednc

XMOS公司xcore.ai

xcore.ai用于实现人工智能物联网（AIoT）应用中的语音控制。它是一种交叉处理器，兼具应用处理器的性能以及微控制器的低功耗与实时操作特性，用于语音信号的机器学习推理。Dyuednc

Dyuednc

图2：XMOS公司的xcore.ai采用专有架构，专为语音应用中的AI处理而设计。（图片来源：XMOS）Dyuednc

它采用XMOS专有的Xcore架构，包含的逻辑内核可用于I/O、DSP、控制功能或AI加速。每颗xcore.ai芯片上有16个这样的内核，设计人员可以根据需要选择为每种功能分配多少个内核。通过将不同功能映射到固件中的逻辑内核，可以创建一个“虚拟SoC”，这完全是通过软件实现的。XMOS还在Xcore中增加了向量管道功能，用于机器学习。Dyuednc

xcore.ai支持32位、16位、8位和1位（二进制）网络，可提供3200MIPS、51.2GMACC和1600MFLOPS的运算能力，同时拥有1MB嵌入式SRAM以及一个低功耗DDR扩展接口。Dyuednc

汽车SoC

德州仪器TDA4VM

TDA4VM是德州仪器首款搭载专用深度学习加速器的片上系统（SoC），是应用于汽车高级驾驶辅助系统（ADAS）的Jacinto 7系列的一部分。该模块采用C7×DSP及内部开发的矩阵乘法加速器（MMA），运算能力高达8TOPS。Dyuednc

Dyuednc

图3：德州仪器的TDA4VM用于复杂的ADAS，使车辆能够感知周围环境。（图片来源：德州仪器）Dyuednc

这款SoC可以处理来自一个8MP前置摄像头的视频流，或者处理来自4到6个3MP摄像头加上雷达、LiDAR和超声波传感器的组合数据。例如，在自动代客泊车系统中，其搭载的MMA可用于对这些输入数据进行传感器融合。Dyuednc

TDA4VM专为5W至20W的ADAS应用而设计。该产品目前处于预生产阶段，但已有可用的开发套件。Dyuednc

GPU

英伟达Jetson Nano

英伟达著名的Jetson Nano是一款外形小但功能强大的图形处理单元（GPU）模块，专门针对端点设备中的AI应用。该公司表示，与大多数Jetson系列产品（AGX Xavier和TX2）一样，Nano模块上的GPU采用Maxwell架构，有128个内核，运算能力达到0.5TFLOPS，足以处理多个高分辨率图像传感器的数据流并运行多个神经网络，功耗仅为5W。该模块还搭载了4核Arm Cortex-A57 CPU。Dyuednc

Dyuednc

图4：英伟达的Jetson Nano模块搭载具有128个内核的强大GPU，适合边缘AI应用。（图片来源：英伟达）Dyuednc

与英伟达其他产品一样，Jetson Nano也采用了英伟达的神经网络加速库CUDA X。价格便宜的Jetson Nano开发套件已经面市。Dyuednc

消费类协处理器

Kneron公司KL520

Kneron是台湾旅美科学家在美国成立的一家初创公司，首款产品为KL520神经网络处理器，专用于智能家居、安防系统和移动设备等应用中的图像处理和人脸识别。经过优化，它可以运行图像处理中常用的卷积神经网络（CNN）。Dyuednc

Dyuednc

图5：Kneron公司的KL520采用可重配架构和巧妙的压缩技术，在移动设备和消费类设备中完成图像处理。（图片来源：Kneron Inc.）Dyuednc

KL520运算能力达到0.3TOPS，功耗仅为0.5W（相当于0.6TOPS/W）。该公司称其芯片MAC效率超过90％，能够实现精确的人脸识别。芯片架构可重新配置，并针对不同的CNN模型量身定制。Kneron公司的辅助编译器采用压缩技术，能够在有限的芯片资源内运行更大的模型，从而节省了功耗和成本。KL520现已上市，制造商AAEON的加速卡中（M2AI-2280-520）便使用了这款处理器。Dyuednc

Gyrfalcon公司Lightspeeur 5801

Gyrfalcon公司的Lightspeeur 5801是为消费类电子产品市场而设计的，可提供2.8TOPS的运算能力，功耗为224mW（相当于12.6TOPS/W），延迟仅为4ms。Gyrfalcon采用了比其他架构更节能的“存储器内处理器（processor-in-memory）”技术，并且可以在50MHz和200MHz之间改变钟速度，从而相应地调节功耗。Lightspeeur 5801包含10MB存储器，因此整个模型都可装在芯片上。Dyuednc

Lightspeeur 5801是该公司生产的第四款芯片，已经用在LG的Q70中端智能手机中，用于相机效果的推理。5801 Plai Plug U盘开发套件现已上市。Dyuednc

超低功耗

Eta Compute公司ECM3532

ECM3532是Eta Compute公司的第一款产品，在物联网电池供电或能量采集设备中用于AI加速。在图像处理和传感器融合等一直处于运行状态的应用中，其功耗可低至100µW。Dyuednc

该芯片搭载两款内核，Arm Cortex-M3微控制器内核和NXP CoolFlux DSP。它采用专有的电压和频率调节技术，可以调节每个时钟周期，以充分利用两个内核的每一瓦功率。两个内核的任何一个都可以执行机器学习（但一些语音处理由DSP来完成更好）。ECM3532样品已经推出，预计第二季度开始量产。Dyuednc

Syntiant公司NDP100

NDP100处理器由美国初创公司Syntiant设计，可对超低功耗应用中的语音命令进行机器学习推理。这款芯片采用存储器内处理器技术，仅消耗不到140µW的有功功率，可运行关键词发现、唤醒词检测、说话人识别或事件分类等模型。Dyuednc

Dyuednc

图6：Syntiant公司的NDP100适合超低功耗应用中的语音处理。（图片来源：SyntiantCorp.）Dyuednc

Syntiant公司称该产品将用于消费类电子设备的语音操作，例如耳塞式耳机、助听器、智能手表和遥控器。其开发套件已上市。Dyuednc

GreenWaves公司GAP9

GAP9是法国初创公司GreenWaves开发的第一款超低功耗应用处理器，它搭载由9个RISC-V内核组成的强大计算集群，其指令集经过高度定制可以最大程度降低功耗。它具有双向多通道音频接口和1.6MB内部RAM。Dyuednc

在电池供电的物联网设备中，可使用GAP9来完成图像、声音和振动检测等神经网络处理。根据GreenWaves数据显示，在GAP9运行MobileNet V1来处理分辨率为160×160的图像时，通道缩放值为0.25，用时仅12ms，功耗低至806μW/帧/秒。Dyuednc

（原文刊登于ASPENCORE旗下EETimes欧洲网站，参考链接：Top 10 Processors for AI Acceleration at the Endpoint。）Dyuednc

本文为电子技术设计原创文章，未经授权禁止转载。请尊重知识产权，违者本司保留追究责任的权利。

为什么没有寒武纪？

阅读全文，请先

人工智能处理器/DSP 产业前沿 EDN原创

上一篇： 大疆在美被同胞“捅刀”后续：或面临在美国禁售 下一篇： 打破美国GPS垄断！国产北斗兼容型芯片及模块销破亿

微信扫一扫
一键转发
最前沿的电子设计资讯
请关注“电子技术设计微信公众号”

2025松山湖中国IC创新高峰论坛：继续聊聊机器人去年的主题是智慧机器人，今年的主题仍然聚焦于机器人身上，不过变为了具身智慧机器人……
鹏瞰TS-PON Gen2芯片，用光协议重塑机器人“神经网络” TS-PON Gen2芯片是一款灵活的软件定义 SoC，适用于多种场景。它基于无源光网（PON）技术，具备高带宽（目前10G，未来可拓展至25G、50G）、低时延（微秒级）、高确定性等特性···
让人形机器人“耳聪目明”，昆泰芯KTM5900磁性编码器解编码器芯片作为机器人的核心传感器之一，对于提升机器人的感知能力、安全性和生产效率具有重要意义···
如何让具身机器人“看”得清？思特威给出了这个答案相比于滚动快门传感器，全局快门传感器能够同时曝光整个画面，有效避免了运动过程中产生的图像形变，为机器视觉提供高精度、无畸变的图像···
极海推出全球首款双核Cortex-M52实时控制MCU/DSP 随着机器人技术的不断发展，其应用领域从传统的工业制造逐步拓展至医疗、农业等多个新兴领域，这对机器人的控制系统提出了更高的要求，当前机器人控制系统当前主要面临高爆发、高动态、高精度和高安全这四方面的挑战···
比人类更灵活？先楫HPM6E8Y机器人关节控制解决方案 HPM6E8Y通过硬件加速器将电机控制算法执行时间缩短至2.8μs，以全链路高实时通信与多轴协同能力，开启机器人关节“芯”时代。
为旌科技感算控一体化芯片落地，带来6倍效率提升？具身智能的本质是‘大脑（认知）+小脑（控制）+感官（感知）’的协同进化，需要芯片层面实现三者深度融合。
爱芯元智发布AX8850：让AI算力更便宜，让智能更可及爱芯元智希望把算力做得更加便宜具智价比，普惠AI，让我们的边缘智能更加触手可及···
万有引力EB100芯片亮相，空间计算走向低功耗新时代？ EB100芯片将为XR和机器人行业带来更好、更低功耗的空间计算和显示能力，开启空间计算时代的无限可能···
芯驰D9 Max：为具身智能而生的高性能SoC，一颗芯片顶五颗我们希望以1个芯片完成5个芯片完成的事情。当应用发生爆炸性的变化，融合一定是一个非常大的趋势，而且融合的过程会使软件的开发更简单，系统的开发更简单，成本控制得更好···
情境感知AI：利用FPGA技术增强边缘智能现场可编程门阵列（FPGA）的灵活性、现场升级能力和互操作性，结合其低功耗、低延迟和并行处理能力，使其成为开发者克服挑战并优化情境边缘AI应用的关键工具。
ADAS 系统中的传感器创新如何在道路交通中挽救生命在本文中，我们将探讨 ADAS 在提高道路安全方面的作用，以及各种对实现这一目标至关重要的传感器技术。

25年第19周新能源周销量：不同价格带的车型走势解析本周插混与增程车型市场呈现出“两极化”趋势：一方面，10-15万元级的主流家用轿车与SUV销量强劲；另一方面，20万元
拆解报告：甲骨文3060W碳化硅服务器电源模块甲骨文服务器电源模块输入输出均为专用接口，采用热拔插设计。电源模块支持200-277V交流和240-380V直流输入，输
评测：森海塞尔ACCENTUM Open真无线耳机半入耳机森海塞尔ACCENTUM Open 真无线耳机采用半入耳式设计，搭配约4.4克的重量，佩戴舒适。耳机充电盒轻盈小巧，携带外
人形机器人如何做到“手眼”协同+“大小脑”协同？人形机器人正站在“走出实验室”的临界点。从本体制造、控制系统、核心零部件到应用场景拓展，技术与产业生态
南非2025年4月：奇瑞和长城汽车快速上升 2025年4月的南非车市增长，马恒达和现代的强劲回归是一个信号，而中国品牌的集体崛起，则预示着未来竞争将更加多
4月新能源车领跑汽车出口增长，中国汽车走向全球的新引擎 2025年开年以来的出口数据呈现出清晰的结构升级路径。新能源产品在出口中扮演的角色日益重要，不再只是锦上添
拆解报告：vivo手机原装90W氮化镓闪充充电器 vivo 90W氮化镓闪充充电器采用经典直板造型设计，同时附带一条专门量身定制的8.5A大电流数据线，配合信号屏蔽层
拆解报告：HONOR荣耀手环10 荣耀手环10在外观方面，延续了上代的轻薄双曲面设计，同时采用全新的双色NCVM镀膜工艺，使之更加的时尚精致。标配
2025年4月中国车企加速渗透土耳其市场：比亚迪Seal U打响突围战 2025年4月，土耳其市场的爆发式增长为全球车企提供了重要信号：新兴市场正在进入电动化转型的加速期，而土耳其作
2025年第19周新能源周销量：问界起势 2025年第19周，中国乘用车市场的周度销量达到44.4万辆，其中新能源车占比突破50%，达22.3万辆，占比50.2%。比亚迪体
2024年4月汽车市场终端数据：自主崛起、新势力分化、合资承压从整体销量数据来看，4 月汽车终端销量达 169.7 万，同比增长 9.3% ，在目前的价格力度下，这个销售数字差强人意。2
拆解报告：华为750W钛金牌服务器电源华为这款服务器电源型号为PAC750S12-TE，支持220V交流或240V直流输入，输出电压为12V，输出电流为62.5A，输出端设有

史密斯英特康推出新一代“ DaVinci Gen V”测试插座史密斯英特康推出新一代“ DaVinci Gen V”测试插座，为人工智能、6G通信及先进计算应用领域的芯片提供超
意法半导体高集成度低边电流测量放大器简化高准确度电流检测意法半导体的 TSC1801低边电流测量放大器集成了设定增益所需的匹配电阻，从而简化了电路设计，节省了物料清单
意法半导体推出创新的、带有可改变存储配置存储器的车规微控制器新推出的Stellar微控制器内置了xMemory技术，它为正在发展的软件定义汽车以及不断进化的电动汽车架构提供了一
新系列串口EEPROM内置唯一ID码，适合设备识别、溯源和可持续性应用意法半导体 (ST) 推出了一系列内置128位唯一只读ID码 (UID) 的串口EEPROM芯片，以满足市场对产品识别、溯
Vishay新添增强短瞬态脉冲防护性能的经AEC-Q200认证的厚膜功率电这些器件采用夹片式TO-247 封装形式，可直接安装在散热器上，具有高达 75 J/0.1 s的高脉冲吸收能力和 150
凉棚集成Nordic 技术实现Matter over Thread连接为家庭和企业 StruXure+ 凉棚和小屋系列集成 Nordic 的 nRF5340 SoC以提供无缝的 Matter over Thread 连接
智能楼宇技术全球领导者与Nordic Semiconductor携手合作确保楼业界连手推动NR+成为智能楼宇的全球连接标准···
Cadence 率先推出 eUSB2V2 IP 解决方案，助力打造高速连接新范 Cadence 在业内率先推出 eUSB2V2 IP，此 IP 基于先进的台积公司 N3P 工艺，符合最新的嵌入式 USB2 版
纳芯微发布双通道电流检测放大器NSCSA285，赋能工业与能源管理近日，上海 —— 纳芯微电子（简称“纳芯微”）发布全新高精度双通道电流检测放大器NSCSA285系列···
攻克PWM高频瞬态干扰难题！纳芯微发布车规级电流检测放大器NSCSA24 近日，纳芯微发布全新车规级双向电流检测放大器NSCSA240-Q1系列，专为汽车高压PWM系统打造解决方案···
TE Connectivity 推出INMORO系列：致力于满足中国市场需求而打造的连接和传感解决方案提供商泰科电子（TE Connectivity，以下简称 TE）工业事业部隆重推出INMORO 系列，致力于满足中
破解汽车与工业等应用新挑战，TDK展示多传感器融合与AI+发展趋势在新能源汽车应用中，热管理系统既要能高效地冷却和加热电池、电机与OBC等车辆核心部件，确保其处于最佳运行温

热门评论
最新评论

换一换

杂志声明

用于端点AI加速的10大处理器

应用处理器

英特尔Movidius Myriad X

恩智浦半导体i.MX 8M Plus

XMOS公司xcore.ai

汽车SoC

德州仪器TDA4VM

GPU

英伟达Jetson Nano

消费类协处理器

Kneron公司KL520

Gyrfalcon公司Lightspeeur 5801

超低功耗

Eta Compute公司ECM3532

Syntiant公司NDP100

GreenWaves公司GAP9