Level 5自动驾驶需要500+TOPS算力，IMG Series4多核集群AI加速器能否胜任？-EDN 电子技术设计

 在从L2/L3级ADAS向L4/L5级全自动驾驶演进的过程中，神经网络加速器将是至关重要的组成部分。这些ADAS/自动驾驶系统需要处理各种各样的复杂场景，比如从多个摄像头和激光雷达的传感器融合中提取数据，以实现自动泊车、十字路口管理，以及复杂城市环境安全导航等高级功能。能够结合高性能、低延迟和高能效的AI加速器将是实现高级别自动驾驶的关键所在。

据ABI Research预计，到2027年全球汽车市场对先进驾驶辅助系统（ADAS）的需求将增长两倍，这对新型汽车创新者、传统整车厂商（OEM）、Tier1供应商，以及汽车系统级芯片（SoC）厂商无疑都是好消息。但汽车行业领导者早已将目光投向了更远的全自动驾驶和自动驾驶出租车（RoboTaxi）。在从L2/L3级ADAS向L4/L5级全自动驾驶演进的过程中，神经网络加速器将是至关重要的组成部分。这些ADAS/自动驾驶系统需要处理各种各样的复杂场景，比如从多个摄像头和激光雷达的传感器融合中提取数据，以实现自动泊车、十字路口管理，以及复杂城市环境安全导航等高级功能。能够结合高性能、低延迟和高能效的AI加速器将是实现高级别自动驾驶的关键所在。wNzednc

想了解ADAS/自动驾驶的最新设计和市场趋势？请即刻报名参加：汽车电子高峰论坛wNzednc

wNzednc

近日Imagination推出专门面向ADAS和自动驾驶应用的新一代神经网络加速器（NNA）IMG Series4。据称这种AI加速器采用全新的多核架构，可提供高达600 TOPS（每秒万亿次操作）的超高计算性能，并且可为神经网络工作负载提供低带宽和低延迟特性。wNzednc

wNzednc

Imagination视觉和人工智能部门高级总监Andrew Grant列举出IMG Series4的五大特性：wNzednc

多核扩展和灵活性：全新的多核架构支持在多个内核之间对工作负载进行灵活分配和同步。Imagination软件可提供精细的控制能力，可通过对多个工作负载进行批处理、拆分和调度而提高灵活性。Series4可为每个集群配置 2个、4个、6个或者8个内核。
超高性能：Series4单核能够以不到1W的功耗提供12.5 TOPS的性能，比如一个8核集群可以提供100 TOPS的算力，那么若配置6个这种8核集群就可以提供高达600 TOPS的算力，足以满足Level 5完全自动驾驶所需要的500 TOPS。在AI推理方面，Series4 NNA的性能比嵌入式GPU快20倍以上，而比嵌入式CPU快1000倍。
超低延迟：将多个内核组成2核、4核、6核或8核的多核集群，所有内核可以相互协作，并行处理一个任务，从而降低处理延迟，缩短响应时间。例如，对于一个8核集群，理想情况下延迟会减少至单核独立执行时的1/8。
节省带宽：Imagination在Series4中新增了Tensor Tiling（ITT）技术，可以对计算任务进行瓦面平铺（tiling），充分利用片上存储来提升数据处理效率，并节省访问外部存储的带宽。ITT利用本地数据的依赖性将中间数据保存在片上存储器中，这样可以最大限度地减少将数据传输至外部存储器，从而大大降低带宽，多达90％。ITT是一种可扩展的算法，在拥有大量输入数据的网络上具有显著优势。
车规级安全性：Series4包含IP级别的安全功能，而且其设计流程符合汽车电子行业安全标准ISO 26262。在不影响性能的前提下，Series4可以安全地进行神经网络推理。其硬件安全机制可以保护编译后的网络、网络执行和数据处理管道。

Andrew Grant认为，Series4 NNA将会成为开发ADAS和自动驾驶汽车的行业标准平台。一些行业创新者已经在着手打造支持下一代ADAS功能和自动驾驶的系统级芯片，这一AI加速平台将为他们提供算力、功耗、带宽和延迟等方面的最佳组合性能。wNzednc

多核集群实现性能线性提升

随着汽车电子从数字驾驶舱/人机界面（HMI）向ADAS和自动驾驶的演讲，在保证安全性和可靠性的同时，对处理性能要求越来越高。比如，Level 2级别的驾驶员监测功能只需要10 TOPS的算力即可处理，而Level 3-4级别的自动泊车功能就需要100 TOPS性能。要实现Level 5级别的完全自动驾驶，必须有500 TOPS以上的算力支持才行。wNzednc

wNzednc

Series4 NNA采用全新的内核架构，每个内核具有12.5 TOPS性能。若基于5nm工艺节点，8个内核的集群可提供： 100 TOPS的算力性能；30 TOPS/Watt 的性能功耗比；12 TOPS/mm^2 的性能密度；低延迟处理大量输入数据。wNzednc

wNzednc

由4 个内核组成的 50 TOPS 集群能够跨整个集群拆分各层，比如支持并行处理大型网络的各层；减少整体延迟，特别是在拥有大尺寸输入层的网络上。而各内核能够独立运行，可以共同执行一个批处理任务，也可以分别运行各自不同的网络。此外，这种4内核集群可以作为基础模块进行算力扩展。比如，4个50 TOPS集群就可以构成一个200 TOPS的多集群引擎。3个这种多集群引擎组合起来，就可以达到600 TOPS的算力性能，满足Level 5自动驾驶算力要求。wNzednc

wNzednc

张量平铺(Tensor Tiling)技术

Imagination产品管理部门总监Gilberto Rodriguez对Series4新增的张量平铺（Tensor Tiling, ITT）技术做了详细介绍。网络的多层是以融合内核的形式在加速器硬件流水线里运行的，而融合内核之间的特征图需要通过外部存储进行交换。在不采用ITT技术的情况下，内核需要频繁的DDR存取，因此会占用很大的带宽。wNzednc

wNzednc

若采用了ITT技术，就可以充分利用紧耦合的 SRAM 来融合更多的层，减少需要通过外部存储交换的特征图，从而降低带宽需求。wNzednc

wNzednc

结语

ADAS和自动驾驶虽然呼声很高，但仍然难以商用落地。究其原因，严苛的安全性和极高的算力和即时处理决策要求对汽车厂商及其供应商提出了很大的挑战。素以GPU内核著称的Imagination技术公司开始发力AI加速器市场，最新发布的Series 4 NNA专为ADAS/自动驾驶应用而设计。虽然其多核集群架构可以提供高达600 TOPS的算力性能，但能否真正满足完全自动驾驶的性能需求，还要看基于这种AI加速器内核的芯片和系统开发，真正应用到自动驾驶实际场景中能否胜任还需要市场的检验。wNzednc

责编：Amy ＧuanwNzednc

本文为电子技术设计原创文章，未经授权禁止转载。请尊重知识产权，违者本司保留追究责任的权利。

阅读全文，请先

顾正书

电子工程专辑（EETimes China）主分析师

进入专栏

自动驾驶汽车电子人工智能产业前沿

上一篇： 对比英飞凌与比亚迪，看国产汽车半导体面临的挑战与发展机遇 下一篇： 使用标准稳压器产生极低电压

微信扫一扫
一键转发
最前沿的电子设计资讯
请关注“电子技术设计微信公众号”

思特威正式发布子品牌飞凌微，首发产品定位智驾视觉处理思特威（上海）电子科技股份有限公司（股票简称：思特威，股票代码：688213）正式发布全资子公司品牌——飞凌微电子（Flyingchip™，以下简称“飞凌微”)。同时，飞凌微M1车载视觉处理芯片系列正式亮相，包括M1(Camera ISP)以及M1Pro(Camera SoC)和M1Max(Camera SoC)。
儒卓力系统解决方案推出RAB4新型适配器板，实现厘米级精儒卓力系统解决方案 (Rutronik System Solutions) 的专家与儒卓力无线技术中心 (Rutronik Wireless Competence Center) 携手开发了RAB4适配器板，无需设计任何硬件即可测试 RTK 性能，从而加速预开发阶段并降低成本，帮助客户更快地将应用推向市场……
自动驾驶：挑战与机遇尽管ADAS系统正加速发展，但距离实现自动驾驶还有几大步骤有待完成，在真正的自动驾驶成为现实之前，还有许多技术和监管障碍需要跨越。
CEVA和Autotalks扩大合作连手创建全球首个5G-V2X解决 Autotalks推出CEVA助力的最新V2X芯片TEKTON3和SECTON3已获主要汽车OEM厂商准予批量生产。
坚持不懈的身影：Intel自动驾驶事业群副总裁Kathy Winte “不要永远只做擅长的事情，要延展自己的能力；尝试不熟悉的东西、学习新的技术领域或是市场，如此就能有所成长并能掌握更多新机会。”
汽车ADAS需要EMI/EMC辐射很低的开关转换器 ADAS系统在新型汽车中的应用越来越广泛。找到一种不对ADAS系统造成干扰的电源转换器件，能够极大地简化设计师的任务，同时无需复杂的布局或设计方法，就可为设计师提供需要的所有性能。
一组图表说清自动驾驶汽车的前世今生与未来众所周知，自动驾驶汽车是汽车行业的新宠，但自动驾驶汽车并不是21世纪才出现的。在1939年纽约的世界博览会上，美国通用汽车公司（GM）的Futurama首次向世人展示了对未来自动驾驶的构想，这是世界关于自动驾驶汽车的最早记录。可以说，GM是自动驾驶的鼻祖。本文的一组图表生动地呈现了自动驾驶汽车的前世、今生与未来。
5G如何改变数据中心即将提供的基于5G网络技术的数据服务将可更快地在线访问更多数据。信息的这种即时性将支持许多当今先进的技术应用——如自主驾驶汽车和虚拟现实或增强现实系统——以省去本地存储的数据并转而依赖于云。为使其发挥效率，网络延迟需要小于1ms。这不仅需要在数据中心安装5G基础设施，还要求数据中心同时靠近用户及为其服务的蜂窝射频发射塔——而如果数据中心远在250英里外则会鞭长莫及！
最近五年黑客从哪些方面对网联自动驾驶汽车进行了攻击《速8》上映如火如荼，其中百辆自动驾驶汽车被黑的场面让人印象深刻。外行看热闹，内行看门道，这无疑给风头正劲的自动驾驶的安全问题再次敲响了警钟。那么，五年来黑客都从哪些方面对网联自动驾驶汽车进行了攻击？
利用MEMS扫描镜技术提高汽车安全性业界对用于ADAS的激光雷达技术趋之若骛。这是业内的热门话题，很多大公司都想从中分得一杯羹。英飞凌去年通过收购Innoluce获得了激光雷达专用技术。ADI公司也从Vescent Photonics公司收购了LBS技术，以支持主流汽车激光雷达系统的普及。未来必将有更多同类的收购案发生，使这个市场火热起来。
基于SoC的双目视觉ADAS解决方案相比于单目视觉，双目视觉（Stereo Vision）的关键区别在于可以利用双摄像头从不同角度对同一目标成像，从而获取视差信息，推算目标距离。
一文带你了解电子器件中的电阻率电阻率是电子和材料科学领域的一个基本概念，特别是在设计电路和选择电子元件材料时尤为重要。

25年第19周新能源周销量：不同价格带的车型走势解析本周插混与增程车型市场呈现出“两极化”趋势：一方面，10-15万元级的主流家用轿车与SUV销量强劲；另一方面，20万元
拆解报告：甲骨文3060W碳化硅服务器电源模块甲骨文服务器电源模块输入输出均为专用接口，采用热拔插设计。电源模块支持200-277V交流和240-380V直流输入，输
评测：森海塞尔ACCENTUM Open真无线耳机半入耳机森海塞尔ACCENTUM Open 真无线耳机采用半入耳式设计，搭配约4.4克的重量，佩戴舒适。耳机充电盒轻盈小巧，携带外
人形机器人如何做到“手眼”协同+“大小脑”协同？人形机器人正站在“走出实验室”的临界点。从本体制造、控制系统、核心零部件到应用场景拓展，技术与产业生态
南非2025年4月：奇瑞和长城汽车快速上升 2025年4月的南非车市增长，马恒达和现代的强劲回归是一个信号，而中国品牌的集体崛起，则预示着未来竞争将更加多
4月新能源车领跑汽车出口增长，中国汽车走向全球的新引擎 2025年开年以来的出口数据呈现出清晰的结构升级路径。新能源产品在出口中扮演的角色日益重要，不再只是锦上添
拆解报告：vivo手机原装90W氮化镓闪充充电器 vivo 90W氮化镓闪充充电器采用经典直板造型设计，同时附带一条专门量身定制的8.5A大电流数据线，配合信号屏蔽层
拆解报告：HONOR荣耀手环10 荣耀手环10在外观方面，延续了上代的轻薄双曲面设计，同时采用全新的双色NCVM镀膜工艺，使之更加的时尚精致。标配
2025年4月中国车企加速渗透土耳其市场：比亚迪Seal U打响突围战 2025年4月，土耳其市场的爆发式增长为全球车企提供了重要信号：新兴市场正在进入电动化转型的加速期，而土耳其作
2025年第19周新能源周销量：问界起势 2025年第19周，中国乘用车市场的周度销量达到44.4万辆，其中新能源车占比突破50%，达22.3万辆，占比50.2%。比亚迪体
2024年4月汽车市场终端数据：自主崛起、新势力分化、合资承压从整体销量数据来看，4 月汽车终端销量达 169.7 万，同比增长 9.3% ，在目前的价格力度下，这个销售数字差强人意。2
拆解报告：华为750W钛金牌服务器电源华为这款服务器电源型号为PAC750S12-TE，支持220V交流或240V直流输入，输出电压为12V，输出电流为62.5A，输出端设有

史密斯英特康推出新一代“ DaVinci Gen V”测试插座史密斯英特康推出新一代“ DaVinci Gen V”测试插座，为人工智能、6G通信及先进计算应用领域的芯片提供超
意法半导体高集成度低边电流测量放大器简化高准确度电流检测意法半导体的 TSC1801低边电流测量放大器集成了设定增益所需的匹配电阻，从而简化了电路设计，节省了物料清单
意法半导体推出创新的、带有可改变存储配置存储器的车规微控制器新推出的Stellar微控制器内置了xMemory技术，它为正在发展的软件定义汽车以及不断进化的电动汽车架构提供了一
新系列串口EEPROM内置唯一ID码，适合设备识别、溯源和可持续性应用意法半导体 (ST) 推出了一系列内置128位唯一只读ID码 (UID) 的串口EEPROM芯片，以满足市场对产品识别、溯
Vishay新添增强短瞬态脉冲防护性能的经AEC-Q200认证的厚膜功率电这些器件采用夹片式TO-247 封装形式，可直接安装在散热器上，具有高达 75 J/0.1 s的高脉冲吸收能力和 150
凉棚集成Nordic 技术实现Matter over Thread连接为家庭和企业 StruXure+ 凉棚和小屋系列集成 Nordic 的 nRF5340 SoC以提供无缝的 Matter over Thread 连接
智能楼宇技术全球领导者与Nordic Semiconductor携手合作确保楼业界连手推动NR+成为智能楼宇的全球连接标准···
Cadence 率先推出 eUSB2V2 IP 解决方案，助力打造高速连接新范 Cadence 在业内率先推出 eUSB2V2 IP，此 IP 基于先进的台积公司 N3P 工艺，符合最新的嵌入式 USB2 版
纳芯微发布双通道电流检测放大器NSCSA285，赋能工业与能源管理近日，上海 —— 纳芯微电子（简称“纳芯微”）发布全新高精度双通道电流检测放大器NSCSA285系列···
攻克PWM高频瞬态干扰难题！纳芯微发布车规级电流检测放大器NSCSA24 近日，纳芯微发布全新车规级双向电流检测放大器NSCSA240-Q1系列，专为汽车高压PWM系统打造解决方案···
TE Connectivity 推出INMORO系列：致力于满足中国市场需求而打造的连接和传感解决方案提供商泰科电子（TE Connectivity，以下简称 TE）工业事业部隆重推出INMORO 系列，致力于满足中
破解汽车与工业等应用新挑战，TDK展示多传感器融合与AI+发展趋势在新能源汽车应用中，热管理系统既要能高效地冷却和加热电池、电机与OBC等车辆核心部件，确保其处于最佳运行温

热门评论
最新评论

换一换

杂志声明

Level 5自动驾驶需要500+TOPS算力，IMG Series4多核集群AI加速器能否胜任？

多核集群实现性能线性提升

张量平铺(Tensor Tiling)技术

结语