都是拼AI性能，为何苹果/海思集成NPU，高通和联发科却选择优化？-EDN 电子技术设计

 手机SoC已经进入了比拼AI性能的时代。不过，苹果和海思集成了专为AI加速的硬件单元NPU，但高通和联发科却选择了优化的路线，这是为什么？

12月6日，高通在美国发布最新一代旗舰移动平台骁龙855，一周后的12月13日，联发科技在深圳发布了最新处理器Helio P90。加上此前亮相的三星Exynos 9820、苹果A12 Bionic以及华为海思麒麟980，可以说手机SoC已经进入了比拼AI性能的时代。不过，苹果和海思集成了专为AI加速的硬件单元NPU，但高通和联发科却选择了优化的路线，这是为什么？9F4ednc

7nm不是唯一选择

苹果的A11 Bionic和华为海思麒麟970在去年发布的时候就已经集成了专为AI加速的NPU单元，但AI性能的提升离不开工艺制程、CPU、GPU等硬件以及软件的共同协作。我们知道，在很长一段时间内处理器性能的提升靠的是工艺制程的提升，到了AI时代，除了在设计上需要做进一步的优化，对先进制程的需求也更加强烈。因此为了继续提升处理器的AI性能，麒麟980和A12 Bionic都选择了台积电的7nm工艺，都集成了69亿个晶体管。同样选择台积电7nm工艺的还有本月发布的骁龙855，但这款SoC集成多少个晶体管暂不清楚。9F4ednc

不过，7nm并非最新手机SoC的唯一选择，联发科Helio P90采用的是12nm制程，对于为何不采用7nm工艺的问题，联发科技无线通信事业部总经理李宗霖接受媒体采访时表示：“并不是有7nm就可以有很好的AI体验，还需要考虑系统架构、功耗以及与应用的结合。同时，还与我们要带给消费者什么样的体验有很大的关系。”雷锋网认为，Helio P90的定位并非旗舰级，因此必须更多的权衡7nm成本增加和性能提升之间的关系，显然12nm是联发科认为性价比最高的工艺。9F4ednc

三星Exynos9820虽然定位是旗舰级，但却采用了8nm工艺。原因很简单，8nm LPP工艺是三星基于10nm LPP演进而来的工艺，可以使芯片能效提升10%，芯片面积降低10%。9F4ednc

可以看到，虽然不是5款最新处理器并非全都采用7nm工艺，但可以明确的是在处理器性能的提升上，手机SoC设计厂商依旧期待制程提升带来的性能、功耗、芯片面积的提升，即便半导体制程的提升正变得越来越难。9F4ednc

002ednc20181218 9F4ednc

CPU高性能核心集群再细分

选择了工艺节点之后，在设计不出大问题的情况下已经在很大程度上决定了这款处理器的性能。当然，为了满足AI的需求，上述5款处理器有3款处理器的CPU采用了大中小核的架构。麒麟980是率先采用了Big.middle.little新设计的SoC，也就是将高性能核心集群再细分为高、中两部分，包括2个Cortex A76@2.6GHz、2个Cortex A76@1.92GHz、4个Cortex A55@1.8GHz，三个集群将根据不同使用场景灵活调用，提升能耗比。9F4ednc

三星同样采用Big.middle.little新设计，不同的是由于三星有自主研发的Mongoose架构CPU，因此Exynos9820的CPU是2个第四代Mongoose架构内核、2个Cortex-A75、4个Cortex-A55组合在一起，自研内核和Cortex-A75提供高处理性能，Cortex-A55提供更高效率。三星称，对比上代旗舰处理器Exynos9810，智能任务调度程序的新设计可将Exynos9820的多核性能提升15%。9F4ednc

骁龙855采用基于Arm Cortex A76 打造的 Kryo 485 CPU，首次集成了一颗超级内核，主频高达2.84GHz，3颗主频2.42GHz的性能内核，4颗主频1.80GHz的效率内核。高通表示骁龙855芯片相比前代产品骁龙845，CPU性能提升 45%，是8系列处理器有始以来最大的一次提升。9F4ednc

苹果和联发科则没有采用大中小核的设计。苹果A12 Bionic的CPU采用6核设计，2个性能核心承担高强度的计算任务，4个能效核心处理日常任务。苹果称最新的性能控制器可动态分配工作至不同核心，需要高速运行时可同时发挥全部六个核心的性能。相比A11 Bionic，A12 Bionic的2个大核速度提升最高达15%，4小核最高节能50%。9F4ednc

联发科Helio P90也采用八核架构，包括2个Arm Corte A75处理器，工作主频率为2.2 GHz，与6个A55处理器，工作主频率为2.0 GHz。联发科表示，最新的CorePilot技术可以确保芯片能够以最高效的方式在八核之间实现运算资源的最优配置，充分发挥八核架构优势。至于为何没有采用大中小核的设计，联发科技资深副总经理暨技术长周渔君对雷锋网表示 :“我们希望每种核心之间的表现能有明显的差别，不然大中小核的架构可能意义不大。当然，架构的选择还需要关注SoC的制程、散热、用途等方面。”9F4ednc

003ednc20181218 9F4ednc

GPU性能提升最高达50%

除了CPU，GPU也是移动SoC主要的关注点，A12 Bionic 4核GPU相比上代3核心的A11 Bionic GPU速度提升最高为50%。麒麟980首发Arm最新的GPU架构Mali G76 MP10，与麒麟970的Mali G72 MP12相比，性能提高46％，能效比提高178％。Exynos的GPU同样从Mali-G72升级为Mali-G76，三星称升级后GPU的性能提升40%或35%的功耗表现。9F4ednc

骁龙855集成Adreno 640 GPU，高通表示新GPU能够带来20%的图形渲染速度提升，同时还能继续保持业界领先水平的每瓦特能效。Helio P90没有选择Arm Mali GPU而是集成了Imagination的PowerVR GM 9446，联发科表示对比Helio P70，Helio P90的GPU性能提升了50%。9F4ednc

骁龙855和Helio P90为什么没有NPU？

了解完5款最新手机SoC的工艺制程、CPU和GPU的升级之后，接下来要谈的是这些最新SoC都强调的AI性能。苹果和华为在SoC中集成了专为处理AI设计的新的NPU，其中A12 Bionic的Neural Engine架构从A11 Bionic的双核增加到了八核，性能也从A11 Bionic每秒能完成6000亿次操作提高到A12 Bionic每秒能够完成5万亿次运算，并且Core ML运行速度最高可提升至9倍。9F4ednc

麒麟980的NPU则是从单核升级为双核，使用了更高精度的深度网络，每分钟可识别4500张图像，具备更高的实时性，支持人脸识别、物体识别、物体检测等AI场景。余承东表示，新的 NPU 处理单元速度比麒麟 970 的NPU快 2.2 倍。9F4ednc

相比苹果和华为海思集成NPU已经到了第二代产品，Exynos9820则是三星首次在SoC中集成专门处理人工智能任务的硬件单元NPU。三星方面称，在NPU的支持下，Exynos9820相比Exynos99810人工智能性能提升7倍，并可以增强从照片到AR的性能。9F4ednc

004ednc20181218 9F4ednc

高通和联发科则没有集成专门处理人工智能任务的硬件单元，而是在已有的硬件单元上进行优化和改进。骁龙855选择在DSP中集成一个全新设计的Hexagon张量加速器（Hexagon Tensor Accelerator，HTA），另外，Hexagon 690处理器、Adreno 640 GPU、Kryo 485 CPU共同构组成了骁龙855支持的第四代多核人工智能引擎 AI Engine，可实现每秒超过7万亿次运算（7TOPs），AI性能较骁龙845提升3倍。9F4ednc

Helio P90对AI性能的提升则是借助APU1.0到APU 2.0的升级，使AI算力提升4倍。据悉APU 2.0采用联发科技的融合AI（Fusion AI）架构，AI算力最高可达到1127 GMACs（2.25 TOPs），支持Int8和FP16。雷锋网此前报道过，APU是基于此前 Helio P30 内置的 VPU（图像处理单元）经过算法提升而推出。因此APU也是基于此前的硬件单元进行的升级和优化。9F4ednc

005ednc20181218 9F4ednc

那么，高通和联发科为什么不像苹果、华为和三星一样在SoCial中集成专为AI加速设计的硬件单元？其实原因很简单，那就是AI相关的技术和算法都还不够成熟，高通和联发科作为手机SoC的提供方，在确定到底哪种算法以及数据类型最适合深度学习之前，押注其中一种不仅不是明智的选择，还可能因为硬件跟不上算法迭代而无法满足市场的需求缺乏竞争力，因此除了借助工艺制程、CPU、GPU的持续升级满足AI应用，高通和联发科还针对目前比较热门的AI图像应用在已有的硬件上进行优化来更好地适应不同手机厂商的需求。还有一点也非常关键，增加NPU带来的成本的增加手机厂商可能难以接受。9F4ednc

相反，无论是苹果、华为还是三星，他们自主研发的SoC目前都只用于自家的手机中，因此在应用和需求相对明确的前提下去增加专用的AI加速单元不仅能获得更好的效果，还能借此打造更多吸引消费者的AI应用，增加手机的吸引力和竞争力。当然，作为全球手机销量前三的三星、华为和苹果，手机的销量也是支撑他们研发自主芯片和集成NPU的基础。9F4ednc

小结

手机作为最普及的智能设备，对于AI的发展和普及有非常重要的作用，手机SoC除了比拼CPU和GPU性能，现在也开始比拼AI性能。不过在AI发展的初期，技术还有很多不确定的时候，手机SoC的提供方选择的是在已有的硬件上进行优化满足AI应用需求，而具备自主研发处理器能力的手机厂商在需求和出货量都更明朗的情况下用NPU来增加手机的竞争力。9F4ednc

还有不可忽略的是，软件在AI性能的提升中发挥着非常重要的作用，越来越多的芯片厂商都在增加在软件方面的投入和优化，同时还在增强与软件公司的合作。9F4ednc

到底谁的AI性能更高体验更好？光看跑分和性能的提升我们难以简单下结论，我们需要等待搭载骁龙855和Helio P90的手机发布后，再做一个对比。9F4ednc

（来源：雷锋网；作者：包永刚；参考链接：leiphone.com）9F4ednc

阅读全文，请先

处理器/DSP 人工智能产业前沿手机设计消费电子

上一篇： 3D打印头像可轻松骗过安卓机，但为何搞不定苹果？ 下一篇： 新一代3D封装技术走向异构集成

微信扫一扫
一键转发
最前沿的电子设计资讯
请关注“电子技术设计微信公众号”

瑞萨电子广受欢迎的RA0系列推出新产品，卓越的功耗、更低成本RA0E2适用于消费电子、小家电、工业系统控制与楼宇自动化等领域···
Cadence 利用 NVIDIA Grace Blackwell 加速 AI 融合设计专业知识与加速计算，推动科技创新、实现能效和工程生产力方面的突破性进展，引领全球生活新范式···
Microchip 推出集成高性能模拟外设的32位PIC32A单片机采用200 MHz CPU集成业界领先的模拟外设，提供高性价比系统级解决方案···
AMD 推出第五代 AMD EPYC 嵌入式处理器，为网络、存储与高性能“Zen 5”架构可提供服务器级性能与效率，并结合专属打造的功能，以优化产品寿命和系统弹性，思科和 IBM 是首批采用第五代 AMD EPYC 嵌入式 CPU 为下一代平台提供支持的技术合作伙伴···
瑞萨推出RA4L1 MCU，超低功耗、集成电容式触控、段码L 全新产品成为计量、物联网传感、智能锁和HMI应用的理想之选···
毫米波雷达与音频技术重塑汽车驾乘新体验汽车行业的发展正由两大创新领域主导：更为精准可靠的车内感知系统和高质量音频系统。传统方法如增加传感器或音频设备数量，虽可提升性能但会带来成本上升和复杂性增加的问题。
康佳特SMARC模块更新: 全新英特尔酷睿3处理器低功耗 SMARC 模块AI 加速和图形处理性能再次提升···
康佳特针对要求苛刻的实时应用推出新型高性能COM-HPC 基于英特尔酷睿 Bartlett Lake S处理器的模块性能全面提升···
兆易创新推出EtherCAT®从站控制芯片，工业自动化的卓越业界领先的半导体器件供应商兆易创新GigaDevice（股票代码 603986）宣布，正式推出EtherCAT®从站控制芯片···
瑞萨率先推出采用车规3nm制程的多域融合SoC 第五代R-Car SoC为集中式E/E架构，带来面向未来的多域融合解决方案，并支持Chiplet扩展···
艾迈斯欧司朗Belago红外LED，助力Supernode打造高精度避 Supernode与艾迈斯欧司朗携手，通过Belago红外LED实现精准扫地机器人避障；得益于Belago出色的红外补光功能，使扫地机器人能够大大提升其识别物体的能力，实现精准避障；Belago点阵照明器采用迷你封装，兼容标准无铅回流工艺，适用于各种3D传感平台，包括移动设备、物联网设备和机器人。
Nordic Semiconductor推出nRF54L15、nRF54L10 和 n 新型先进低功耗蓝牙SoC 带来更高效率和超强处理能力，为广泛物联网应用提高性能和灵活性···

25年第19周新能源周销量：不同价格带的车型走势解析本周插混与增程车型市场呈现出“两极化”趋势：一方面，10-15万元级的主流家用轿车与SUV销量强劲；另一方面，20万元
拆解报告：甲骨文3060W碳化硅服务器电源模块甲骨文服务器电源模块输入输出均为专用接口，采用热拔插设计。电源模块支持200-277V交流和240-380V直流输入，输
评测：森海塞尔ACCENTUM Open真无线耳机半入耳机森海塞尔ACCENTUM Open 真无线耳机采用半入耳式设计，搭配约4.4克的重量，佩戴舒适。耳机充电盒轻盈小巧，携带外
人形机器人如何做到“手眼”协同+“大小脑”协同？人形机器人正站在“走出实验室”的临界点。从本体制造、控制系统、核心零部件到应用场景拓展，技术与产业生态
南非2025年4月：奇瑞和长城汽车快速上升 2025年4月的南非车市增长，马恒达和现代的强劲回归是一个信号，而中国品牌的集体崛起，则预示着未来竞争将更加多
4月新能源车领跑汽车出口增长，中国汽车走向全球的新引擎 2025年开年以来的出口数据呈现出清晰的结构升级路径。新能源产品在出口中扮演的角色日益重要，不再只是锦上添
拆解报告：vivo手机原装90W氮化镓闪充充电器 vivo 90W氮化镓闪充充电器采用经典直板造型设计，同时附带一条专门量身定制的8.5A大电流数据线，配合信号屏蔽层
拆解报告：HONOR荣耀手环10 荣耀手环10在外观方面，延续了上代的轻薄双曲面设计，同时采用全新的双色NCVM镀膜工艺，使之更加的时尚精致。标配
2025年4月中国车企加速渗透土耳其市场：比亚迪Seal U打响突围战 2025年4月，土耳其市场的爆发式增长为全球车企提供了重要信号：新兴市场正在进入电动化转型的加速期，而土耳其作
2025年第19周新能源周销量：问界起势 2025年第19周，中国乘用车市场的周度销量达到44.4万辆，其中新能源车占比突破50%，达22.3万辆，占比50.2%。比亚迪体
2024年4月汽车市场终端数据：自主崛起、新势力分化、合资承压从整体销量数据来看，4 月汽车终端销量达 169.7 万，同比增长 9.3% ，在目前的价格力度下，这个销售数字差强人意。2
拆解报告：华为750W钛金牌服务器电源华为这款服务器电源型号为PAC750S12-TE，支持220V交流或240V直流输入，输出电压为12V，输出电流为62.5A，输出端设有

史密斯英特康推出新一代“ DaVinci Gen V”测试插座史密斯英特康推出新一代“ DaVinci Gen V”测试插座，为人工智能、6G通信及先进计算应用领域的芯片提供超
意法半导体高集成度低边电流测量放大器简化高准确度电流检测意法半导体的 TSC1801低边电流测量放大器集成了设定增益所需的匹配电阻，从而简化了电路设计，节省了物料清单
意法半导体推出创新的、带有可改变存储配置存储器的车规微控制器新推出的Stellar微控制器内置了xMemory技术，它为正在发展的软件定义汽车以及不断进化的电动汽车架构提供了一
新系列串口EEPROM内置唯一ID码，适合设备识别、溯源和可持续性应用意法半导体 (ST) 推出了一系列内置128位唯一只读ID码 (UID) 的串口EEPROM芯片，以满足市场对产品识别、溯
Vishay新添增强短瞬态脉冲防护性能的经AEC-Q200认证的厚膜功率电这些器件采用夹片式TO-247 封装形式，可直接安装在散热器上，具有高达 75 J/0.1 s的高脉冲吸收能力和 150
凉棚集成Nordic 技术实现Matter over Thread连接为家庭和企业 StruXure+ 凉棚和小屋系列集成 Nordic 的 nRF5340 SoC以提供无缝的 Matter over Thread 连接
智能楼宇技术全球领导者与Nordic Semiconductor携手合作确保楼业界连手推动NR+成为智能楼宇的全球连接标准···
Cadence 率先推出 eUSB2V2 IP 解决方案，助力打造高速连接新范 Cadence 在业内率先推出 eUSB2V2 IP，此 IP 基于先进的台积公司 N3P 工艺，符合最新的嵌入式 USB2 版
纳芯微发布双通道电流检测放大器NSCSA285，赋能工业与能源管理近日，上海 —— 纳芯微电子（简称“纳芯微”）发布全新高精度双通道电流检测放大器NSCSA285系列···
攻克PWM高频瞬态干扰难题！纳芯微发布车规级电流检测放大器NSCSA24 近日，纳芯微发布全新车规级双向电流检测放大器NSCSA240-Q1系列，专为汽车高压PWM系统打造解决方案···
TE Connectivity 推出INMORO系列：致力于满足中国市场需求而打造的连接和传感解决方案提供商泰科电子（TE Connectivity，以下简称 TE）工业事业部隆重推出INMORO 系列，致力于满足中
破解汽车与工业等应用新挑战，TDK展示多传感器融合与AI+发展趋势在新能源汽车应用中，热管理系统既要能高效地冷却和加热电池、电机与OBC等车辆核心部件，确保其处于最佳运行温

热门评论
最新评论

换一换

杂志声明

都是拼AI性能，为何苹果/海思集成NPU，高通和联发科却选择优化？

7nm不是唯一选择

CPU高性能核心集群再细分

GPU性能提升最高达50%

骁龙855和Helio P90为什么没有NPU？

小结