三星为何放弃自研CPU？从Exynos 990与对手的差距说起……-EDN 电子技术设计

 想必很多同学也已经听说了，这次 Exynos 990 相比竞争对手依然有差距的事实。这里我将 AnandTech 的一些评论和测试做了综合，分享给各位。

我一直都觉得三星 Exynos 还是挺有趣的 SoC：我记得之前翻译 AnandTech 的苹果 A12 和三星 Exynos 9810 评测文章的时候，有句话我印象特别深刻：“采用 M3 核心的三星 Exynos 9810，能耗达到苹果 A11 的两倍，性能却落后了 55%（注意，是 A11）！”l1fednc

尔后，AnandTech 通过魔改 Exynos 9810 系统层面调度机制的方案，达成了系统性能相较原版的一个显著提升。这些其实都表明，三星在移动 SoC 设计和制造上都可以认为是整体掉队的。所以也不难理解，三星为什么决定放弃自研 CPU 架构。Exynos 990 是三星最后一款采用自研架构的 SoC。l1fednc

想必很多同学也已经听说了，这次 Exynos 990 相比竞争对手依然有差距的事实。这里我将 AnandTech 的一些评论和测试做了综合，分享给各位。本文的绝大部分数据和内容均来自 AnandTech，若需查看英文原文，可拉至本文末尾。我觉得这篇文章能够非常到位地阐释，为什么三星放弃了自研架构，因为无论从哪个层面来看，其自研架构不仅问题极多，而且还远远及不上 Arm 的架构。l1fednc

请注意，注意区分本文的几个词汇：能耗 energy，是指跑测试消耗的能量，单位焦耳；功耗（或功率）power，是指单位时间内消耗的能量，单位瓦特；功效 power efficiency，一般是指每瓦性能；能效 energy efficiency，这里特别指每焦耳的性能——这个性能可以是跑的分值，也可以是游戏帧率。l1fednc

这里需要强调一点，我们日常所说的“能效比”，或者“效率”指的其实是这里的 power efficiency。本文的能效，严格意义上都不是用的这个通俗的意义。l1fednc

综述

三星 LSI 的这颗旗舰 SoC 是在去年 10 月份宣布推出的：它在 CPU 大核心上采用了三星新一代的 M5 架构；中型规模的核心则升级到了 Cortex-A76；采用新的 Mali-G77 GPU。Exynos 990 采用 7nm LPP 制造，即芯片的某些部分采用 EUV 光刻。l1fednc

l1fednc

Exynos 9820l1fednc

这里看一下上一代的 Exynos 9820,，也就是 Galaxy S10 采用的 SoC。以此可了解 Exynos 990 做了怎样的提升和变化。l1fednc

Exynos 9820 的大核心簇是三星定制的 M4 架构，它跟 Arm 公版架构的差异还是比较大的：从互联到缓存一致性，都采用三星的 Coherent Interconnect。Andrei Frumusanu（AnandTech 著名博士编辑）对这种结构有做核心到核心的延迟测试，起码它比 Arm 公版架构的延迟是要大出很多，当然也比骁龙 865 明显更糟糕。l1fednc

l1fednc

Exynos 990l1fednc

Exynos 990 相较 Exynos 9820 的改进其实还是比较多的。首先三星这次终于在小核心上，将 A55 的 L2 cache 推升到了 64KB。要知道 Exynos 9810 和 9820 在这方面就差一截，所以这两款 SoC 相比以前的骁龙 SoC，在效率上就有差距。不过 64KB L2 cache，这个容量仍然只有骁龙 865 的一半（128KB），三星在 Arm 核的 cache 配置上还是比较保守。l1fednc

中核心从先前的 Arm Cortex-A75 升级到了 A76，频率也有提升，从 2.3GHz 提到了 2.5GHz，基于负载不同性能提升可达 38%-50%，也是 Exynos 990 大部分工作的主要动力来源。中核心的 L2 cache 仍然是每个核心 256KB，共享的 L3 cache 也是比较保守的 1MB。l1fednc

大核心部分，早前代号为 Cheetah（猎豹）的 M4 这次升级到了代号为 Lion（狮子）的 M5——也就是三星的自研架构。其最高频率仍然是 2.73GHz，三星宣称会有 20% 的提升，应该主要是来自 IPC 提升。l1fednc

外部可以观察到的最大变化，在于 M5 大核心不再享有各自的 L2 cache，而是 2MB 的核心共享 L2 cache。现如今，这样的微架构设计变化还是比较少见的。这一变化，从核心到核心的延迟降低能看得出来，毕竟这次的缓存一致性是在更低的 cache 层级发生的，和 CPU 也靠的近。l1fednc

Exynos 990 采用三星 7LPP 工艺制造，部分采用了 EUV 光刻。TechInsights 提到，Exynos 990 是首个采用完整 7LPP PDK（Process Design Kit）设计的芯片，这一点和先前的 Exynos 9825 还是有不同的）。l1fednc

三星宣称，7LPP 工艺相比之前的 8LPP 有 7% 的性能提升，应该也意味着同频功耗的降低。实际是个什么情况呢？我把 AnandTech 的内容做个概括：l1fednc

一

Exynos 990 的 binning（可以理解为根据不同的芯片体质，对芯片进行等级分组）看起来是比较糟糕的，而且绝大部分芯片都位列相对较差的体质分组，甚至可能更糟，这表明这颗芯片的良率可能很不理想。l1fednc

二

M5 的核心电压不是很乐观，不仅在同频下相比上一代 M4（8LPP）没有提升，而且随频率升高还表现更差了。M5 需要更高的电压，才能达到先前相同的频率：同样 2.75GHz 最高频率，M5 的峰值电压为 1118mV，而先前的 M4 为 1068mV。l1fednc

三

从功耗与效率曲线来看，纵观性能变化周期内，M5 核心显然在效率上弱于 Cortex-A76（同一个 Exynos 990 SoC 上的）；Exynos 990 A55 小核心的效率比先前的 Exynos 9820 要理想很多；l1fednc

l1fednc

四

Exynos 9820 时期，三星引入了一种更为复杂的 scheduler，基于应用跑的 ISA（指令集结构）选择不同的功耗模型。这种机制会分别追踪 32bit 和 64bit app，然后根据不同 CPU 在不同执行模式下的微架构性能和功耗特性，做出调度决策。三星宣称这种机制能够提升效率，更多的工作可能会分派给 Arm 中核心——因为 A76 在 32bit 执行效率上会更好。l1fednc

l1fednc

从 SPECint2006 的综合成绩来看，其实很难看出这种执行模式有什么大差别。但某些个别的测试子项，比如说 456.hmmer——这是个偏向执行能力的测试，就能看出 A76 核心的优势——A76 核在这个项目的成绩上的确领先于 M5 核。从这个角度来看，三星的调度策略是合理的。l1fednc

另一个例子是，400.perbench 在 32bit 模式下，A76 核心同样优于 M5 核心，所用功耗还低了超过一半。不过更偏存储性能的负载，M5 在跑分上还是有优势的，这可能与两者的 cache size 差异有关。l1fednc

AnandTech 在文章中提到，这是 AnandTech 首次针对 AArch32 和 AArch64 两种执行模式，分别公布跑分成绩。l1fednc

五

在存储延迟测试方面，Exynos 990 相比 Exynos 9820 还是有提升的，但和骁龙 865 比起来却有差距。l1fednc

下面这几张图是 Exynos 990 M5（大核心）、Exynos 990 A76（中核心）、Exynos 9820 M4，以及骁龙 865 A77（大核心）的存储子系统延迟对比。很显然，相比 Exynos 9820，可以看到 Exynos 990 的 L2 cache 在尺寸上变大。M5 核心当然还是会有一些优势，比如说 3 周期的 L1 延迟设计，Arm 核心都是 4 周期。l1fednc

l1fednc

去年的 M4 核心其实就存在 TLB 问题（Translation Lookaside Buffer，一种页表的 cache，是一个内存管理单元，用于提升虚拟地址到物理地址转换速度），今年的 M5 这个问题并未得到合理解决。l1fednc

这会导致一些比较无语的问题，比如说随机访问超过 2MB 的区块，可能还比 1MB 尺寸内的速度更快。相比 L2 cache 区域，L3 的 cache line 访问，TLB 未命中惩罚的访问延迟还更低…（这也可能是 16-64MB 区块内，Exynos 990 弱于 9820 的原因）。l1fednc

而 A76 核心部分显然就比较符合预期了。A76 的 prefetcher 原本就有比较大的提升，在 Exynos 990 之上也有体现，两个 A76 中核心在某些数据访问模式上是优于 M5 核心的。实际上，三星自 M3 设计以来，在存储子系统方面就有比较大的问题，到 M5 也依旧未能解决。l1fednc

六

从 SPECint2006 的测试结果来看，Galaxy S20 的两个不同 SoC 版本，骁龙 865 相比 Exynos 990，各方面都有优势。l1fednc

主要表现在骁龙 865 显然在能效/功效方面有着比较大的提升。l1fednc

早前 Arm 曾表示，A77 核心相比 A76 会在性能上有进步，但两者的功效（energy efficiency）其实是差不多的——也就意味着 A77 需要以功耗换性能。但骁龙 865 则显然超出了 Arm 的预期，不仅使用更少能耗（energy），而且功耗（power）也更低。l1fednc

这可能和骁龙 865 相比上一代改用台积电 N7P 工艺有关，这或许表明 N7P 工艺相比 N7 的确有显著提升。l1fednc

l1fednc

Exynos 990 相比上一代当然也有性能提升，但肯定比不上骁龙的步子。其中有一些成绩比较诡异，比如说 403.gcc 的成绩还不如上一代。更悲伤的是功耗（power）和能耗（energy）。Exynos 990 的能耗其实跟 Exynos 9820 很相近，有时略好，有时又略差。但在有性能提升的情况下，功耗却也明显发生了飙升。l1fednc

本文为电子技术设计原创文章，未经授权禁止转载。请尊重知识产权，违者本司保留追究责任的权利。

1/3 1 2 3 下一页尾页

阅读全文，请先

黄烨锋

欧阳洋葱，编辑、上海记者，专注成像、移动与半导体，热爱理论技术研究。

进入专栏

处理器/DSP 产业前沿知识产权/专利 EDA/IP/IC设计消费电子

上一篇： 交织型采样ADC的基本原理 下一篇： 特斯拉要用国产电池，磷酸铁锂为什么变“香”了？

微信扫一扫
一键转发
最前沿的电子设计资讯
请关注“电子技术设计微信公众号”

瑞萨电子广受欢迎的RA0系列推出新产品，卓越的功耗、更低成本RA0E2适用于消费电子、小家电、工业系统控制与楼宇自动化等领域···
Cadence 利用 NVIDIA Grace Blackwell 加速 AI 融合设计专业知识与加速计算，推动科技创新、实现能效和工程生产力方面的突破性进展，引领全球生活新范式···
Microchip 推出集成高性能模拟外设的32位PIC32A单片机采用200 MHz CPU集成业界领先的模拟外设，提供高性价比系统级解决方案···
康佳特发布领先的AI边缘计算模块搭载英特尔酷睿Ultra处理器解锁工业嵌入式新效能···
AMD 推出第五代 AMD EPYC 嵌入式处理器，为网络、存储与高性能“Zen 5”架构可提供服务器级性能与效率，并结合专属打造的功能，以优化产品寿命和系统弹性，思科和 IBM 是首批采用第五代 AMD EPYC 嵌入式 CPU 为下一代平台提供支持的技术合作伙伴···
瑞萨推出集成DRP-AI加速器的RZ/V2N，扩展中端AI处理器阵无需冷却风扇的高能效MPU实现先进的边缘视觉AI，缩小系统尺寸并降低成本···
飞凌微推出AIoT应用系列高性能端侧视觉AI SoC芯片A1 飞凌微电子近日宣布，正式推出AIoT应用系列首款高性能端侧视觉AI SoC芯片 —— A1···
瑞萨推出RA4L1 MCU，超低功耗、集成电容式触控、段码L 全新产品成为计量、物联网传感、智能锁和HMI应用的理想之选···
毫米波雷达与音频技术重塑汽车驾乘新体验汽车行业的发展正由两大创新领域主导：更为精准可靠的车内感知系统和高质量音频系统。传统方法如增加传感器或音频设备数量，虽可提升性能但会带来成本上升和复杂性增加的问题。
康佳特SMARC模块更新: 全新英特尔酷睿3处理器低功耗 SMARC 模块AI 加速和图形处理性能再次提升···
康佳特针对要求苛刻的实时应用推出新型高性能COM-HPC 基于英特尔酷睿 Bartlett Lake S处理器的模块性能全面提升···
兆易创新推出EtherCAT®从站控制芯片，工业自动化的卓越业界领先的半导体器件供应商兆易创新GigaDevice（股票代码 603986）宣布，正式推出EtherCAT®从站控制芯片···

25年第19周新能源周销量：不同价格带的车型走势解析本周插混与增程车型市场呈现出“两极化”趋势：一方面，10-15万元级的主流家用轿车与SUV销量强劲；另一方面，20万元
拆解报告：甲骨文3060W碳化硅服务器电源模块甲骨文服务器电源模块输入输出均为专用接口，采用热拔插设计。电源模块支持200-277V交流和240-380V直流输入，输
评测：森海塞尔ACCENTUM Open真无线耳机半入耳机森海塞尔ACCENTUM Open 真无线耳机采用半入耳式设计，搭配约4.4克的重量，佩戴舒适。耳机充电盒轻盈小巧，携带外
人形机器人如何做到“手眼”协同+“大小脑”协同？人形机器人正站在“走出实验室”的临界点。从本体制造、控制系统、核心零部件到应用场景拓展，技术与产业生态
南非2025年4月：奇瑞和长城汽车快速上升 2025年4月的南非车市增长，马恒达和现代的强劲回归是一个信号，而中国品牌的集体崛起，则预示着未来竞争将更加多
4月新能源车领跑汽车出口增长，中国汽车走向全球的新引擎 2025年开年以来的出口数据呈现出清晰的结构升级路径。新能源产品在出口中扮演的角色日益重要，不再只是锦上添
拆解报告：vivo手机原装90W氮化镓闪充充电器 vivo 90W氮化镓闪充充电器采用经典直板造型设计，同时附带一条专门量身定制的8.5A大电流数据线，配合信号屏蔽层
拆解报告：HONOR荣耀手环10 荣耀手环10在外观方面，延续了上代的轻薄双曲面设计，同时采用全新的双色NCVM镀膜工艺，使之更加的时尚精致。标配
2025年4月中国车企加速渗透土耳其市场：比亚迪Seal U打响突围战 2025年4月，土耳其市场的爆发式增长为全球车企提供了重要信号：新兴市场正在进入电动化转型的加速期，而土耳其作
2025年第19周新能源周销量：问界起势 2025年第19周，中国乘用车市场的周度销量达到44.4万辆，其中新能源车占比突破50%，达22.3万辆，占比50.2%。比亚迪体
2024年4月汽车市场终端数据：自主崛起、新势力分化、合资承压从整体销量数据来看，4 月汽车终端销量达 169.7 万，同比增长 9.3% ，在目前的价格力度下，这个销售数字差强人意。2
拆解报告：华为750W钛金牌服务器电源华为这款服务器电源型号为PAC750S12-TE，支持220V交流或240V直流输入，输出电压为12V，输出电流为62.5A，输出端设有

史密斯英特康推出新一代“ DaVinci Gen V”测试插座史密斯英特康推出新一代“ DaVinci Gen V”测试插座，为人工智能、6G通信及先进计算应用领域的芯片提供超
意法半导体高集成度低边电流测量放大器简化高准确度电流检测意法半导体的 TSC1801低边电流测量放大器集成了设定增益所需的匹配电阻，从而简化了电路设计，节省了物料清单
意法半导体推出创新的、带有可改变存储配置存储器的车规微控制器新推出的Stellar微控制器内置了xMemory技术，它为正在发展的软件定义汽车以及不断进化的电动汽车架构提供了一
新系列串口EEPROM内置唯一ID码，适合设备识别、溯源和可持续性应用意法半导体 (ST) 推出了一系列内置128位唯一只读ID码 (UID) 的串口EEPROM芯片，以满足市场对产品识别、溯
Vishay新添增强短瞬态脉冲防护性能的经AEC-Q200认证的厚膜功率电这些器件采用夹片式TO-247 封装形式，可直接安装在散热器上，具有高达 75 J/0.1 s的高脉冲吸收能力和 150
凉棚集成Nordic 技术实现Matter over Thread连接为家庭和企业 StruXure+ 凉棚和小屋系列集成 Nordic 的 nRF5340 SoC以提供无缝的 Matter over Thread 连接
智能楼宇技术全球领导者与Nordic Semiconductor携手合作确保楼业界连手推动NR+成为智能楼宇的全球连接标准···
Cadence 率先推出 eUSB2V2 IP 解决方案，助力打造高速连接新范 Cadence 在业内率先推出 eUSB2V2 IP，此 IP 基于先进的台积公司 N3P 工艺，符合最新的嵌入式 USB2 版
纳芯微发布双通道电流检测放大器NSCSA285，赋能工业与能源管理近日，上海 —— 纳芯微电子（简称“纳芯微”）发布全新高精度双通道电流检测放大器NSCSA285系列···
攻克PWM高频瞬态干扰难题！纳芯微发布车规级电流检测放大器NSCSA24 近日，纳芯微发布全新车规级双向电流检测放大器NSCSA240-Q1系列，专为汽车高压PWM系统打造解决方案···
TE Connectivity 推出INMORO系列：致力于满足中国市场需求而打造的连接和传感解决方案提供商泰科电子（TE Connectivity，以下简称 TE）工业事业部隆重推出INMORO 系列，致力于满足中
破解汽车与工业等应用新挑战，TDK展示多传感器融合与AI+发展趋势在新能源汽车应用中，热管理系统既要能高效地冷却和加热电池、电机与OBC等车辆核心部件，确保其处于最佳运行温

热门评论
最新评论

换一换

杂志声明

三星为何放弃自研CPU？从Exynos 990与对手的差距说起……

综述

一

二

三

四

五

六