广告

首次超越苹果?全面剖析华为Mate 40的绝版“麒麟9000”处理器

2020-11-03 10:32:24 黄烨锋 阅读:
由于受到美国打压,华为的麒麟9000处理器成为“绝唱”,也是Mate 40系列手机的绝版处理器,国外Mate40起步价高达899欧元,国内起步价高达4999,Mate 40 Pro国内高达6499+。从定价看,华为Mate 40/Pro已经与苹果iPhone 12 Pro相差无几,从功能上看也相差不大,有些功能譬如屏下指纹、四摄、反向无线充电等甚至是苹果没有的。那么从麒麟9000这个“绝版”处理器上来看,性能如何呢?本文就从CPU、GPU、NPU、5G等各个方面全面剖析华为Mate 40的绝版“麒麟9000”处理器。

由于受到美国打压,华为的麒麟9000处理器成为“绝唱”,也是Mate 40系列手机的绝版处理器,国外Mate40起步价高达899欧元,国内起步价高达4999,Mate 40 Pro国内高达6499+。从定价看,华为Mate 40/Pro已经与苹果iPhone 12 Pro相差无几,从功能上看也旗鼓相当,有些功能譬如屏下指纹、四摄、反向无线充电等甚至是苹果没有的。那么从麒麟9000这个“绝版”处理器上来看,性能如何呢?本文就从CPU、GPU、NPU、5G等各个方面全面剖析华为Mate 40的绝版“麒麟9000”处理器。hBVednc

原标题:全面剖析麒麟9000:华为Mate 40碾压了谁?hBVednc

作者:黄烨锋hBVednc

华为Mate 40系列手机中国区的发布会今天刚刚在上海举办,其中最引人注目的部分自然就是在这个特殊历史时期出现的海思麒麟(Kirin)9000 SoC了。华为照例在手机发布会前,小规模召开了一次麒麟芯片媒体沟通会。hBVednc

有关Mate 40系列手机本身,我将另外撰文,与本文同期发布。本文主要探讨麒麟9000这颗芯片——虽然电子工程专辑此前已经在这款手机的全球发布会期间,对这颗芯片做了简单的探讨,我还是希望能够更全面地来呈现这颗,未来回看可能具有历史意义的SoC。hBVednc

本文篇幅较长,主体上分成5个部分。各位可按照自己感兴趣的话题,选择性阅读:hBVednc

(1)配置总览hBVednc

(2)CPUhBVednc

(3)GPUhBVednc

(4)NPU(与ISP)hBVednc

(5)5GhBVednc

hBVednc

153亿个晶体管,配置一览

麒麟9000系列SoC主要包含两个型号,分别是麒麟9000和麒麟9000E。这两者的主要区别是9000E的GPU少两个核心,以及NPU少一个大核。猜测这可能会是个更经济的做法,因为153亿个晶体管实在是很大的规模:苹果A14也“不过”118亿晶体管(当然A14不带modem)。其中这次的Mali G78 GPU铺满24个核心的实施方案,算是巨大规模了。又还是初代5nm工艺,考虑到良率问题——通过binning的方式,在产线上划分出一个9000E,显然会更经济。hBVednc

首先当然还是看一看麒麟9000的主要配置情况:hBVednc

CPU:1x Cortex-A77 3.13GHz,3x Cortex-A77 2.56GHz,4x Cortex-A55 2.05GHzhBVednc

GPU:Mali G78MP24(9000E为MP22)hBVednc

NPU:Da Vinci,2x Big-Core,1x Tiny-Core(9000E的Big-Core是1个)hBVednc

内存:LPDDR4X-2133/LPDDR5-2750hBVednc

Modem:Balong 5000(Sub-6G,下行双载波4.6Gbps,上行双载波2.5Gbps)hBVednc

ISP:6.0,Quad pipeline,3A(AE/AWB/AF)处理能力提升100%,处理管线速度提升50%hBVednc

其他:HiFi Audio,4K HDR Video,Mobile Secure ProcessorhBVednc

工艺:台积电5nm(N5?)hBVednc

hBVednc

这其中比较令人在意的有几点,其一是CPU部分用的是Cortex-A77。已经上市半年多的骁龙865用的就是A77。Arm实则已经发布了Cortex-A78和X1。传言未来的高通骁龙875和Exynos 1080都会采用Cortex-A78。起码在新IP的采用上,麒麟芯片晚了一步。另外GPU部分,华为直接跳过了Mali G77,转而采用Mali G78。这些都会在下文做探讨。hBVednc

除此之外,今年华为似乎格外在意AI的应用——虽然现在看来Android NN生态(以及华为HiAI)建设仍然比较初级,华为也仍然期望在拍照之外,让算力在行业内领先的NPU有更多的用武之地。hBVednc

尤为值得一提的是,华为今年公布相关麒麟SoC与竞品的对比数据,华为Fellow艾伟在台上呈现的内容,都更多的出现了“效率”和“能效”,而不再只是单纯的性能。这一点实则也是麒麟SoC已经完全步入成熟的依据:电子工程专辑的微信服务号很快会发布一篇海思手机SoC从K3V2时期开始,至麒麟9000这8年来的发展历程总结文章。这8年是非常典型的由青涩走向成熟,从差强人意迈向一流的过程。hBVednc

CPU:一次常规升级

麒麟9000 CPU部分是1+3+4组合结构,这种组合方法原本也是DynamIQ灵活性的体现。今年年初的麒麟820 5G用的也是这种组合方式,高通也已经沿用了两代。最大的那颗Cortex-A77核心3.13GHz主频是比骁龙865+(3.1GHz)还要略高一点点的,比去年Kirin 990大核A76的2.86GHz也高了9.4%。Cache分配情况未知。hBVednc

在提升方面,华为这次并未与前代产品比较,而是说CPU性能比骁龙865+领先10%,能效则领先25%——基于Geekbench 5的跑分。从Geekbench 5数据库来看,骁龙865+相比麒麟990的CPU多核性能领先了大约14-18%。这样算来,麒麟9000比上一代麒麟990,CPU性能提升大约在25-30%左右。hBVednc

hBVednc

当然这个对比是不严谨的,Geekbench 5用于反映CPU的绝对性能可能会有偏差。不过Arm官方早前发布A77的时候就提到,Cortex-A77相比A76有着20-25%的IPC提升,加上麒麟9000的频率提升,麒麟9000 CPU整体上25-30%的性能提升是在情理之中的。能效部分与前代很难直接比较,而且骁龙865+作为865的提频版本,在效率上本来就会妥协——麒麟9000 CPU效率必然是提升的,其中还需考虑到5nm工艺带来的红利,与上代产品相较的提升幅度值得做进一步观察。hBVednc

需要指出的是,华为从麒麟980开始越来越关注存储子系统的提升——980配上了DSU 4MB L3大缓存;到了麒麟990,虽然CPU的整体架构和内存支持都没变,但开始采用新的LLC:system cache(下图中间部分,系统级别的cache),并降低存储子系统的整体延迟,令麒麟990的性能表现仍然比980有提升,而且功耗还更低——这一点在当时还是非常惊艳的。hBVednc

hBVednc

Kirin 990 Die shot source: TechInsights - Labelling & Custom contrast: AnandTechhBVednc

今年麒麟9000似乎将system cache提升到了8MB(艾伟在说NPU环节的Smart Cache 2.0时提到了这一点,“相对直接访问内存来说,带宽提升了一倍,能效提升15%”,但不确定是否就是指整个系统LLC的system cache),这应该是相比上代容量的翻番了。实际上高通和苹果此前也已经开始注重这个层级的cache布局。这部分理论上可以在SoC上服务于多个IP,不仅用于提升性能,而且也提升了能效。hBVednc

此外,LPDDR5支持实则也会对手机的整体系统性能有提升帮助,骁龙865机型已经享受了这部分红利。相比麒麟990,麒麟9000在CPU方面的确是一次比较大的提升。不过也需要在意,今年年中发布的Cortex-A78能做到与A77相同功耗情况下持续性能20%的提升;预计晚些时间发布的骁龙875还是可以超过麒麟9000的——当然这是一个常态,尤其随着华为的手机SoC步入成熟,每年不同SoC厂商的迭代,都是在不同时间点此消彼长的。

本文为电子技术设计原创文章,未经授权禁止转载。请尊重知识产权,违者本司保留追究责任的权利。
黄烨锋
欧阳洋葱,编辑、上海记者,专注成像、移动与半导体,热爱理论技术研究。
  • 微信扫一扫
    一键转发
  • 最前沿的电子设计资讯
    请关注“电子技术设计微信公众号”
  • 英伟达发布最新AI芯片H200,将成为其史上最赚钱产品之一 NVIDIA宣布推出全新 H200 Hopper GPU,是目前用于训练最先进的大型语言模型H100芯片的升级版,据介绍,在执行推理或生成问题答案时,H200的性能比H100提升了60%至90%。此外,NVIDIA还宣布了一项由其 Grace Hopper 超级芯片(GH200)驱动的大型超级计算机项目。
  • 英伟达最新中国专供芯片曝光,性能相比A800、H800整体下 业内消息称NVIDIA计划为中国市场推出至少三款新的AI GPU,这三款新芯片被命名为H20、L20和L2。此前,国内媒体曾透露,这三款芯片为HGX H20、L20 PCle和L2 PCle,由H100改良而来。据称,这些芯片基于Hopper和Ada架构,最高理论性能可达296 TFLOP,适用于云端训练、云端推理以及边缘推理。
  • 法国科学家研发最迄今灵敏的力传感器,有望发现未知的第 法国科学家利用极冷的铷原子,制造出了迄今最灵敏的力传感器,其可测量拎起单个电子所需力十分之一大小的力。研究人员表示,这么小的力极难测量,而新传感器可在几微米外对其开展测量,未来有望发现新的力。
  • TinyML计算机视觉正在通过微型神经处理器(μNPU)变成 随着硬件成本的降低、计算能力的显著提高,以及用新方法训练和部署模型变得更加容易,无处不在的基于机器学习的边缘视觉处理正在不断发展。这减少了采用的障碍,并增加了计算机视觉人工智能在边缘的使用。
  • SoC处理器对NOR Flash提出新要求 半导体工艺的节点发展非常快,最近3纳米已经量产了。工艺节点的降低,它的特征尺寸降低,它的速度也会越快。另外,节点的降低也会带来电压的降低,它的功耗降低。
  • 传感器+AI可以实现哪些好处? 除了方案之外,边缘AI算法也可以集成到传感器本体中,因为传感器只要集成一个超低功耗的处理器,就可以实现此动作。
  • 联发科天玑9300参数曝光:12核,最高主频3.25GHz 与骁龙8第三代一样,天玑9300也将拥有最高主频3.25GHz的核心。
  • 拆解PogoCam眼镜相机模块:概念怪异但实现值得称赞 根据我在多年来的技术报道中所观察到的情况,产品失败通常可归咎于以下一个或两个原因:产品理念很扎实,但实现效果却不佳;实现很扎实,但基础产品概念却很糟糕。在我看来,今天的拆解对象完全属于第二类,它就是PogoCam。
  • 2023 STM32全国巡展,米尔限量发STM32MP135开发板优惠 以“STM32,不止于芯”为主题的第十六届STM32全国巡回研讨会将走进11个城市,本届研讨会为全天会议,我们将围绕STM32最新产品开展技术演讲和方案演示。
  • 特斯拉上线耗资3亿美元的人工智能集群 特斯拉已推出备受期待的超级计算机 。该机器将用于各种人工智能(AI)应用,但该集群功能非常强大,也可用于要求苛刻的高性能计算(HPC)工作负载。据称,基于 Nvidia H100 的超级计算机将成为世界上最强大的机器之一。
  • 华为公开倒装芯片封装专利,可改善散热 华为技术有限公司日前公开了一项名为“具有改进的热性能的倒装芯片封装”专利,申请公布号为CN116601748A。该专利实施例提供了一种倒装芯片封装、一种装备有应用封装结构的电路的装置以及一种组装封装的方法,更直观来说,就是一种提供芯片与散热器之间的接触方式,能帮助改善散热性能。
  • 神威超级计算机新的大涡流模拟代码入围2023年戈登贝尔 计算机械协会(ACM)戈登·贝尔奖(GBP)奖委员会选出了六位入围者,入围者的工作涉及各种应用,包括材料科学、流体动力学、核模拟、地震处理和生物分子模拟。硬件平台也包括世界一流的系统:Frontier(ORNL,美国)、新神威系统(Sunway System,中国无锡)……
广告
热门推荐
广告
广告
EE直播间
在线研讨会
广告
广告
面包芯语
广告
向右滑动:上一篇 向左滑动:下一篇 我知道了