广告

Arm以历史罕见阵容IP推进全面计算战略

2021-05-29 14:02:35 邵乐峰 阅读:
从全面升级到Armv9架构,到公布Neoverse V1和N2平台技术细节,再到推出三款基于Armv9架构的全新CPU内核,短短两个月时间里,Arm全面计算(Arm Total Compute)战略正在以令人难以置信的速度加速推进,密集,但有条不紊。

从全面升级到Armv9架构,到公布Neoverse V1和N2平台技术细节,再到推出三款基于Armv9架构的全新CPU内核,短短两个月时间里,Arm全面计算(Arm Total Compute)战略正在以令人难以置信的速度加速推进,密集,但有条不紊。8piednc

何为“全面计算”

其实在2019年,Arm就提出要在共同架构下推动全面计算,旨在解决单个IP与碎片化解决方案优化问题时面临的重大挑战,并随后发布了Total Compute解决方案白皮书。这意味着,在解决系统创新设计的挑战时,Arm需要将关注焦点逐渐从单一的产品演进,转化为以应用场景与体验为导向的系统解决方案,要对硬件IP、物理IP、软件、工具、以及彼此间的协作进行全面优化。8piednc

8piednc

这是在思考方式上做出的重大转变。8piednc

Arm全新的IP设计思路可以归纳为两点:一是以应用场景、消费者体验与生态系统的需求为核心;二是深度聚焦在性能、安全性与开发人员介入权的优化,从而为未来的计算平台提供安全的基础,提升性能与效率,给予开发人员通过整个Arm生态系统获取更多性能的机会。8piednc

Arm高级副总裁兼终端设备事业部总经理Paul Williamson表示,在全面计算的概念下,IP之间的PPA(性能、功率、面积)原则也许不再是最重要的,反而是系统级的性能更为重要。此外,要确保开发者拥有最佳的开发体验、并且对每一台设备的性能与安全功能都有更简易的取用途径。8piednc

来自Arm的最新统计数据显示,仅在2020年Q4季度,Arm芯片合作伙伴就出货了73亿颗Arm架构芯片(年增22%),相当于每秒出货超过900颗芯片、每日出货7000万颗芯片,创下出货量历史新高。而2020年的总出货量更是高达250亿颗(年增13%)累计总数已超过1,900 亿。同时,Arm Mali GPU出货量累计超过80亿颗,其中2020年出货超过10亿,持续位居全球GPU出货量榜首。8piednc

授权业务方面,2020财年,Arm与104家客户签署了162个授权协议,其中有超过一半的授权对象为首次与Arm合作的企业。Arm Flexible Access 目前已有 90 家合作伙伴,通过该计划,这些合作伙伴可以更容易地获取各项全球领先的 Arm IP、工具与支持。8piednc

按照Paul Williamson的说法,Armv9带来了落实全面计算设计战略的三大关键原则:首先是安全性,主要是引入内存标签扩展(MTE)、指针验证(pointer authentication, PA)等新的安全技术;其次是开发者可及性,例如在机器学习方面,通过支持BFloat16格式更好地去支撑Int8计算和BFloat16 的Matmul;第三是计算性能,通过提升可伸缩矢量扩展能力,能够更好地帮助开发者对高阶的应用场景进行开发,比如图像信号处理。8piednc

“Arm正致力于将Armv9技术引入包括笔记本电脑、台式机、云、5G网络、数据中心、更多终端与车载架构计算在内的各个领域,借助移动生态系统的规模优势,以系统级设计最大程度地提高性能。”Paul Williamson说,目前来看,全面计算在高性能应用场景(游戏生态、拥有丰富人工智能功能的应用)、涉及安全功能的应用场景(安全交易、银行类应用、设备端个人数据保护等)中将会拥有更高的接受度。 8piednc

例如在游戏中,“我们测量了整个游戏内容中全面计算系统优化的结果,每个系统组件都有助于性能的提升。Cortex-A710 CPU在运行驱动工作负载时,带来了33%的性能提升;Mali-G710带来了20%的性能提升,我们的系统级IP提供了15%的效率提升。”8piednc

再比如在AI中,“不同的Arm IP上运行多样的AI工作服在带来的巨大性能提升。这些性能提升各异,从Mali-G710平均35%的提升,到Cortex-M55的高达700%的提升,真是针对能耗有限制的工作负载,例如关键字侦测。”8piednc

在多种不同应用场景之间进行设计权衡是比较困难的。因此,Arm全面计算框架的推出为生态系统合作伙伴提供了跨多种应用的可扩展性,也为具体的场景用例提供了特定的加速或增强功能,既能针对应用场景构建优化的解决方案,同时也能平衡解决方案的性能和成本,这是下游设计真正需要的,在真实的用例中也非常有价值。 8piednc

高筑墙,广积粮

关于Armv9架构和Neoverse V1/N2平台技术的更多内容,本刊此前曾进行过持续追踪报道,有兴趣的读者可点击《Armv9细节公布,Arm迎来十年最大架构革新》、《性能如此强悍的服务器CPU对Arm意味着什么?》等文章进行了解,本文将更多介绍最新推出的IP套件,包括:首批Armv9 Cortex CPU、Mali GPU和全新的CoreLink系统 IP,共计10款产品。8piednc

Arm Cortex CPU:全面计算解决方案的基石 

三款Armv9架构的CPU核包括:旗舰级Cortex-X2、大核CPU Cortex-A710、高效率小核Cortex-A510。8piednc

8piednc

其中,Cortex-X2主要面向智能手机市场,相比于Cortex-X1,性能提升16%,可将旗舰型安卓智能手机的性能在当前基础上再提升30%。除了峰值性能外,Cortex-X2还可在旗舰智能手机和笔记本电脑之间扩展,使合作伙伴可以根据市场需求来设计基于不同场景的计算能力。8piednc

Cortex-A710是首款基于Armv9架构的大核CPU,与Cortex-A78相比,能效提升30%,性能提升10%。通过性能和效率的提升,当智能手机运行高要求的App时,用户将获得比以往更长的使用时间以及更优化的体验。8piednc

Cortex-A510是Arm过去四年来推出的首款高效率小核,其性能提升35%,机器学习性能提升超过3倍。它所带来的性能水平已经接近几年前推出的上一代大核Cortex-A73,性能差距不到10%,但能效优化可达35%,适用于智能手机、家用设备和可穿戴设备。8piednc

Armv9-A CPU集群的支柱是新款的动态共享单元(DynamIQ Shared Unit)DSU-110,该组件可为不同的细分市场提供各种解决方案。DSU-110具备可扩展性,可支持多达八个Cortex-X2内核配置,也难怪Williamson在介绍中说,“一台基于Cortex-X2的笔记本电脑比起2020年市场主流的笔记本,其单线程性能可领先40%。“8piednc

8piednc

如下图所示,在2021年消费设备中常见的“1超大核+3大核+4小核,4MB L3(DSU)” Tri-Cluster CPU架构中,如果将X1替换为X2,A78替换为A710,A55替换为A510,DSU替换为DSU-110,4MB L3(DSU)替换为8MB L3(DSU-110),预计2022年终端设备的峰值性能将会提升30%,持续性能将会提升30%,小核性能将会提升35%。8piednc

8piednc

面向细分市场的新款 Arm Mali GPU套件 

视觉体验仍然是消费者与设备交互、并享用设备的关键,Arm新推出面向广泛应用的多款GPU,搭配Armv9 CPU,继续提升用户体验。8piednc

8piednc

最新的Arm Mali-G710是针对旗舰智能手机和Chromebook笔记本市场的高性能 GPU,在计算密集型体验方面的性能提升20%(如AAA高保真游戏)。对于与机器学习有关的任务(如全新相机和视频模式的图像增强),Mali-G710也带来35%的机器学习性能提升。8piednc

作为次旗舰GPU,Mali-G610继承了Mali-G710 的功能,但价格更低,可将高阶应用场景带给更多的开发者和消费者。8piednc

Mali-G510实现了性能和效率的较好平衡,在中端智能手机、旗舰智能电视和机顶盒上,实现了100%的性能提升以及22%的节能优化,从而延长了电池续航时间,提升了100%的机器学习性能。8piednc

Mali-G310是Arm目前最高效的GPU,以最小的面积成本提供了最高的性能。通过Mali-G310,Valhall架构和高质量图形技术将被引入到更低成本的设备中,例如入门级智能手机、AR设备和可穿戴设备。8piednc

提升系统性能的互连技术

互连技术对于提高系统性能至关重要。最新的CoreLink CI-700一致性互连技术和CoreLink NI-700片上网络互连技术,可与Arm CPU、GPU和NPU IP无缝搭配,跨 SoC解决方案增强系统性能。CoreLink CI-700和CoreLink NI-700对新的Armv9-A功能提供硬件级支持,如内存标签扩展(Memory Tagging Extension),支持更高的安全性、改进的带宽和延迟。8piednc

8piednc

可以看出,全新的全面计算解决方案是系统范围内整体优化的思路,横跨硬件 IP、物理 IP、软件、工具和标准,能够为合作伙伴提供更为广泛的选择,以满足细分市场的应用场景和成本区间需求。同时,这也将解锁整个生态系统的新体验,例如,专为移动设备设计、支持 AI 功能的交互式应用场景,可以使用户身临其境观看电视8K内容等体验。8piednc

2023年移动应用产品仅提供64位大、小核

随着IP战略的升级,Arm宣布,将在2023 年面向移动应用仅提供64位的大核和小核。为此,Arm全球合作伙伴正在努力确保所有App都将在今年年底前支持64位。8piednc

据Paul Williamson介绍,Cortex-X2是完全面向智能手机市场的产品,预计在未来几代手机产品中就能看到Cortex-X2的身影。对智能手机和其他终端计算设备而言,64位将提供终极的性能表现。Arm目前正与中国应用商店生态合作伙伴进行密切协作,确保主要App都能在今年年底前支持 64 位,从而为中国消费者提供Cortex-X2所带来的性能提升体验。8piednc

Arm方面透露,向64位过渡需要分阶段实现,目前,Cortex-X2、Cortex-A510已经是64位CPU,A710仍然支持32位。预计到2023年,Arm在移动应用的大核跟小核都将仅支持64位。8piednc

结语:

Paul Williamson总结称,Arm合作伙伴希望能够将新品更快速地推向市场,而全面计算解决方案包含了SoC设计流程中所需要的一切组件:硬件 IP、软件、物理IP、工具和标准,将使合作伙伴在应对所有终端市场上SoC复杂性时受益,让他们能够满怀信心地通过最新的技术,将高性能的产品快速推向市场。8piednc

邵乐峰
暂无简介...
  • 微信扫一扫
    一键转发
  • 最前沿的电子设计资讯
    请关注“电子技术设计微信公众号”
  • Nothing Phone 1 官方承认品控缺陷,但拆解后有新发现 前一加手机联合创始人裴宇创立的 Nothing 公司在国外备受关注,但Nothing Phone 1发布之后却被网友爆料大量翻车现场。目前官方也已承认了Nothing Phone 1 在前摄开孔位置附近出现了坏点或绿晕的问题。但Nothing Phone 1也并非一无是处,著名的 JerryRigEverything 耐用性测试就称其“超级坚固”。
  • 拆解一个中国产的“树莓派”开发笔记本,售价279美元值 “树莓派”在全球市越来越受欢迎,甚至有家长开始让孩子用树莓派学习开发产品。有中国厂商嗅到,率先开发出了基于“树莓派”笔记本——CrowPi L ,外观看和普通笔记本差不多, 但却是基于树莓派Raspberry Pi 4B 开发板的套件,专为 STEM 教育而设计,带有可选的电子模块和教程。EDN发现有外媒对其进行了拆解,接下来将这篇拆解文章分享给大家:
  • iFixit 拆解M2 MacBook Ai:没有散热器,但有用途不明的加 日前,iFixit发表了M2 MacBook Air的拆解视频,表示在M2 MacBook Air 中发现了新增的端口,以及加速度计。
  • “智能家居”未来将可通过呼吸控制操作 凯斯西储大学的研究人员创造了一个简单的原型设备,使用户能够通过改变他们的呼吸模式来控制“智能家居”。这种自供电装置可放入鼻孔,并有可能提高行动不便或无法清晰说话的人的生活质量。如果个人呼吸困难,它也可以编程为医务人员提供自动警报。
  • 适用于CSP GaN FET的简单高性能散热管理解决方案 本文将演示芯片级封装(CSP) GaN FET提供的散热性能为什么至少能与硅MOSFET相当,甚至更胜一筹。GaN FET由于其卓越的电气性能,尺寸可以减小,从而能在不违背温度限制的同时提高功率密度。本文还将通过PCB布局的详细3D有限元仿真对这种行为进行展示,同时还会提供实验验证,对分析提供支持。
  • 小米12s系列发布:首款徕卡品牌、1 英寸摄像头传感器、 继一加牵手哈苏(HASSELBLAD)以及 Vivo 牵手蔡司之后,小米和徕卡在今年早些时候也宣布建立合作伙伴关系。小米在六月底宣布,小米 12S 系列将成为该交易的第一批手机,就在昨日,小米举办了小米12S系列新品发布会,包括小米12S、小米12S Pro、小米12S Ultra三款手机,这三款手机均提供徕卡 Summicron 镜头以减少眩光并提高透光率,同时还提供徕卡成像配置文件。
  • 拆解最新款M2 MacBook Pro ,苹果用旧硬件改造的“新” iFixit指出,即使是新款 M2 MacBook Pro 的底盖也与 2020 年推出的版本相同。两款机型的底部均刻有型号“A2338”以及相同的 FCC ID。这意味着苹果只是简单地回收了旧硬件,并在板上安装了新芯片。
  • 雷军官宣自研电池管理芯片“澎湃 G1”,及小米 12S系列 今日(7月1日),雷军在个人微博官宣新的自研芯片——小米澎湃G1电池管理芯片,该芯片将于7月4日与小米12S系列共同发布。此外,还分享了小米电池技术新进展、小米自研FBO焕新存储技术以及最新升级的叶脉冷泵散热技术。
  • AI视觉芯片如何赋能两轮车出行? 6月29日,在由全球领先的专业电子机构媒体AspenCore和深圳市新一代信息通信产业集群联合主办的“2022国际AIoT生态发展大会-智慧两轮车分论坛”中,嘉楠科技副总裁汤炜伟以《勘智AI视觉芯,赋能智眼两轮行》为主题,向大家分享了嘉楠地芯片设计创新历程,及其RISCV架构AI芯片技术路线图,并以具体案例展示AI视觉芯片如何赋能两轮车出行。
  • Arm发布第二代 Armv9 CPU及首款移动端支持光追的GPU 日前,Arm推出了基于Armv9架构新一代的CPU,包括Arm Cortex-X3、Arm Cortex-A715等,同时还带来了其首款在移动端支持硬件光线追踪的GPU——Immortalis GPU。这是自Arm去年3月发布全新v9架构、5月发布第一代基于v9架构产品后的第二次更新。
  • 用M2芯片升级M1 MacBook Pro,结果…… 虽然新款 MacBook 与上一代机型的硬件和外形尺寸大致相同,但 M2 芯片的升级带来了主要的性能和电池增益。YouTuber用户@ Luke Miani尝试使用 M2 芯片升级 M1 MacBook Pro。该UP主想知道,既然设计结构相同,那么将 M1 芯片换成 M2 芯片能否成功……
  • 英特尔张宇:边缘AI有三个阶段,我们还处在山脚 在AspenCore举办的“2022国际AIoT生态发展大会”上,英特尔公司高级首席工程师、物联网事业部中国区首席技术官张宇博士通过视频方式分享了“边缘AI技术发展趋势与展望”主题演讲。
广告
热门推荐
广告
广告
EE直播间
在线研讨会
广告
广告
面包芯语
广告
向右滑动:上一篇 向左滑动:下一篇 我知道了