广告

全面计算雄心!一文解构“十年磨一剑”的Armv9新架构

2021-08-06 15:46:31 阅读:
在由易维讯主办的第九届年度中国电子ICT媒体论坛暨2021产业和技术展望研讨会上,安谋科技高级FAE经理邹伟为业界深度解读Arm历经十年打磨才新发布的针对不同层次算力需求、机器学习(ML)发展路径的全新一代Armv9架构,其不仅是Arm架构演进的又一个里程碑,也将成为Arm未来十年及更远时代推进行业创新的基础。

近日,在由易维讯主办的第九届年度中国电子ICT媒体论坛暨2021产业和技术展望研讨会上,安谋科技高级FAE经理邹伟为业界深度解读Arm历经十年打磨才新发布的针对不同层次算力需求、机器学习(ML)发展路径的全新一代Armv9架构,其不仅是Arm架构演进的又一个里程碑,也将成为Arm未来十年及更远时代推进行业创新的基础。zewednc

zewednc

安谋科技高级FAE经理邹伟现场演讲zewednc

Armv9:凭何改变高性能计算方式

纵观半导体设计在过去十多年的发展,特别是在终端消费等领域,算力带来的生产力的提升,通过移动互联网把大量的计算力放到每一个消费者的手中。与此同时,传统依赖于人工采集和分析数据的过程在第五波计算浪潮中正演变成机器对机器之间的数据采集、存储、分析和服务。由此产生的海量数据需要在云端、边缘侧配置更为强大的算力,并通过数据中心对获得的数据进行分析、构建和决策。zewednc

Arm在成为移动浪潮主流架构之外,已进入到边缘端和云端等新场景,其独特的定位可为行业实现稳固的安全基础,同时确保开发者以最简便、快速的方式来使用Arm的安全技术。据邹伟介绍,截止至2020年底,基于Arm IP的芯片累计售出1800亿颗,涵盖在各行各业每一个角落,每一个地方。共享的数据一定会有一个或多个环节经过Arm处理器计算,无论是数据采集的IoT设备,还是日常使用的手机、智能电脑,甚至服务器、超级计算机等。zewednc

据Arm预测,未来十年合作伙伴基于Arm芯片的出货量将超过3000亿,100%的共享数据将在Arm芯片上进行处理,无论是在终端还是在云端。因此,亟需一款全新的处理器架构在未来十年内改变计算的方式,以提供更高的性能、改善安全功能并增强工作负载功能。zewednc

zewednc

邹伟现场介绍全新Armv9架构特性zewednc

“为此,Arm正式推出了面向未来十年的新一代架构Armv9,是在目前已经广泛使用的Armv8的基础上,继续使用AArch64作为基准指令集,保持了向下兼容性,在此基础上分别在安全性、AI与ML以及可伸缩矢量扩展和DSP上做出改进,扩展了应用范围。”邹伟表示,“Armv9构架实现的处理器可用于移动计算、HPC高性能计算、汽车和AI等市场等,以满足全球对功能日益强大的安全、人工智能和专用处理的需求,这意味着基于 Arm 架构的计算技术也将在智能手机以外的市场上获得领导地位,借助移动生态系统带来的巨大规模优势,在笔记本电脑、台式机、云等应用领域打造领先的解决方案。”zewednc

Arm全面计算解决方案赋能终极数字体验

尽管近些年全球半导体产业风云变幻,但提供先进算力始终是产业发展的根本目标。从这个角度来看对芯片设计企业又将面临哪些挑战呢?邹伟分析道,首先是CPU的负载越来越复杂,多样化不同的场景中会需求不一样,每个环节面临的挑战都不一样;而摩尔定律虽然减缓,但市场对性能、功耗的追求依然没有停歇,这也是一大挑战;此外,高昂的掩膜价格以及生产周期变长,设计一款5纳米的芯片成本会非常高、生产周期又非常长。“我们希望芯片设计不仅覆盖当前的应用,也能覆盖以后的应用,以获得更长的生命周期,这要求我们通过架构、设计、IP来应对这些客户遇到的挑战。”他强调道。zewednc

如果赋能终极的数字体验是Arm构建未来计算愿景的驱动力,那Arm提出最新全面计算解决方案则是开启Armv9时代未来十年之旅的第一步。Arm全面计算解决方案采用系统范围的整体优化方法,横跨硬件IP、物理IP、软件、工具和标准,为Arm的合作伙伴提供更为广泛的选择,满足所有终端细分市场的应用场景和成本区间,让他们能够满怀信心地通过最新的技术,将高性能的产品快速推向市场。zewednc

zewednc

作为Arm全面计算解决方案的基石,全新的Arm Cortex CPU包括Arm目前性能最强大的Arm Cortex-X2、首款基于Armv9架构的大核CPU Arm Cortex-A710以及Arm过去四年来推出的首款高效率小核Arm Cortex-A510和Armv9-A CPU 群集。为支持生态系统对于性能的需求,Arm的全球合作伙伴正在努力确保所有app都将在今年年底前支持64位。正如邹伟在演讲中所述,算力多样化时代,Arm认为CPU的算力水准依然非常重要,它搭建了数字未来的基础底座。zewednc

而在每代CPU性能动辄20-30%的大幅提升背后,是Arm对频率、带宽、时延、缓存、工艺水平等各项指标一点点提升的不懈追求,在计算基础架构的创新上一直牵引着行业的进展。因此除了提升CPU性能之外,Arm全面计算解决方案同样希望做系统级的提升,为客户带去更好的设计体验。zewednc

此外,视觉体验是消费者与设备交互、并享用设备的关键。据悉,最新的Arm的Mali系列GPU正搭配全面计算解决方案中的Armv9 CPU,可以提供卓越的用户体验。据邹伟透露,未来Mali系列GPU也将持续超越大家的期待,带来光线追踪技术、可变速率着色VSR技术以及其他高级渲染技术等。zewednc

zewednc

Arm 的互连技术对于提高系统性能同样至关重要。最新的CoreLink CI-700一致性互连技术和CoreLink NI-700片上网络互连技术与Arm CPU、GPU和NPU IP无缝搭配,可跨SoC解决方案增强系统性能。CoreLink CI-700和CoreLink NI-700对新的Armv9-A功能提供硬件级支持,并支持更高的安全性、改进的带宽和延迟。zewednc

引入全新安全性功能,守护数据核心资产

随着全球联网设备激增,芯片的安全性日益重要。对安全性的根本需求是重新思考如何处理安全性,而Armv9架构则通过引入Arm机密计算体系结构(Confidential Compute Architecture, CCA)来重新设计安全应用程序的工作方式。机密计算通过打造基于硬件的安全运行环境来执行计算,保护部分代码和数据,免于被存取或修改,甚至不受特权软件的影响。    zewednc

邹伟进一步解释道,Arm CCA将引入动态创建机密领域(Realms)的概念,机密领域面向所有应用,运行在独立于安全或非安全环境之外的环境中,是存储数据和执行代码的动态安全区域,与操作系统或管理程序的特权模式分离,以实现保护数据安全的目的。例如,在商业应用中,机密领域可以保护系统中商用机密数据和代码,无论它们正被使用、闲置或正在传输中。Arm机密计算体系结构建立在Arm的TrustZone技术之上,是软件容器的硬件版本,允许应用程序轻松地在不同的系统上运行。例如在非安全区的运行的应用程序可以动态申请机密领域,以保护自己的算法或数据。zewednc

zewednc

“Arm还与合作伙伴共同开发平台安全架构PSA,作为一套标准的威胁模型、措施及时间,提供给终端设计人员使用,它与分级认证相结合后可以让此设备的采购者对资产的安全性更放心。例如在国内我们便和中国信息通信研究院泰尔实验室等联合,以支持基于PSA框架的安全物联网解决方案大规模部署。” 邹伟补充道。zewednc

打造新计算时代的大计算平台

除了安全性之外,机器学习也被视为Armv9的重要组成部分,因为在未来几年中越来越多的机器学习工作负载将变得司空见惯,在机器学习方面Armv9架构支持BFloat16格式,从而更好地去支撑Int8计算和BFloat16 的机器学习;可伸缩矢量扩展2(SVE2)的引入,则能够更好地帮助开发者对高阶的应用场景进行开发,在处理 5G、虚拟现实和增强现实以及图像和语音识别等任务负载时具有很大增益。zewednc

放眼瞬息万变的数字世界,智能终端不仅需要具备灵活性强、功耗低的特点,同时还要满足AI/ML的工作负载需求,这些挑战正推动更安全和专用处理的发展,也是打开新市场、抓住新机遇的关键。Armv9架构的发布与全面计算解决方案以安全技术作为基础,将解锁整个生态系统的新体验,为未来十年构建可信的数字化服务。zewednc

zewednc

邹伟总结到:“新一代Armv9架构将赋能开发者通过弥合软硬件之间的关键差距,构建和编程未来的可信计算平台,帮助我们的合作伙伴在更快的上市时间和成本控制之间取得平衡。安谋中国则致力于从技术到生态全面推动算力革命,并将在自研架构上加大投入,持续携手生态合作伙伴,依托领先的Arm全球生态深入做强本土研发,持续赋能本土产业创新的企业战略。” zewednc

  • 微信扫一扫
    一键转发
  • 最前沿的电子设计资讯
    请关注“电子技术设计微信公众号”
  • 商务部暂停天然砂对台湾地区出口,台积电难受了 据EDN电子技术设计了解,商务部网站8月3日早晨8点发布最新消息,表示将从即日起暂停天然砂对台湾地区出口。不少网友认为暂停天然砂对台湾地区的出口,此举将严重影响台湾的建筑业,实则影响不仅仅如此。台湾地区天然砂进口量的90%以上来自大陆,而台湾芯片占台湾2021年出口额的34.8%。网友称商务部暂停天然砂对台湾地区出口是捏到了台湾半导体制造业的七寸。
  • 美国参议院批准价值2460亿美元的芯片法案 美国参议院周三通过立法,以超过 750 亿美元支持国内半导体产业。GlobalFoundries、英特尔、三星代工厂、德州仪器、台积电和其他在美国建立半导体制造设施的公司或将受益。
  • 空调也“怕热”?空调工作临界点到底是什么? 深圳最高气温突破40℃!很多网友戏称:这条命是空调给的,不敢走出空调房。但同时,这两天明显感觉空调动力不足了,以为家里的空调坏了。与此同时,关于格力空调“怕热”遭遇“空调工作临界点”罢工的成了网友关注的热点。
  • 林志颖驾特斯拉出车祸:特斯拉回应起火原因不明,网友质疑 据EDN电子技术设计了解,7月22日上午10时50分左右,林志颖驾驶特斯拉Model X,在路口处掉头后加速向前行驶,但在前方道路分叉口处,因不明原因突然偏离车道自撞指示杆,整辆车陷入火海。此事引起网友关注热议,特斯拉客服表示,暂不清楚起火原因,但车身没有特别容易起火的材质。但有台媒指出,林志颖最爱特斯拉的自动驾驶功能,这也引起了网友对事故是否与自动驾驶有关的猜测。
  • 售价将超50万美元,乔布斯的Apple-1原型机电路板长什么 这块在 1976 年由史蒂夫-沃兹尼亚克手工焊接的 Apple Computer A 印刷电路板被史蒂夫-乔布斯用来向保罗-特雷尔演示 Apple-1 电脑,后者是加州山景城 The Byte Shop 的老板。这台原型机在“苹果车库”里保存了很多年,然后在大约 30 年前由史蒂夫-乔布斯交给了它现在的主人。当时,乔布斯已被苹果公司赶走。乔布斯当时认为这个原型不是要供奉的东西,而是要被重新利用的东西。
  • 利用反极性MOSFET帮助555振荡器忽略电源和温度变化 恒定频率振荡器是555定时器的经典应用之一。然而,由于所用二极管的特性不理想,占空比的间隔会随着温度和V+电源的变化而变化。本设计实例给出了一种解决方法:利用反极性P沟道MOSFET引导电容的充电电流而不产生任何明显压降。
  • 高通发布4nm骁龙W5+骁龙W5芯片,专为可穿戴设计 据EDN电子技术设计报道,高通7月20日正式发布了全新4nm制程的骁龙可穿戴平台W5 Gen1和骁龙W5+ Gen。与两年前的上一代产品骁龙wear 4100相比,骁龙W5与W5+采用了全新的命名方式,整体功耗降低超50%。SoC工艺从12nm提升到4nm,协处理器使用22nm制程工艺。
  • M2 Pro 和 M2 Max 或是苹果首款采用台积电3nm 工艺的 M1 Pro 和 M1 Max 最多可配置 10 核 CPU 和 32 核 GPU。借助 M2 Pro 和 M2 Max,Apple 有望突破这一门槛,为这两个领域带来更多的核心数量。目前M2 Pro相关的爆料很少,但据称M2 Max 有12 核 GPU 和 38 核 GPU。12 核 CPU 将包括 10 个性能核心和两个能效核心。
  • 华为鸿蒙3.0即将发布,首款新品是一款11英寸高端旗舰平 据EDN电子技术设计报道,终端官方微博昨天正式宣布,将于7月27日正式发布Harmony OS 3.0手机操作系统,新系统重点升级了流畅度、万物互联,以及鸿蒙车机等功能。此外,还将带来的首款新品:华为MatePad Pro 11,从宣传海报来看这是一款11英寸高端旗舰平板.
  • 中信拆了辆特斯拉Model 3,发现多个领域技术引领行业 EDN电子技术设计在6月底报道了海通国际手动拆解十万元的比亚迪“元”的详细拆解图,如今不到一个月的时间,中信证券微信公众号发表了一篇《从拆解Model 3看智能电动汽车发展趋势》的文章,文中称对特斯拉Model 3的E/E架构、三电、热管理、车身等进行了详细深入地分析,并坚定看好中国智能电动化发展趋势,引起了广泛关注。
  • 经典电子小制作项目:DS18B20制作的测温系统原程序原理 下面介绍的这款DS18B20制作的测温系统,测量的温度精度达到0.1度,测量的温度的范围在-20度到+50度之间,用4位数码管显示出来。DS18B20的外型与常用的三极管一模一样,用导线将JK—DS的DA端连到P3.1上。连接好DS18B20注意极性不要弄反,否则可能烧坏。
  • OPPO被曝测试240W快充,但实际速度不及vivo的200W 爆料称OPPO正在试产24V10A的240W充电器。对于采用双电芯三电荷泵设计的电池而言,其理论峰值功率可以达到300W,但目前的USB Type-C接口规范的最高功率为240W,OPPO这次一下子将C口快充做到了“天花板”级别。不过,OPPO和vivo不太一样,虽然前者测试的是240W快充,但充电策略偏向保守,实际速度可能不如vivo的200W。
广告
热门推荐
广告
广告
EE直播间
在线研讨会
广告
广告
面包芯语
广告
向右滑动:上一篇 向左滑动:下一篇 我知道了