广告

全面计算雄心!一文解构“十年磨一剑”的Armv9新架构

2021-08-06 15:46:31 阅读:
在由易维讯主办的第九届年度中国电子ICT媒体论坛暨2021产业和技术展望研讨会上,安谋科技高级FAE经理邹伟为业界深度解读Arm历经十年打磨才新发布的针对不同层次算力需求、机器学习(ML)发展路径的全新一代Armv9架构,其不仅是Arm架构演进的又一个里程碑,也将成为Arm未来十年及更远时代推进行业创新的基础。

近日,在由易维讯主办的第九届年度中国电子ICT媒体论坛暨2021产业和技术展望研讨会上,安谋科技高级FAE经理邹伟为业界深度解读Arm历经十年打磨才新发布的针对不同层次算力需求、机器学习(ML)发展路径的全新一代Armv9架构,其不仅是Arm架构演进的又一个里程碑,也将成为Arm未来十年及更远时代推进行业创新的基础。pEHednc

pEHednc

安谋科技高级FAE经理邹伟现场演讲pEHednc

Armv9:凭何改变高性能计算方式

纵观半导体设计在过去十多年的发展,特别是在终端消费等领域,算力带来的生产力的提升,通过移动互联网把大量的计算力放到每一个消费者的手中。与此同时,传统依赖于人工采集和分析数据的过程在第五波计算浪潮中正演变成机器对机器之间的数据采集、存储、分析和服务。由此产生的海量数据需要在云端、边缘侧配置更为强大的算力,并通过数据中心对获得的数据进行分析、构建和决策。pEHednc

Arm在成为移动浪潮主流架构之外,已进入到边缘端和云端等新场景,其独特的定位可为行业实现稳固的安全基础,同时确保开发者以最简便、快速的方式来使用Arm的安全技术。据邹伟介绍,截止至2020年底,基于Arm IP的芯片累计售出1800亿颗,涵盖在各行各业每一个角落,每一个地方。共享的数据一定会有一个或多个环节经过Arm处理器计算,无论是数据采集的IoT设备,还是日常使用的手机、智能电脑,甚至服务器、超级计算机等。pEHednc

据Arm预测,未来十年合作伙伴基于Arm芯片的出货量将超过3000亿,100%的共享数据将在Arm芯片上进行处理,无论是在终端还是在云端。因此,亟需一款全新的处理器架构在未来十年内改变计算的方式,以提供更高的性能、改善安全功能并增强工作负载功能。pEHednc

pEHednc

邹伟现场介绍全新Armv9架构特性pEHednc

“为此,Arm正式推出了面向未来十年的新一代架构Armv9,是在目前已经广泛使用的Armv8的基础上,继续使用AArch64作为基准指令集,保持了向下兼容性,在此基础上分别在安全性、AI与ML以及可伸缩矢量扩展和DSP上做出改进,扩展了应用范围。”邹伟表示,“Armv9构架实现的处理器可用于移动计算、HPC高性能计算、汽车和AI等市场等,以满足全球对功能日益强大的安全、人工智能和专用处理的需求,这意味着基于 Arm 架构的计算技术也将在智能手机以外的市场上获得领导地位,借助移动生态系统带来的巨大规模优势,在笔记本电脑、台式机、云等应用领域打造领先的解决方案。”pEHednc

Arm全面计算解决方案赋能终极数字体验

尽管近些年全球半导体产业风云变幻,但提供先进算力始终是产业发展的根本目标。从这个角度来看对芯片设计企业又将面临哪些挑战呢?邹伟分析道,首先是CPU的负载越来越复杂,多样化不同的场景中会需求不一样,每个环节面临的挑战都不一样;而摩尔定律虽然减缓,但市场对性能、功耗的追求依然没有停歇,这也是一大挑战;此外,高昂的掩膜价格以及生产周期变长,设计一款5纳米的芯片成本会非常高、生产周期又非常长。“我们希望芯片设计不仅覆盖当前的应用,也能覆盖以后的应用,以获得更长的生命周期,这要求我们通过架构、设计、IP来应对这些客户遇到的挑战。”他强调道。pEHednc

如果赋能终极的数字体验是Arm构建未来计算愿景的驱动力,那Arm提出最新全面计算解决方案则是开启Armv9时代未来十年之旅的第一步。Arm全面计算解决方案采用系统范围的整体优化方法,横跨硬件IP、物理IP、软件、工具和标准,为Arm的合作伙伴提供更为广泛的选择,满足所有终端细分市场的应用场景和成本区间,让他们能够满怀信心地通过最新的技术,将高性能的产品快速推向市场。pEHednc

pEHednc

作为Arm全面计算解决方案的基石,全新的Arm Cortex CPU包括Arm目前性能最强大的Arm Cortex-X2、首款基于Armv9架构的大核CPU Arm Cortex-A710以及Arm过去四年来推出的首款高效率小核Arm Cortex-A510和Armv9-A CPU 群集。为支持生态系统对于性能的需求,Arm的全球合作伙伴正在努力确保所有app都将在今年年底前支持64位。正如邹伟在演讲中所述,算力多样化时代,Arm认为CPU的算力水准依然非常重要,它搭建了数字未来的基础底座。pEHednc

而在每代CPU性能动辄20-30%的大幅提升背后,是Arm对频率、带宽、时延、缓存、工艺水平等各项指标一点点提升的不懈追求,在计算基础架构的创新上一直牵引着行业的进展。因此除了提升CPU性能之外,Arm全面计算解决方案同样希望做系统级的提升,为客户带去更好的设计体验。pEHednc

此外,视觉体验是消费者与设备交互、并享用设备的关键。据悉,最新的Arm的Mali系列GPU正搭配全面计算解决方案中的Armv9 CPU,可以提供卓越的用户体验。据邹伟透露,未来Mali系列GPU也将持续超越大家的期待,带来光线追踪技术、可变速率着色VSR技术以及其他高级渲染技术等。pEHednc

pEHednc

Arm 的互连技术对于提高系统性能同样至关重要。最新的CoreLink CI-700一致性互连技术和CoreLink NI-700片上网络互连技术与Arm CPU、GPU和NPU IP无缝搭配,可跨SoC解决方案增强系统性能。CoreLink CI-700和CoreLink NI-700对新的Armv9-A功能提供硬件级支持,并支持更高的安全性、改进的带宽和延迟。pEHednc

引入全新安全性功能,守护数据核心资产

随着全球联网设备激增,芯片的安全性日益重要。对安全性的根本需求是重新思考如何处理安全性,而Armv9架构则通过引入Arm机密计算体系结构(Confidential Compute Architecture, CCA)来重新设计安全应用程序的工作方式。机密计算通过打造基于硬件的安全运行环境来执行计算,保护部分代码和数据,免于被存取或修改,甚至不受特权软件的影响。    pEHednc

邹伟进一步解释道,Arm CCA将引入动态创建机密领域(Realms)的概念,机密领域面向所有应用,运行在独立于安全或非安全环境之外的环境中,是存储数据和执行代码的动态安全区域,与操作系统或管理程序的特权模式分离,以实现保护数据安全的目的。例如,在商业应用中,机密领域可以保护系统中商用机密数据和代码,无论它们正被使用、闲置或正在传输中。Arm机密计算体系结构建立在Arm的TrustZone技术之上,是软件容器的硬件版本,允许应用程序轻松地在不同的系统上运行。例如在非安全区的运行的应用程序可以动态申请机密领域,以保护自己的算法或数据。pEHednc

pEHednc

“Arm还与合作伙伴共同开发平台安全架构PSA,作为一套标准的威胁模型、措施及时间,提供给终端设计人员使用,它与分级认证相结合后可以让此设备的采购者对资产的安全性更放心。例如在国内我们便和中国信息通信研究院泰尔实验室等联合,以支持基于PSA框架的安全物联网解决方案大规模部署。” 邹伟补充道。pEHednc

打造新计算时代的大计算平台

除了安全性之外,机器学习也被视为Armv9的重要组成部分,因为在未来几年中越来越多的机器学习工作负载将变得司空见惯,在机器学习方面Armv9架构支持BFloat16格式,从而更好地去支撑Int8计算和BFloat16 的机器学习;可伸缩矢量扩展2(SVE2)的引入,则能够更好地帮助开发者对高阶的应用场景进行开发,在处理 5G、虚拟现实和增强现实以及图像和语音识别等任务负载时具有很大增益。pEHednc

放眼瞬息万变的数字世界,智能终端不仅需要具备灵活性强、功耗低的特点,同时还要满足AI/ML的工作负载需求,这些挑战正推动更安全和专用处理的发展,也是打开新市场、抓住新机遇的关键。Armv9架构的发布与全面计算解决方案以安全技术作为基础,将解锁整个生态系统的新体验,为未来十年构建可信的数字化服务。pEHednc

pEHednc

邹伟总结到:“新一代Armv9架构将赋能开发者通过弥合软硬件之间的关键差距,构建和编程未来的可信计算平台,帮助我们的合作伙伴在更快的上市时间和成本控制之间取得平衡。安谋中国则致力于从技术到生态全面推动算力革命,并将在自研架构上加大投入,持续携手生态合作伙伴,依托领先的Arm全球生态深入做强本土研发,持续赋能本土产业创新的企业战略。” pEHednc

  • 微信扫一扫
    一键转发
  • 最前沿的电子设计资讯
    请关注“电子技术设计微信公众号”
  • 英特尔展示下一代半导体器件技术,计划2030年实现万亿级 日前,英特尔在IEDM上展示多项与半导体制造技术相关的研究成果:3D封装技术的新进展,可将密度再提升10倍;超越RibbonFET,用于2D晶体管微缩的新材料,包括仅三个原子厚的超薄材料;能效和存储的新可能,以实现更高性能的计算;量子计算的新进展。此外,英特尔表示,目标是在2030年实现在单个封装中集成一万亿个晶体管。
  • 通过GaN电机系统提高机器人的效率和功率密度 机器人应用成功的关键因素之一是确保最佳的电机驱动器设计。
  • 湖南大学:基于2D的范德华异质结构,可用于晶体管及存储器 电子工程研究的一个关键目标是开发高性能和高能效的计算设备,这意味着它们可以快速计算信息,同时消耗很少的能量。一种可能的方法是将执行逻辑操作的单元和存储组件组合到一个设备中。
  • Microchip在RISC-V峰会上展示基于RISC-V的FPGA和空间 领先的PolarFire®器件可提供两倍能效、军用级安全和最高可靠性,PolarFire 2 FPGA路线图将进一步扩大其领先优势 
  • 聚焦“新基建”|汽车电子行业电源应用解析 目前,常规车型的汽车电子占整车成本的15-30%,而高端车型则更高,车载汽车电子系统主要包括车载供电系统、启动系统、发动机管理系统等。针对这些系统,金升阳提供一站式电源应用方案,简化客户设计,增加系统的可靠性。
  • IAR Systems更新Visual Studio Code扩展 用于代码构建和调试的IAR Visual Studio Code扩展备受市场喜爱,其最新 1.20 版进一步简化了嵌入式开发工作流程
  • SCT52240Q栅极驱动器 SCT52240Q是一款宽供电电压、双通道、高速、低测栅极驱动器,可驱动功率MOSFET,IGBT。单个通道能够提供高达4A拉电流和4A灌电流的轨到轨驱动能力,并实现轨到轨输出。高达24V宽电压范围提高功率器件开关瞬间栅极驱动的振铃幅值裕度。SCT52240输入具有宽迟滞电压,可以兼容TTL输入逻辑。 低至-5V负压输入能力,增强SCT51240对输入噪音的抗扰度。
  • Buck电路传导EMI的抑制 电磁干扰模型可以等效为3个部分:干扰源,传导路径,和接收端。传导电磁干扰测试时接受端为LISN。芯洲主要从干扰源和传导路径两个角度进行传导电磁干扰的预防和优化。
  • 异步Buck升级为同步Buck注意点总结 目前,市场上存在很多异步Buck电源管理芯片使用的场景,针对这些应用,采用同步Buck电源管理芯片进行升级,可以增加集成度,提升电源效率。然而在升级替换的过程中,需要注意PCB的布局。如果需要不更改PCB布局直接升级替换,需要在元器件选择上有所注意。本文首先对同步Buck,异步Buck进行介绍,给出同步Buck的PCB布局注意事项,然后结合实例给出替换中可以采取的保证电源正常工作的方法,供工程师参考。
  • 意法半导体发布车规音频功放芯片,为紧急救援、远程信 FDA803S和FDA903S是意法半导体FDA(纯数字放大器)系列中最新的单通道全差分10W D类音频功率放大器。目标应用包括紧急道路救援、远程信息处理等需要音频通道产生最高10W标准输出功率的语音、音乐或提示消息的任何汽车系统。
  • 在美国企业抵制之下,美国将放宽联邦机构及承包商使用中 这议案被视为美国《国防授权法案》(NDAA)的一项修正案,遭到美国商会和其他贸易组织的抵制。这些组织在上个月的一封信中称,企业要确定大量电子产品中的芯片是否是中国企业制造的,成本将很高,难度也很大。
  • 台积电1nm制程工艺已实现技术突破,正谋划建1nm工艺工厂 近日有报道称台积电正积极推进1nm制程工艺,并们已在谋划1nm制程工艺工厂的建设事宜,以便按计划量产。早前EDN美国版曾报道台积电1nm制程工艺已实现技术突破,且逐渐成形。
广告
热门推荐
广告
广告
EE直播间
在线研讨会
广告
广告
面包芯语
广告
向右滑动:上一篇 向左滑动:下一篇 我知道了