广告

Arm二代Neoverse产品单线程性能提升超40%,对标Intel和AMD的多核,主攻x86服务器

2020-09-25 10:12:04 综合报道 阅读:
Arm在服务器市场已经“存在”了很多年,但是表现一直不太好,不过,Arm进军服务器打天下的雄心一直未变,最近,Arm升级的二代Neoverse产品线,其性能大幅提升。有望直接PK Intel和AMD的x86多核。

Arm在服务器市场已经“存在”了很多年,但是表现一直不太好,不过,Arm进军服务器打天下的雄心一直未变,最近,Arm升级的二代Neoverse产品线,其性能大幅提升。有望直接PK Intel和AMD的x86多核。lzfednc

本周,Arm再次更新Neoverse产品线,发布第二代N系列Neoverse N2以及全新的Neoverse V1平台。相比Neoverse N1,Neoverse N2在保持相同水平的功率和面积效率之余,单线程性能提升了40%。同样与Neoverse N1相比,Neoverse V1的单线程性能可提升超过50%。lzfednc

lzfednc

lzfednc

Arm在高性能计算市场是要靠单核与x86的多核竞争吗?lzfednc

Neoverse CPU为何强调单核性能?lzfednc

Neoverse系列发布两年之后,已经拥有了E系列、N系列、V系列三大系列。Neoverse N系列同时考虑了性能、功率、面积(PPA),擅长可扩展;V系列旨在提供最佳性能,相对而言会消耗更多面积和功耗;E系列主要关注效率,在功耗和面积的缩减上进行优化。lzfednc

lzfednc

作为最新发布的产品系列,V系列更加追求性能,因此Neoverse V1是面向7nm和5nm设计,并且率先支持可伸缩矢量扩展(SVE ,Scalable Vector Extensions)。SVE可基于未知宽度向量单元的软件编程模型,执行单指令流多数据流(SIMD)整数、bfloat16、浮点指令。lzfednc

同时,V1还支持PCIe 5.0连接、DDR5、HBM2e和CCIX 1.0,可实现插槽之间的芯片与封装内小芯片之间的双向一致性通信。lzfednc

lzfednc

Arm基础设施事业部高级副总裁兼总经理 Chris Bergey接受雷锋网(公众号:雷锋网)采访时表示:“SVE在加速HPC高性能计算领域或者是机器学习工作方面表现高效,同时它对软件开发者非常友好,不需要管矢量的位宽是多少。未来我们会把SVE技术运用到除N2和V1之外的一系列核上面。”lzfednc

以Arm架构为基础的日本富岳(Fugaku)超级计算机就使用了512位的SVE的技术,它不仅是全球最快的超算,也是最新Green500榜单排名第四的超算。lzfednc

Arm本周发布的另一款新产品Neoverse N2面向5nm工艺设计,支持PCIe 5.0和DDR5,通过支持用于高带宽存储器的HBM3以及用于结构的CCIX 2.0和CXL 2.0来进一步扩展。可支持从8核心,20W到192核心350W的设计,横跨云、智能网卡(SmartNICs)、企业网络到功耗受限的边缘设备的高可扩展性平台。lzfednc

lzfednc

Chris Bergey表示,关于新发布的V1和N2的更多细节会在之后公布。现在我们只知道V1和N2相比上一代N1的单核性能提升了超50%和40%。lzfednc

为什么Neoverse CPU如此强调单核性能?Chris Bergey解释:“我们认为云服务厂商会更倾向选择单线程处理器核,因为接近度、安全性、多租户等特性可以为他们带来更好的经济性,这也是我们的产品聚焦单线程技术的原因。当然,Neoverse E1也支持同步多线程(SMT)技术。”lzfednc

他还给出了一张图表,X轴代表芯片级性能,Y轴代表每线程性能,从图表中可以看到,相比传统的英特尔和AMD服务器CPU,Neoverse的单核及芯片级性能都超过了市场上的产品。lzfednc

lzfednc

Neoverse每年30%的性能提升持续到2021年之后lzfednc

Arm承诺,Neoverse系列CPU的性能每年会提升30%,这种提升会持续到2021年。Chris Bergey说:“这当然与Arm工程团队的努力和投入是分不开的,我认为与软件生态的逐渐成熟有更大的关系,例如很多云原生的软件现在可以比较无缝地运行在Arm架构上面。”lzfednc

lzfednc

Arm在手机CPU市场持续更新的架构与Neoverse性能的持续提升显然有着密不可分的关系。Chris Bergey表示,“我们在Cortex的基础上,针对基础设施领域所要求的功能做了进一步的增添或提升,并且打造最合适超多核设备的功耗与性能,包括核之间的互联等优化工作。”lzfednc

也就是说,同一时期的Cortex和Neoverse产品之间存在相似之处。比如,Neoverse N1是和Cortex-A76是同期开发,这两个微体系结构有很多相似之处。lzfednc

Neoverse V1可以看作是Cortex-X1的同级设计,两款旗舰CPU可能共享许多超大型内核结构。Cortex-X1是今年5月份发布的新品,同样追求最大性能。lzfednc

Neoverse N2有些特殊,因为它代表下一代Cortex-A的设计,也就是与Cortex-X1同期发布的A78的后续产品,这或许也是Neoverse N2的技术细节现在还不能公布的关键原因。为了更直观的说明Cortex与Neoverse产品线之间的关系,外媒AnandTech制作的一张图能够帮助大家更好地理解。lzfednc

lzfednc

图片来源:AnandTechlzfednc

软件生态方面,Arm关键的任务在于Arm的芯片级接口,这提供了设计系统层级解决方案的机会。Arm在CCIX与CXL投资,提供更好的互联技术,可以提供可扩展性的交换网,支持大量的处理器核。lzfednc

lzfednc

另外,Arm Project Cassini是希望通过标准、平台安全性与参考实施,对软件开发者友好,让行业合作伙伴能够在基于Arm的平台上部署装机即用。lzfednc

在对基础设施的基础软件包括操作系统、虚拟机管理程序支持方面,Xen、KVM、Docker容器以及越来越多的Kubernetes已经陆续宣布支持Arm架构。许多初期由Arm推动的开源项目正在变得自主运转,商用ISV应用程序也齐步演进。lzfednc

Arm服务器CPU“抢食”x86蛋糕最缺的是时间lzfednc

但想要真正撼动x86在云端CPU市场的地位,Arm还有很长的路要走。Chris Bergey对雷锋网表示:“Arm在云端市场最大的挑战还是时间。我们看到很多数据中心的客户对转向Arm有巨大的兴趣。但从Arm的IP到芯片设计,到最后能够在数据中心部署,再到软件生态系统的支持,仍需要一定的时间以及很多产业链合作伙伴一起努力。”lzfednc

lzfednc

当然,Neoverse是面向从个云端到边缘的市场。Chris Bergey也指出,Arm的机遇其实包括了云原生软件的支持,以及协助客户通过定制化的形式克服摩尔定律减速带来的挑战等。lzfednc

雷锋网此前报道,亚马逊、Marvell都已经将Arm架构应用于云端,亚马逊推出了Arm架构的服务器处理器Graviton2,Marvell也推出了基于Arm架构定制的ThunderX3处理器,华为海思也推出了基于Neoverse N1设计的鲲鹏系列服务器。lzfednc

业内有观点认为,Arm在云端市场要成功的一个关键就是满足大型互联网公司和云服务提供商的定制化需求。lzfednc

“在异构计算里,Arm有一个很大的机遇,就是我们如何提供紧耦合或是定制化的能力,甚至是通过多核封装或多芯片组装技术,将来自生态系统、IP技术与云厂商的需求与技术整合在一起。”Chris Bergey说,对于没有很强设计经验的客户而言,他们更倾向于选择Neoverse核。lzfednc

Arm架构芯片能未来能否覆盖从终端到边缘再到云端?现在看来,这种成功除了Arm的努力外,最终是否会被英伟达收购也成为了关键因素。lzfednc

  • 微信扫一扫
    一键转发
  • 最前沿的电子设计资讯
    请关注“电子技术设计微信公众号”
  • 爱立信推出基于“Intel 4”工艺的处理器,甚至领先于英 爱立信在其新闻稿中指出,与上一代相比,新的 RAN 处理器 6672 和无线电处理器 6372 的容量增加了四倍,效率提高了一倍。他们声称,Intel 4上的新处理器的功耗比行业基准低30%到60%。
  • 英伟达发布最新AI芯片H200,将成为其史上最赚钱产品之一 NVIDIA宣布推出全新 H200 Hopper GPU,是目前用于训练最先进的大型语言模型H100芯片的升级版,据介绍,在执行推理或生成问题答案时,H200的性能比H100提升了60%至90%。此外,NVIDIA还宣布了一项由其 Grace Hopper 超级芯片(GH200)驱动的大型超级计算机项目。
  • NVIDIA GeForce RTX 4090显卡仍易出现"12VHPWR"插头烧 NVIDIA GeForce RTX 4090 GPU的用户仍然很容易遇到"12VHPWR"插头问题,包括熔化和烧伤。
  • 英伟达最新中国专供芯片曝光,性能相比A800、H800整体下 业内消息称NVIDIA计划为中国市场推出至少三款新的AI GPU,这三款新芯片被命名为H20、L20和L2。此前,国内媒体曾透露,这三款芯片为HGX H20、L20 PCle和L2 PCle,由H100改良而来。据称,这些芯片基于Hopper和Ada架构,最高理论性能可达296 TFLOP,适用于云端训练、云端推理以及边缘推理。
  • 法国科学家研发最迄今灵敏的力传感器,有望发现未知的第 法国科学家利用极冷的铷原子,制造出了迄今最灵敏的力传感器,其可测量拎起单个电子所需力十分之一大小的力。研究人员表示,这么小的力极难测量,而新传感器可在几微米外对其开展测量,未来有望发现新的力。
  • 一个技巧,可使小米14系列运行32位ARM应用程序 小米14系列的发布引起了业界的广泛关注,不仅是全网首批预装澎湃OS系统的机型,还配备了最新的骁龙8 Gen 3芯片组。然而,新的芯片组使用了全新的CPU架构,仅支持64Bit应用,不再支持32Bit应用……
  • 苹果发布会:创新不够,颜色来凑? 北京时间周二早晨,苹果举办了主题为“快得吓人”(Scary Fast)的线上发布会,宣布推出搭载M3系列芯片的新款MacBook Pro和iMac。但值得一提的是,除了芯片有升级之外,电脑其他方面基本没变化,最大的变化也只有新增“深空黑”色而已。
  • 苹果M3、M3 Pro、M3 Max芯片规格提前曝光 苹果在这场新品发布会中,将同时发布三款新的 M3 芯片,包括基础版的M3,以及更强大的 M3 Pro和M3 Max,据报道这些芯片采用与 A17 Pro 相同的尖端 3nm 工艺批量生产。至于CPU和GPU数量,据称M3在核心数量上似乎并没有太大的突破……
  • 拆解小米14 Pro:除了首发骁龙8Gen3,还有什么新技术? 小米14系列昨晚(10月26日)刚发布,微机分WekiHome就在今天(10月27日)发出了小米14 Pro的拆解视频,本文我们就来看看小米14与小米14 Pro具体有什么区别,小米14 Pro的内部设计有哪些跃进。
  • TinyML计算机视觉正在通过微型神经处理器(μNPU)变成 随着硬件成本的降低、计算能力的显著提高,以及用新方法训练和部署模型变得更加容易,无处不在的基于机器学习的边缘视觉处理正在不断发展。这减少了采用的障碍,并增加了计算机视觉人工智能在边缘的使用。
  • SoC处理器对NOR Flash提出新要求 半导体工艺的节点发展非常快,最近3纳米已经量产了。工艺节点的降低,它的特征尺寸降低,它的速度也会越快。另外,节点的降低也会带来电压的降低,它的功耗降低。
  • 传感器+AI可以实现哪些好处? 除了方案之外,边缘AI算法也可以集成到传感器本体中,因为传感器只要集成一个超低功耗的处理器,就可以实现此动作。
广告
热门推荐
广告
广告
EE直播间
在线研讨会
广告
广告
面包芯语
广告
向右滑动:上一篇 向左滑动:下一篇 我知道了