广告

英伟达要抢英特尔最赚钱领域:首推数据中心CPU,Arm架构性能高10倍

2021-04-13 综合报道 阅读:
在400亿美元收购Arm的6个月后,NVIDIA连发三款基于Arm IP打造的处理器,包括全球首款专为TB级加速计算而设计的CPU NVIDIA Grace、全新BlueField-3 DPU,以及业界首款1000TOPS算力的自动驾驶汽车SoC。此外,还公布了与亚马逊AWS、Ampere Computing、联发科和Marvell等基于Arm的CPU平台的合作伙伴关系。

4月13日凌晨,NVIDIA(英伟达)创始人黄仁勋再一次身着皮衣,在自家厨房举办了NVIDIA GTC 2021发布会。acYednc

在400亿美元收购Arm的6个月后,NVIDIA连发三款基于Arm IP打造的处理器,包括全球首款专为TB级加速计算而设计的CPU NVIDIA Grace、全新BlueField-3 DPU,以及业界首款1000TOPS算力的自动驾驶汽车SoC。此外,还公布了与亚马逊AWS、Ampere Computing、联发科和Marvell等基于Arm的CPU平台的合作伙伴关系。acYednc

acYednc

黄仁勋表示:“我们每年都会发布激动人心的新品。三类芯片,逐年飞跃,一个架构。”NVIDIA数据中心路线图包括CPU、GPU和DPU这三类芯片,每个芯片架构历经两年的打磨周期(周期内可能出现转变),一年专注于x86平台,另一年专注于Arm平台。acYednc

Grace:专为大型应用建立的数据中心CPU

专攻GPU的英伟达在这次GTC大会上推出了基于Arm架构的中央处理器(CPU)—— Grace,用于大规模人工智能和高性能计算应用。acYednc

黄仁勋表示,“这是英伟达第一个数据中心CPU,专为大型应用建立”。acYednc

acYednc

这款CPU以美国海军少将、计算机编程先驱Grace Hopper的名字命名。Grace Hopper是计算机科学的先驱之一,也是哈佛Mark 1的第一批程序员和第一个链接器的发明者。她在20世纪50年代开创了计算机编程,发明了世界上第一个编译器,被称为“计算机软件工程第一夫人”。acYednc

这款名为Grace的CPU使用了节能 Arm 核心—— Neoverse,为系统训练大型人工智能模型提供了巨大的性能飞跃,每个CPU能在SPECrate2017_int_base基准测试中分数超过300分。acYednc

具体讲,基于Grace的系统与NVIDIA GPU紧密结合,性能将比目前最先进的NVIDIA DGX系统(在x86 CPU上运行)高出10倍。acYednc

它能够满足世界上最先进应用的计算需求,包括自然语言处理、推荐系统和人工智能超级计算,这些应用分析需要超快计算性能和大容量内存中的巨大数据集。acYednc

Grace还是一款高度专用型处理器,主要面向大型数据密集型HPC和AI应用。新一代NLP模型的训练会有超过一万亿的参数。acYednc

这款CPU的基本性能是第四代Nvidia NVLink互连技术,从CPU到GPU连接速度超过900GB/s,达到相当于目前服务器14倍的带宽;从CPU到CPU的速度超过600GB/s。acYednc

拥有最高的内存带宽,采用的新内存LPDDR5x技术,带宽是LPDDR4的两倍,能源效率提高了10倍,能提供更多计算能力。acYednc

acYednc

英伟达表示,新产品将于2023年初上市。acYednc

黄表示,使用经过授权的 ARM IP,英伟达将 Grace 设计成专门用于大规模人工智能和高性能计算的 CPU。acYednc

作为首批客户,瑞士超级计算中心(CSCS)和美国洛斯阿拉莫斯国家实验室(Los Alamos National Laboratory)将是第一个使用由惠普打造的Grace驱动的超级计算机的机构。acYednc

Grace将为世界上最快的超级计算机提供驱动力。这台被称为阿尔卑斯山的超算将具有20亿亿次浮点运算的能力。acYednc

这比当今领先的人工智能超级计算机——2.8亿亿次运算的 Nvidia Seline 超级计算机的计算能力高出约7倍。acYednc

基于Arm架构的新数据中心CPU Nvidia Grace的发布,或将直接挑战英特尔在服务器和数据中心计算领域的主导地位,抢占英特尔最赚钱的市场领域。acYednc

BlueField-3 DPU:220亿晶体管

在黄仁勋看来,负责在数据中心传输和处理数据的数据处理单元(DPU),正与CPU、GPU共同组成“未来计算的三大支柱”。acYednc

acYednc

他宣布NVIDIA BlueField-3 DPU包含220亿个晶体管,采用16个Arm A78 CPU核心、18M IOPs弹性块存储,加密速度是上一代的4倍,并完全向下兼容BlueField-2。将为构建超大规模数据中心、工作站和超级计算机所需的基础设施提供进一步的加速。acYednc

这款新一代数据处理器将提供最强大的软件定义网络、存储和网络安全加速功能。acYednc

BlueField-2能够卸载相当于30个CPU核的工作负载,而BlueField-3实现了10倍的性能飞跃,能够替代300个CPU核,以400Gbps的速率,对网络流量进行保护、卸载和加速。acYednc

业界首款1000TOPS算力的自动驾驶汽车SoC

NVIDIA DRIVE Atlan是NVIDIA新一代车载系统级芯片,为汽车带来真正的数据中心。acYednc

acYednc

Atlan可以达到每秒超过1000万亿次(TOPS)运算次数,约是上一代Orin处理器的4倍,超过了绝大多数L5无人驾驶出租车的总计算能力。acYednc

这是DRIVE平台首次集成DPU,通过Arm核为自动驾驶汽车带来数据中心级的网络,致力于应用到2025年的车型。acYednc

该SoC采用下一代GPU的体系结构、新型Arm CPU内核、新深度学习和计算机视觉加速器,并内置为先进的网络、存储和安全服务的BlueField DPU,网络速度可达400Gbps。acYednc

黄仁勋夸赞说:“Atlan集NVIDIA在AI、汽车、机器人、安全和BlueField安全数据中心领域的所有技术之大成,堪称一项技术奇迹。”acYednc

软硬件双管齐下,便捷式AI数据中心和DGX SuperPod双升级

软硬件双管齐下,黄仁勋宣布升级NVIDIA专为工作组打造的“便携式AI数据中心”——NVIDIA DGX Station,以及NVIDIA专为密集型AI研发打造的AI数据中心产品——NVIDIA DGX SuperPod。acYednc

acYednc

全新DGX Station 320G借助320GB超快速HBM2e连接至4个NVIDIA A100 GPU,内存带宽达到每秒8TB。然而,仅需将其插入普通的壁装电源插座即可使用,耗电量只有1500瓦。acYednc

DGX SuperPOD使用全新80GB NVIDIA A100,将其HBM2e内存提升至90TB,实现2.2EB/s的总带宽。要实现如此的带宽,需要11000台CPU服务器,大约相当于有250个机柜的数据中心,比SuperPOD多15倍。acYednc

目前它已经升级至采用NVIDIA BlueField-2,且NVIDIA如今还为该产品提供配套的NVIDIA Base Command DGX管理和编排工具。acYednc

NVIDIA Drive Orin:汽车的中央大脑

黄仁勋表示,自动驾驶汽车领域是“机器学习和机器人技术所面对的最严峻的挑战之一,同时也是最棘手、影响最大的挑战之一。”acYednc

黄仁勋表示,将于2022年投产的NVIDIA自动驾驶汽车计算系统级芯片——NVIDIA DRIVE Orin,旨在成为汽车的“中央电脑”。acYednc

acYednc

此次黄仁勋还推出了Hyperion 8 AV平台,包括参考传感器、自动驾驶汽车和中央计算机、3D地面真实数据记录仪、网络以及所有必要的软件。acYednc

并宣布沃尔沃汽车扩大与NVIDIA的合作。acYednc

沃尔沃从2016年开始应用NVIDIA DRIVE的算力,基于NVIDIA DRIVE Xavier,为新车型开发AI辅助驾驶功能,软件则由沃尔沃汽车旗下的自动驾驶软件开发公司Zenseact自主研发。acYednc

沃尔沃新一代汽车的自动驾驶计算机将配备NVIDIA DRIVE Orin。acYednc

这也是英伟达和合作伙伴致力推广的“软件定义车型”的概念。acYednc

黄仁勋还宣布DRIVE Sim将于今年夏季开放供业界使用。acYednc

责编:DemiacYednc

  • 今年显卡太夸张了,普普通通一万多起步
本文为EDN电子技术设计 原创文章,禁止转载。请尊重知识产权,违者本司保留追究责任的权利。
  • 微信扫一扫
    一键转发
  • 最前沿的电子设计资讯
    请关注“电子技术设计微信公众号”
  • 台积电、联电校招万人,业内人士:行业薪资达十年来最高水 近日,台积电、联电开启了校招活动,其中,台积电预计招募超过8000名新员工、联电预计招募 2000 名人才,硕士毕业工程师平均年薪上看200万新台币,约合人民币45万元。晶圆厂们大手笔扩招源于晶圆厂们2021年的“疯狂”扩产。
  • 被二十余家科技巨头“制裁”,俄罗斯反击:停供美国火箭发 随着俄罗斯与乌克兰冲突的持续升级,以美国为首的北约成员国和欧洲国家纷纷对俄罗斯宣布制裁,不少科技行业也加入了制裁俄罗斯的队伍。如英特尔、AMD断供,苹果在俄停售,美国社交平台“禁言”俄罗斯媒体、甲骨文、SAP等云巨头停服俄罗斯等,但值得一提的是,俄罗斯也进行了反击。不仅停止了向美国交付火箭发动机,终止两国在国际空间站的实验合作,还启用本国互联网 Runet。
  • PCIe 5.0连接器线缆详细信息曝光,最高支持600W 日前,Twitter 用户@momomo_us透露了进一步研究 PCIe Gen 5.0 连接器标准的图片和内容。根据泄漏者 @momom_us 发布的 PPT显示,即将推出的 PCIe Gen5 显卡标准官方名称为“12VHPWR”,负责定义 ATX 规格的英特尔数据显示,该接口将支持 4 种电源配置,分别为 150W、300W、450W、600W。
  • 英特尔、AMD、Arm等九大企业宣布UCIe开放标准,推动Chip 英特尔、AMD、Arm 和所有领先的代工厂商齐聚一堂,包括高通、三星、台积电、日月光,以及Google Cloud、Meta、微软,宣布他们正在为小芯片互连制定一个新的开放标准Universal Chiplet Interconnect Express (UCIe),希望以UCIe 1.0规范建立芯片互连、兼容运作,让更多业者能依照此标准打造新款处理器,并且能配合不同微芯片建构差异化设计。
  • 英伟达被黑客组织勒索,网友从泄露数据中挖出核心机密信 NVIDIA近日被南美黑客组织勒索攻击一事引起了网友的关注。不同于竞品中的AMD FSR采样技术和英特尔XeSS采样技术,英伟达之前从未公布过DLSS的源代码,很不愿意将这个大量挣钱的独有技术给开源了。部分获得了这些数据的人已经开始了对代码的分析、并试图弄懂DLSS的工作原理。
  • 联发科超越高通,成美国Android手机芯片首选 据EDN电子技术设计报道,联发科在其天玑 8000 系列简报中报告称,在美国销售的所有Android手机中,联发科芯片占比排名第一,并引用了IDC 2021 年第四季度的统计数据。
  • 从技术角度分析,GaN和SiC功率器件上量还欠什么? 氮化镓(GaN)和碳化硅(SiC)这两种新器件正在推动电力电子行业发生重大变化,它们在汽车、数据中心、可再生能源、航空航天和电机驱动等多个行业取得了长足的进步。在由AspenCore集团举办的PowerUP Expo大会上,演讲嘉宾们深入探讨了包括GaN和SiC在内的宽禁带(WBG)器件的技术优势以及发展趋势。
  • 小米发布“小感量+磁吸”无线充电预研技术,最高支持50W 据EDN电子技术设计报道,昨日,@小米手机 官微宣布,正式发布小感量+磁吸”无线充电预研技术,其磁吸无线充电功率最高可达50W,损耗降低50%。据悉,该技术与传统无线充电方案采用大感量线圈不同,小米的小感量无线快充技术方案采用小感知线圈去感应发送端能量。
  • 美国商务部宣布对俄罗斯出口限制:在技术上孤立并削弱其 美国时间2022 年 2 月 24 日,美国商务部通过其工业和安全局 (BIS) 对俄罗斯进一步入侵乌克兰作出回应,实施了一系列全面的严格出口管制措施,这些管制措施将严重限制俄罗斯获得其需要维持的技术和其他物品其侵略性的军事能力。
  • 电子工业落后的俄罗斯“秒赢”乌克兰,电子作战系统强在 2月24日,俄罗斯总统普京决定在顿巴斯开展特别军事行动,然而,开战一小时后,俄罗斯国防部称,高精度武器正在让乌克兰空军的军事基础设施、防空设备、军用机场和航空队失去战斗能力。那么俄罗斯这个战斗民族,在半导体、科技方面到底有哪些特色呢?
  • 555 定时器 IC 50 岁了,为何它能经久不衰? 自 1972 年推出以来,555 定时器 IC一直在市场上广泛使用。在 IC 技术编年史中,那是恐龙时代。这种基本未改变的 IC 已经生产了很长时间,目前仍有十几家厂商提供这种芯片。我找不到具体的数字,但我怀疑每年仍有数百万人在使用传统和新设计。那么也许是时候让 555 退役并在那些传统的晶圆厂队列中为其他更新的模拟 IC 腾出空间了?
  • 2022年五个值得关注的半导体行业趋势 众所周知,2021年的半导体需求不寻常,而且有些膨胀。与疫情相关的IC短缺和供应问题导致客户将订单增加了约15%,供应商将价格提高了约15%。这种恶化的需求比正常需求高出约30%。知道了这一点,2020年有望以以下趋势卷土重来:
广告
热门推荐
广告
广告
EE直播间
在线研讨会
广告
广告
面包芯语
广告
向右滑动:上一篇 向左滑动:下一篇 我知道了