广告

英伟达要抢英特尔最赚钱领域:首推数据中心CPU,Arm架构性能高10倍

2021-04-13 15:05:16 综合报道 阅读:
在400亿美元收购Arm的6个月后,NVIDIA连发三款基于Arm IP打造的处理器,包括全球首款专为TB级加速计算而设计的CPU NVIDIA Grace、全新BlueField-3 DPU,以及业界首款1000TOPS算力的自动驾驶汽车SoC。此外,还公布了与亚马逊AWS、Ampere Computing、联发科和Marvell等基于Arm的CPU平台的合作伙伴关系。

4月13日凌晨,NVIDIA(英伟达)创始人黄仁勋再一次身着皮衣,在自家厨房举办了NVIDIA GTC 2021发布会。PIKednc

在400亿美元收购Arm的6个月后,NVIDIA连发三款基于Arm IP打造的处理器,包括全球首款专为TB级加速计算而设计的CPU NVIDIA Grace、全新BlueField-3 DPU,以及业界首款1000TOPS算力的自动驾驶汽车SoC。此外,还公布了与亚马逊AWS、Ampere Computing、联发科和Marvell等基于Arm的CPU平台的合作伙伴关系。PIKednc

PIKednc

黄仁勋表示:“我们每年都会发布激动人心的新品。三类芯片,逐年飞跃,一个架构。”NVIDIA数据中心路线图包括CPU、GPU和DPU这三类芯片,每个芯片架构历经两年的打磨周期(周期内可能出现转变),一年专注于x86平台,另一年专注于Arm平台。PIKednc

Grace:专为大型应用建立的数据中心CPU

专攻GPU的英伟达在这次GTC大会上推出了基于Arm架构的中央处理器(CPU)—— Grace,用于大规模人工智能和高性能计算应用。PIKednc

黄仁勋表示,“这是英伟达第一个数据中心CPU,专为大型应用建立”。PIKednc

PIKednc

这款CPU以美国海军少将、计算机编程先驱Grace Hopper的名字命名。Grace Hopper是计算机科学的先驱之一,也是哈佛Mark 1的第一批程序员和第一个链接器的发明者。她在20世纪50年代开创了计算机编程,发明了世界上第一个编译器,被称为“计算机软件工程第一夫人”。PIKednc

这款名为Grace的CPU使用了节能 Arm 核心—— Neoverse,为系统训练大型人工智能模型提供了巨大的性能飞跃,每个CPU能在SPECrate2017_int_base基准测试中分数超过300分。PIKednc

具体讲,基于Grace的系统与NVIDIA GPU紧密结合,性能将比目前最先进的NVIDIA DGX系统(在x86 CPU上运行)高出10倍。PIKednc

它能够满足世界上最先进应用的计算需求,包括自然语言处理、推荐系统和人工智能超级计算,这些应用分析需要超快计算性能和大容量内存中的巨大数据集。PIKednc

Grace还是一款高度专用型处理器,主要面向大型数据密集型HPC和AI应用。新一代NLP模型的训练会有超过一万亿的参数。PIKednc

这款CPU的基本性能是第四代Nvidia NVLink互连技术,从CPU到GPU连接速度超过900GB/s,达到相当于目前服务器14倍的带宽;从CPU到CPU的速度超过600GB/s。PIKednc

拥有最高的内存带宽,采用的新内存LPDDR5x技术,带宽是LPDDR4的两倍,能源效率提高了10倍,能提供更多计算能力。PIKednc

PIKednc

英伟达表示,新产品将于2023年初上市。PIKednc

黄表示,使用经过授权的 ARM IP,英伟达将 Grace 设计成专门用于大规模人工智能和高性能计算的 CPU。PIKednc

作为首批客户,瑞士超级计算中心(CSCS)和美国洛斯阿拉莫斯国家实验室(Los Alamos National Laboratory)将是第一个使用由惠普打造的Grace驱动的超级计算机的机构。PIKednc

Grace将为世界上最快的超级计算机提供驱动力。这台被称为阿尔卑斯山的超算将具有20亿亿次浮点运算的能力。PIKednc

这比当今领先的人工智能超级计算机——2.8亿亿次运算的 Nvidia Seline 超级计算机的计算能力高出约7倍。PIKednc

基于Arm架构的新数据中心CPU Nvidia Grace的发布,或将直接挑战英特尔在服务器和数据中心计算领域的主导地位,抢占英特尔最赚钱的市场领域。PIKednc

BlueField-3 DPU:220亿晶体管

在黄仁勋看来,负责在数据中心传输和处理数据的数据处理单元(DPU),正与CPU、GPU共同组成“未来计算的三大支柱”。PIKednc

PIKednc

他宣布NVIDIA BlueField-3 DPU包含220亿个晶体管,采用16个Arm A78 CPU核心、18M IOPs弹性块存储,加密速度是上一代的4倍,并完全向下兼容BlueField-2。将为构建超大规模数据中心、工作站和超级计算机所需的基础设施提供进一步的加速。PIKednc

这款新一代数据处理器将提供最强大的软件定义网络、存储和网络安全加速功能。PIKednc

BlueField-2能够卸载相当于30个CPU核的工作负载,而BlueField-3实现了10倍的性能飞跃,能够替代300个CPU核,以400Gbps的速率,对网络流量进行保护、卸载和加速。PIKednc

业界首款1000TOPS算力的自动驾驶汽车SoC

NVIDIA DRIVE Atlan是NVIDIA新一代车载系统级芯片,为汽车带来真正的数据中心。PIKednc

PIKednc

Atlan可以达到每秒超过1000万亿次(TOPS)运算次数,约是上一代Orin处理器的4倍,超过了绝大多数L5无人驾驶出租车的总计算能力。PIKednc

这是DRIVE平台首次集成DPU,通过Arm核为自动驾驶汽车带来数据中心级的网络,致力于应用到2025年的车型。PIKednc

该SoC采用下一代GPU的体系结构、新型Arm CPU内核、新深度学习和计算机视觉加速器,并内置为先进的网络、存储和安全服务的BlueField DPU,网络速度可达400Gbps。PIKednc

黄仁勋夸赞说:“Atlan集NVIDIA在AI、汽车、机器人、安全和BlueField安全数据中心领域的所有技术之大成,堪称一项技术奇迹。”PIKednc

软硬件双管齐下,便捷式AI数据中心和DGX SuperPod双升级

软硬件双管齐下,黄仁勋宣布升级NVIDIA专为工作组打造的“便携式AI数据中心”——NVIDIA DGX Station,以及NVIDIA专为密集型AI研发打造的AI数据中心产品——NVIDIA DGX SuperPod。PIKednc

PIKednc

全新DGX Station 320G借助320GB超快速HBM2e连接至4个NVIDIA A100 GPU,内存带宽达到每秒8TB。然而,仅需将其插入普通的壁装电源插座即可使用,耗电量只有1500瓦。PIKednc

DGX SuperPOD使用全新80GB NVIDIA A100,将其HBM2e内存提升至90TB,实现2.2EB/s的总带宽。要实现如此的带宽,需要11000台CPU服务器,大约相当于有250个机柜的数据中心,比SuperPOD多15倍。PIKednc

目前它已经升级至采用NVIDIA BlueField-2,且NVIDIA如今还为该产品提供配套的NVIDIA Base Command DGX管理和编排工具。PIKednc

NVIDIA Drive Orin:汽车的中央大脑

黄仁勋表示,自动驾驶汽车领域是“机器学习和机器人技术所面对的最严峻的挑战之一,同时也是最棘手、影响最大的挑战之一。”PIKednc

黄仁勋表示,将于2022年投产的NVIDIA自动驾驶汽车计算系统级芯片——NVIDIA DRIVE Orin,旨在成为汽车的“中央电脑”。PIKednc

PIKednc

此次黄仁勋还推出了Hyperion 8 AV平台,包括参考传感器、自动驾驶汽车和中央计算机、3D地面真实数据记录仪、网络以及所有必要的软件。PIKednc

并宣布沃尔沃汽车扩大与NVIDIA的合作。PIKednc

沃尔沃从2016年开始应用NVIDIA DRIVE的算力,基于NVIDIA DRIVE Xavier,为新车型开发AI辅助驾驶功能,软件则由沃尔沃汽车旗下的自动驾驶软件开发公司Zenseact自主研发。PIKednc

沃尔沃新一代汽车的自动驾驶计算机将配备NVIDIA DRIVE Orin。PIKednc

这也是英伟达和合作伙伴致力推广的“软件定义车型”的概念。PIKednc

黄仁勋还宣布DRIVE Sim将于今年夏季开放供业界使用。PIKednc

责编:DemiPIKednc

  • 今年显卡太夸张了,普普通通一万多起步
  • 微信扫一扫
    一键转发
  • 最前沿的电子设计资讯
    请关注“电子技术设计微信公众号”
  • 用水泥和炭黑制造储能超级电容器 一项新的研究表明,人类最普遍的两种历史材料,水泥和炭黑(类似于非常细的木炭),可能会成为新型低成本储能系统的基础。该技术可以在可再生能源供应出现波动的情况下使能源网络保持稳定,从而促进太阳能、风能和潮汐能等可再生能源的使用。
  • 美国公司声称发现室温超导材料,被授予了高于室温的第二 位于美国佛罗伦萨州的Taj Quantum的公司在社交媒体宣布,被授予了高于室温的第二类超导体专利。据称,这种独特的 II 型超导体(专利号:17249094)可在较宽的温度范围内工作,包括远高于室温的温度,从约 -100° F (-73° C) 到约 302° F (150° C) - 这是一种特性这在超导体世界中并不常见。
  • 俄罗斯“贝加尔湖”基准测试对比英特尔和华为芯片,惨败 俄罗斯服务器处理器 Baikal-S 的开发人员将其性能与美国和中国的同类芯片进行了比较。涉及六个流行指标。
  • 麻省理工发现新型量子磁铁释放电子潜力 研究人员发现了如何控制异常霍尔效应和贝里曲率来制造用于计算机、机器人和传感器的柔性量子磁体。
  • 万物电气化:探索绿色未来之路 在本文中,我们将重点介绍美国年度脱碳展望(ADP)2022报告中的一些重要发现。本报告着眼于实现净零经济的各种情景。我们在本文中重点关注的方法称为“中心情景”,它遵循到2050年实现净零排放的时间表。
  • 下一个医疗前沿:网联可穿戴设备 医疗和消费级可穿戴设备将继续增强连接性和电池寿命,以实现对血压、体温和身体水分等多种生物标志物的实时和非侵入性监测。
  • ST亮相MWC上海:升级版智能座舱,首款USB-IF认证芯片,带你 ST携智能出行、电源&能源、物联网&互联等领域的产品和智能解决方案亮相MWC上海展,并带来多款升级展品,让观众通过充分了解ST的创新技术和解决方案,领略科技之美,探索产业新动态。
  • 全球MCU加速内卷,如何“卷”出更具活力的大生态?——202 国产MCU头部企业已在各自擅长的领域扎稳脚跟,高达三位数的国产MCU公司在20%的市场中为了生存而奋斗,而早已完成产业整合的国际MCU大厂却在80%的市场中胜似闲庭信步。未来三年内预计MCU整体需求将减缓,行业内竞争将趋于激烈。在2023年全球MCU生态发展大会上,国际和本土知名MCU厂商的技术和应用专家,为来自消费电子、家电、工业控制、通信网络、新能源汽车和物联网领域的OEM厂商和方案集成商代表带来MCU领域的最新技术趋势和应用解决方案。
  • ETC收费领域实现国产化,终端到服务器端均可使用龙芯处 “国产自主车道控制器”由四川智能交通系统管理有限责任公司组织研制,基于龙芯2K1000LA处理器,目前已在四川省高速公路联网收费系统多个收费站试点应用,它的成功研制标志着我国高速公路数字化建设在国产化方面取得了新突破。
  • 超级电容器的能量容量取得里程碑式进展 超级电容器具有很高的潜力,因为它们的充电速度比电池快得多,只需几秒到几分之一秒。然而,目前的超级电容器只能存储少量的能量,这限制了其潜在的应用范围。科学家表示,如果超级电容器能够被设计为存储更多能量,那么它们的物理重量将比电池更轻,充电速度也更快,这将产生重大的商业影响。
  • 华为Mate 60 Pro或搭载国产5G射频芯片,9月底发布 知名数码博主@IT科技侠 最新发布的信息显示,全新的华为Mate 60系列预计将在9月底正式发布,其中标准版将搭载高通骁龙8+芯片,Pro版本搭载高通骁龙8 Gen2芯片,均依旧是4G版本。而华为Mate 60 Pro则有望首次搭载国产5G射频芯片,这意味着该机将有可能支持5G网络。
  • 国产自主的芯片指令集龙芯Arch Linux版系统发布 龙芯中科宣布,他们的龙架构 Arch Linux 发行版正式结束了beta状态,现已正式支持该架构,并且移植了1万多款x86平台软件。
广告
热门推荐
广告
广告
EE直播间
在线研讨会
广告
广告
面包芯语
广告
向右滑动:上一篇 向左滑动:下一篇 我知道了