广告

英伟达:超级算力赋能整车中央计算

2023-06-12 16:04:35 夏菲 阅读:
现在很多新势力厂商已把全车做到10个以下的域控制器,甚至能实现比以前传统厂商更多的功能。随着域控制器的数量的进一步减少,其功能也将越来越复杂,对单个域控制器的性能也将提出更高的挑战。

在汽车智能化,网联化发展的需要下,传统分布式的架构零散的电子控制器(Electronic Control Unit, ECU)布局逐渐向集中式架构演进,“域”和“域控制器”产生,以前可能是一个域控制器负责一个或者两个功能,但现在很多新势力厂商已把全车做到10个以下的域控制器,甚至能实现比以前传统厂商更多的功能。随着域控制器的数量的进一步减少,其功能也将越来越复杂,对单个域控制器的性能也将提出更高的挑战。yAdednc

yAdednc

英伟达半导体解决方案经理贺威yAdednc

 6月8日,在由AspenCore主办的2023国际AIoT生态发展大会智能网联汽车分论坛上,英伟达半导体解决方案经理贺威先生分享了英伟达在框架融合和中央计算趋势下做的一些应对和布局。yAdednc

分布式向集中式演进大势所趋

据介绍,英伟达第一代车端SOC叫Parker,这一代并没有大规模量产的案例,更多的是拿来做系统验证或者打通前端的数据采集,甚至有的用户拿来做开发版。第二代叫Xavier,有一些大规模量产的案例,属于比较成熟的方案。第三代则是目前在国内占据主流的Orin。yAdednc

yAdednc

ORIN芯片参数如下:yAdednc

  • 24.5 billion transistors
  • 12 A78 (Hercules) ARM64 CPUs
  • 254 INT8 TOPS - CUDA Tensor Core GPU + DLA 
  • 205 GB/s memory bandwidth
  • 4 10Gbps ENET
  • 8K 30 Dec | 4K 60 Enc – H264 / H265 / VP9
  • 4 R52 Lock-step Pairs Integrated Safety Island ASIL-D
  • Secure key storage
  • FUSA ASIL-B Chip | ASIL-D Systematic

据贺威介绍,英伟达GPU的灵活性众所周知,对于深度学习和神经网络非常友好,但将其放在车端或者移动端,灵活性就需要牺牲能耗来实现,因此提供了专门针对特定神经网络的DLA引擎,并进行了算法优化,使其灵活的同时,具有很高的性能功耗比,同时也提供了非常易用的接口给到用户。yAdednc

ORIN上还有比较高内存的带宽,提供了很好的连接性,如以太网的接口。同时还有大量的硬件加速引擎,如编解码加速引擎,图像引擎等。并提供了PBA加速引擎,用户可以把一些比较简单的算法部署在这上面,同时引入了车规级的安全岛Safety Island模块。yAdednc

贺威:“从前年开始已有大量中国厂商采用ORIN的设计,各家方案不一样,有的采用一颗ORIN,有的可能采用两颗甚至四颗更多。ORIN也提供了芯片之间互联的能力,以此给用户提供更多的性能上的冗余。现在的汽车大家都说是软件定义汽车,如果在预埋足够算力的硬件之后,后期可以通过软件不停地做升级,以此来让用户获得更多功能上的体验。”yAdednc

据NVIDIA官网介绍,英伟达下一代车端SOC Thor,预计明年推出,在算力上将实现非常大的提升,DRIVE Thor 将逐步接替 DRIVE Orin,以最新的计算技术,加速智能汽车技术在行业内的部署,赋能汽车制造商的 2025 年车型。yAdednc

Thor参数如下:yAdednc

  • 77B transistors
  • 2000 TFLOPS performance with FP8 precision
  • Leverages Hopper GPU, Ada GPU, and Grace CPU
  • Integrates Transformer Engine for accelerated inference
  • Multi-domain computing: Linux, QNX, Android
  • NVLINK-C2C scalability
  • Eases supply constraints, simplifies car E/E design
  • Lowers weight, cabling, footprint, costs

据官网介绍,DRIVE Thor 也是首个采用推理 Transformer 引擎的NVIDIA自动驾驶汽车平台。Transformer 引擎是 NVIDIA GPU Tensor Core 的一个全新组件。Transformer 网络将视频数据作为单个感知帧来处理,使计算平台能够随着时间的推移具有处理更多数据的能力。yAdednc

此外,DRIVE Thor能够进行多域计算,这意味着它可以将自动驾驶、车载信息娱乐等功能划分为不同的任务区间,同时运行,互不干扰。DRIVE Thor芯片也可以让车辆所有的显示器、传感器等都连接到单一芯片上,极大地简化了汽车制造的复杂程序,这也是汽车电子电气架构从分布式向集中式演进的大势所趋。yAdednc

软件加持最大化释放硬件潜能

贺威认为,硬件只是实现高算力高性能的一方面,把硬件的潜能做到最大化的释放,还需要软件的加持。yAdednc

英伟达针对车载加速计算推出了安全操作系统DRIVE OS。据英伟达官网介绍,DRIVE OS是一个基础软件栈,由嵌入式实时操作系统 (RTOS)、NVIDIA Hypervisor、NVIDIA® CUDA® 库,以及可让您访问硬件引擎的其他模组组成。DRIVE OS 为安全启动、安全服务、防火墙和无线 (OTA) 更新等应用程序提供安全可靠的执行环境。yAdednc

官网详细信息:yAdednc

  • 多个客户机操作系统
  • 64 位用户空间和运行时库
  • 用于硬件加速多媒体和摄像头输入处理的 NvMedia API
  • CUDA 并行计算平台
  • 图形 API:OpenGL、OpenGL ES、支持 EGLStream 扩展程序的 EGL
  • 深度学习库:TensorRT、cuDNN

贺威:“DRIVE OS的核心是一套虚拟化的平台,可兼容不同的OS,不同于其他厂商,DRIVE OS是英伟达自己做的方案,它提供了对英伟达SOC平台上资源的隔离,同时保证了各个不同计算阈的要求,如有些计算阈实时性要求比较高,QS要求也比较高,有些阈对渲染的需求更大,利用DRIVE OS这套虚拟化平台,我们会针对英伟达的SOC做最大的优化,它所引入的性能、损耗几乎可以忽略不计。同时又能很好地做资源的隔离,很好地适配我们的SOC。”yAdednc

当说到算力时,经常会有一些评测,或者理论指出英伟达某款芯片性能被“吊打”,但贺威强调:“不要只关注这个芯片有多少计算能力,英伟达关注的是从软件上怎么去充分地释放提供硬件的能力,同时怎么给用户以最好的体验,让开发者和终端用户真正便捷地享受算力提升带来的好处。”yAdednc

据贺威介绍,英伟达在软件方面针对整个DRIVE OS做的各个模块,构成了从车端到云端的一整套生态链,他认为,英伟达的护城河不只是高算力,还有这套生态链。贺威:“从横向上来看,嵌入式、车端、云端都可使用这一套虚拟平台,纵向上来看,从第一代刚开始提出,到英伟达加入车载领域之后,包括虚拟化解决方案和SDK,英伟达一直在使用这套虚拟平台。并且在未来,英伟达还会持续对硬件和软件进行优化。”yAdednc

责编:Demi
夏菲
电子技术设计(EDN China)助理产业分析师
  • 微信扫一扫
    一键转发
  • 最前沿的电子设计资讯
    请关注“电子技术设计微信公众号”
广告
热门推荐
广告
广告
EE直播间
在线研讨会
广告
广告
面包芯语
广告
向右滑动:上一篇 向左滑动:下一篇 我知道了