广告

得益于人工智能/机器学习发展,FPGA智能网卡成新宠

2019-12-02 赵明灿 阅读:
得益于人工智能/机器学习发展,FPGA智能网卡成新宠
受到人工智能/机器学习(AI/ML)的推动,数据中心/云端和边缘计算市场快速发展。在这个市场中,智能网卡大热,其中又以FPGA为新。Achronix和BittWare共同推出的基于Speedster 7t FPGA的VectorPathS7t-VG6加速卡,让二线云服务提供商也能获得以前只有大型云服务提供商才有的采用FPGA方案的优势。

受到人工智能/机器学习(AI/ML)的推动,数据中心/云端和边缘计算市场快速发展。据了解,数据中心加速器市场(包括CPU、GPU、FPGA和ASIC)预计将从2018年的28.4亿美元增长到2023年的211.9亿美元,年复合增长率(CAGR)达49.47%。其中,又以FPGA为增长最快的细分市场——企业级工作负载加速应用正对FPGA越来越多地采用。a7Aednc

在这个市场中,智能网卡大热,其中又以FPGA为新。日前,Achronix和BittWare(molex旗下子公司)共同发布了基于Achronix Speedster 7t FPGA的VectorPathS7t-VG6加速卡,它让二线云服务提供商也能获得以前只有大型云服务提供商才有的采用FPGA方案的优势。a7Aednc

数据加速器四大应用

据Achronix Semiconductor公司市场营销副总裁Steve Mensor介绍,数据加速器的主要应用包括计算、网络、存储和传感器处理四大类。具体案例如下图所示。a7Aednc

Achronix-1a7Aednc

“和AI相关的,像语音识别、图像识别、文本分析、语义识别等热门应用,GPU也能做,但DPI、网络加速、网络监控、负载均衡、雷达处理、医疗影像、天气预报等,是FPGA的传统应用领域,这些都不是GPU或CPU所能胜任的。”Mensor介绍说,“在网络方面,以前对于10G以下的速率,都是用服务器CPU来进行处理,而到25G到100G,再用传统的服务器CPU,就来不及处理这些网络负载,因为CPU不仅要处理网络数据,还要处理应用业务。因此,几年前业界开始将一些网络处理交给FPGA来做。在存储方面,同理,随着移动互联和5G产生的数据越来越多,数据最后的存储与分析如果还是依赖服务器CPU处理,性能(处理速度)和功耗都将显著恶化。因此业界都在转用专用CPU或FPGA来卸载这些负载。在信号处理方面,例如天气预报、雷达等都是传统的FPGA加速应用,在这之中,CPU只是用来控制。”a7Aednc

FPGA与传统CPU相比性能提升

FPGA和传统CPU相比,性能可提升10-100倍;在实现同样功能时,功耗会低得多。具体数据如下。a7Aednc

Achronix-2a7Aednc

为何设计基于FPGA的PCIe加速卡?

下图是基于FPGA的PCIe加速卡的市场趋势。BittWare公司企业副总裁Sam Bichara介绍说,FPGA在加速卡市场的采用目前正处于上升期。一个很好的例子就是最开始将FPGA用在数据中心的是微软,那时候他们采用的是Altera的方案。然后Amazon追随微软设计,用的是Xilinx的方案。这两家大型云服务提供商有实力和工程资源将FPGA方案集成到自己服务器的板子上。而很多二线厂商没有这个设计实力但又想去用。a7Aednc

Achronix-3a7Aednc

在数据中心中应用FPGA可以带来以下几个好处。a7Aednc

Achronix-4a7Aednc

因此,BittWare联合Achronix发布了VectorPath加速卡,其特性如下。a7Aednc

Achronix-5a7Aednc

VectorPath加速卡功能一览

以下是其硬件功能和接口的概览。“PCIe业界目前还是采用Gen3 x16,这块板卡也是基于Gen3测试,但它是基于Gen4设计。未来,由于Achronix的FPGA芯片支持PCIe Gen5 32Gbps,因此随着Gen4和Gen5成为服务器主流时,这个板卡只需要做软件升级,就可以在客户端应用。”Bichara说,“网络接口还会提供硬件MAC和PEC IP,支持客户做网络接口的开发。网络接口有两种:QSFP56和QSFP-DD,分别提供200GbE和400GbE速率,并可通过铜缆和光模块分解成多路10/25/40/50GbE。存储主要采用GDDR6,与集成到芯片内的HBM2相比配置灵活,价格很低。对于有些应用,没必要把数据和计算放到GDDR6上,DDR4可以提供更好的性价比。OCuLink高速接口可实现接口扩展。它是PCIe规定的标准接口,可以和NVMe闪存直接连接,也可以做板卡级联,提供高速通道……”另外,它提供时钟和扩展接口。时钟输入用于级联,为每块板卡提供同步。GPIO接口则可以用于扩展附加应用和控制。”a7Aednc

Achronix-6a7Aednc
Achronix-7a7Aednc
Achronix-8a7Aednc

什么是2D片上网络(NoC)?

下图说明了Speedster7t的部分特性。a7Aednc

Achronix-9a7Aednc

Speedster7t提供独特的2D片上网络(NoC)。“这个网络非常重要,它就好比城市里的高架路。传统的FPGA里是没有2D片上网络的,它里面的布线好比2车道、4车道,没有这么高的带宽。”a7Aednc

Achronix-10a7Aednc

AFX是种标准接口,可以使用户非常容易地把其逻辑接入到这个高速网络。这对开发者来说开辟了一种新的开发方式,大大降低了其开发难度。a7Aednc

Speedster7t NoC开创新的设计方式

下面是一个用传统FPGA设计的例子。“假定它里面有两个功能,它们都需要读取外部存储。为了完成这件事情,除了两个功能本身的逻辑外,它还有很多辅助电路——这在传统FPGA中必须存在,但是又没必要。外部存储器控制电路的频率非常高,比如DDR4是一两G,但FPGA内部功能一般只有几百M,这就需要跨时钟域处理电路。然后,在两个功能之间需要有仲裁电路,从而避免它们同时读取相同地址的存储单元。这就会占用FPGA内部的逻辑资源和布线资源,并使设计复杂化。”a7Aednc

Achronix-11.jpga7Aednc

Speedster7t当中具有二位片上网络,因此开辟了新的开发场景。上述问题在Speedster7t上完全不存在,开发者只要专注开发自己的功能核心,然后把它连到高速网络即可——高速网络就会处理上述所有事情。a7Aednc

Achronix-12.jpga7Aednc

另外,Speedster7t专为计算密集型人工智能/机器学习(AI/ML)应用而优化,特点如下。a7Aednc

Achronix-13.jpga7Aednc

同时提供TeraBox FPGA服务器

最后,BittWare除了提供FPGA板卡,还提供TeraBox FPGA服务器,从而可以让客户直接放在机架上运行业务。它的密度可以从1U扩展到5U,里面可以集成多种BittWare的基于FPGA的板卡,同时可以通过板卡去配合戴尔、慧与等OEM供应商。a7Aednc

Achronix-14.jpga7Aednc

本文为EDN电子技术设计 原创文章,禁止转载。请尊重知识产权,违者本司保留追究责任的权利。
赵明灿
赵明灿是EDN China的产业分析师/技术编辑。他在电子行业拥有10多年的从业经验。在加入ASPENCORE之前,他曾在电源和智能电表等领域担任过4年的工程师。
  • 微信扫一扫
    一键转发
  • 最前沿的电子设计资讯
    请关注“电子技术设计微信公众号”
广告
热门推荐
广告
广告
EE直播间
在线研讨会
广告
广告
面包芯语
广告
向右滑动:上一篇 向左滑动:下一篇 我知道了