向右滑动:上一篇 向左滑动:下一篇 我知道了
广告

得益于人工智能/机器学习发展,FPGA智能网卡成新宠

时间:2019-12-02 作者:赵明灿 阅读:
受到人工智能/机器学习(AI/ML)的推动,数据中心/云端和边缘计算市场快速发展。在这个市场中,智能网卡大热,其中又以FPGA为新。Achronix和BittWare共同推出的基于Speedster 7t FPGA的VectorPathS7t-VG6加速卡,让二线云服务提供商也能获得以前只有大型云服务提供商才有的采用FPGA方案的优势。

受到人工智能/机器学习(AI/ML)的推动,数据中心/云端和边缘计算市场快速发展。据了解,数据中心加速器市场(包括CPU、GPU、FPGA和ASIC)预计将从2018年的28.4亿美元增长到2023年的211.9亿美元,年复合增长率(CAGR)达49.47%。其中,又以FPGA为增长最快的细分市场——企业级工作负载加速应用正对FPGA越来越多地采用。

在这个市场中,智能网卡大热,其中又以FPGA为新。日前,Achronix和BittWare(molex旗下子公司)共同发布了基于Achronix Speedster 7t FPGA的VectorPathS7t-VG6加速卡,它让二线云服务提供商也能获得以前只有大型云服务提供商才有的采用FPGA方案的优势。

数据加速器四大应用

据Achronix Semiconductor公司市场营销副总裁Steve Mensor介绍,数据加速器的主要应用包括计算、网络、存储和传感器处理四大类。具体案例如下图所示。

Achronix-1

“和AI相关的,像语音识别、图像识别、文本分析、语义识别等热门应用,GPU也能做,但DPI、网络加速、网络监控、负载均衡、雷达处理、医疗影像、天气预报等,是FPGA的传统应用领域,这些都不是GPU或CPU所能胜任的。”Mensor介绍说,“在网络方面,以前对于10G以下的速率,都是用服务器CPU来进行处理,而到25G到100G,再用传统的服务器CPU,就来不及处理这些网络负载,因为CPU不仅要处理网络数据,还要处理应用业务。因此,几年前业界开始将一些网络处理交给FPGA来做。在存储方面,同理,随着移动互联和5G产生的数据越来越多,数据最后的存储与分析如果还是依赖服务器CPU处理,性能(处理速度)和功耗都将显著恶化。因此业界都在转用专用CPU或FPGA来卸载这些负载。在信号处理方面,例如天气预报、雷达等都是传统的FPGA加速应用,在这之中,CPU只是用来控制。”

FPGA与传统CPU相比性能提升

FPGA和传统CPU相比,性能可提升10-100倍;在实现同样功能时,功耗会低得多。具体数据如下。

Achronix-2

为何设计基于FPGA的PCIe加速卡?

下图是基于FPGA的PCIe加速卡的市场趋势。BittWare公司企业副总裁Sam Bichara介绍说,FPGA在加速卡市场的采用目前正处于上升期。一个很好的例子就是最开始将FPGA用在数据中心的是微软,那时候他们采用的是Altera的方案。然后Amazon追随微软设计,用的是Xilinx的方案。这两家大型云服务提供商有实力和工程资源将FPGA方案集成到自己服务器的板子上。而很多二线厂商没有这个设计实力但又想去用。

Achronix-3

在数据中心中应用FPGA可以带来以下几个好处。

Achronix-4

因此,BittWare联合Achronix发布了VectorPath加速卡,其特性如下。

Achronix-5

VectorPath加速卡功能一览

以下是其硬件功能和接口的概览。“PCIe业界目前还是采用Gen3 x16,这块板卡也是基于Gen3测试,但它是基于Gen4设计。未来,由于Achronix的FPGA芯片支持PCIe Gen5 32Gbps,因此随着Gen4和Gen5成为服务器主流时,这个板卡只需要做软件升级,就可以在客户端应用。”Bichara说,“网络接口还会提供硬件MAC和PEC IP,支持客户做网络接口的开发。网络接口有两种:QSFP56和QSFP-DD,分别提供200GbE和400GbE速率,并可通过铜缆和光模块分解成多路10/25/40/50GbE。存储主要采用GDDR6,与集成到芯片内的HBM2相比配置灵活,价格很低。对于有些应用,没必要把数据和计算放到GDDR6上,DDR4可以提供更好的性价比。OCuLink高速接口可实现接口扩展。它是PCIe规定的标准接口,可以和NVMe闪存直接连接,也可以做板卡级联,提供高速通道……”另外,它提供时钟和扩展接口。时钟输入用于级联,为每块板卡提供同步。GPIO接口则可以用于扩展附加应用和控制。”

Achronix-6
Achronix-7
Achronix-8

什么是2D片上网络(NoC)?

下图说明了Speedster7t的部分特性。

Achronix-9

Speedster7t提供独特的2D片上网络(NoC)。“这个网络非常重要,它就好比城市里的高架路。传统的FPGA里是没有2D片上网络的,它里面的布线好比2车道、4车道,没有这么高的带宽。”

Achronix-10

AFX是种标准接口,可以使用户非常容易地把其逻辑接入到这个高速网络。这对开发者来说开辟了一种新的开发方式,大大降低了其开发难度。

Speedster7t NoC开创新的设计方式

下面是一个用传统FPGA设计的例子。“假定它里面有两个功能,它们都需要读取外部存储。为了完成这件事情,除了两个功能本身的逻辑外,它还有很多辅助电路——这在传统FPGA中必须存在,但是又没必要。外部存储器控制电路的频率非常高,比如DDR4是一两G,但FPGA内部功能一般只有几百M,这就需要跨时钟域处理电路。然后,在两个功能之间需要有仲裁电路,从而避免它们同时读取相同地址的存储单元。这就会占用FPGA内部的逻辑资源和布线资源,并使设计复杂化。”

Achronix-11.jpg

Speedster7t当中具有二位片上网络,因此开辟了新的开发场景。上述问题在Speedster7t上完全不存在,开发者只要专注开发自己的功能核心,然后把它连到高速网络即可——高速网络就会处理上述所有事情。

Achronix-12.jpg

另外,Speedster7t专为计算密集型人工智能/机器学习(AI/ML)应用而优化,特点如下。

Achronix-13.jpg

同时提供TeraBox FPGA服务器

最后,BittWare除了提供FPGA板卡,还提供TeraBox FPGA服务器,从而可以让客户直接放在机架上运行业务。它的密度可以从1U扩展到5U,里面可以集成多种BittWare的基于FPGA的板卡,同时可以通过板卡去配合戴尔、慧与等OEM供应商。

Achronix-14.jpg

本文为EDN电子技术设计 原创文章,禁止转载。请尊重知识产权,违者本司保留追究责任的权利。
赵明灿
赵明灿是EDN China的产业分析师/技术编辑。他在电子行业拥有10多年的从业经验。在加入ASPENCORE之前,他曾在电源和智能电表等领域担任过4年的工程师。
  • 微信扫一扫
    一键转发
  • 最前沿的电子设计资讯
    请关注“电子技术设计微信公众号”
您可能感兴趣的文章
  • “全球双峰会”给中国媒体编辑带来的感受与思考 “2019 全球高科技领袖论坛 - 全球CEO峰会&全球分销与供应链领袖峰会”(下文简称“全球双峰会”) 于11月7日~8日在深圳隆重举行,期间五大活动包括全球CEO峰会和全球电子成就奖颁奖典礼,全球分销与供应链领袖峰会和全球元器件分销商卓越表现奖颁奖典礼,以及与峰会同期举行的电子成就展展会不仅给演讲嘉宾、观众留下深刻的印象,很多话题仍在持续发酵。
  • N个第一!联发科天玑1000坐实地表最强5G SoC名号 虽然MediaTek早在5月Computex期间就全球首发集成式5G SoC ,但产品名称和量产时间却迟迟未能确定。眼看友商的5G芯片一个一个被用在终端产品上,终于在11月26日, MediaTek 首款5G移动平台“天玑1000”(MT6889)在深圳正式发布 ,用多项全球第一的技术规格、参数和跑分将友商的5G芯片统统踩在地上摩擦了一遍……
  • 看不懂AI芯片推理性能跑分结果?专家教你! 继今年早些时候发表了AI训练的性能测试基准,MLPerf近期又针对AI推理性能公布了测试基准MLPerf v0.5以及各公司的AI芯片跑分结果。然而很多读者看了MLPerf跑分结果后表示一头雾水,因为有些系统看来相似分数却大不相同,而且也搞不清楚数字高低究竟代表什么……
  • 清华权威报告告诉你:人工智能的情感计算是什么? 人类的认知、行为等几乎都要受到情感的驱动,并影响着人际互动以及群体活动。在人与人的交往中, 情感的交流还常被用来完成人的意图的传递。因此,在智能人机交互的研究中,拥有对情感的识别、分析、理解、表达的能力也应成为智能机器必不可少的一种功能。
  • SONY的AI新部门终于诞生! 据了解,Sony AI打算从全球各地延揽杰出AI工程人才;不过Sony尚未公布新部门将会有多少研发人员与工程师...
  • 大学理工科系对于AI浪潮的准备充分吗? 大学理工科系对于AI浪潮的准备充分吗?在专家都不一定能清楚解释神经网络如何运作的如今,如何能让学生们了解这种最新技术?
相关推荐
    广告
    近期热点
    广告
    广告
    广告
    可能感兴趣的话题
    广告