广告

得益于人工智能/机器学习发展,FPGA智能网卡成新宠

2019-12-02 08:34:19 赵明灿 阅读:
受到人工智能/机器学习(AI/ML)的推动,数据中心/云端和边缘计算市场快速发展。在这个市场中,智能网卡大热,其中又以FPGA为新。Achronix和BittWare共同推出的基于Speedster 7t FPGA的VectorPathS7t-VG6加速卡,让二线云服务提供商也能获得以前只有大型云服务提供商才有的采用FPGA方案的优势。

受到人工智能/机器学习(AI/ML)的推动,数据中心/云端和边缘计算市场快速发展。据了解,数据中心加速器市场(包括CPU、GPU、FPGA和ASIC)预计将从2018年的28.4亿美元增长到2023年的211.9亿美元,年复合增长率(CAGR)达49.47%。其中,又以FPGA为增长最快的细分市场——企业级工作负载加速应用正对FPGA越来越多地采用。adEednc

在这个市场中,智能网卡大热,其中又以FPGA为新。日前,Achronix和BittWare(molex旗下子公司)共同发布了基于Achronix Speedster 7t FPGA的VectorPathS7t-VG6加速卡,它让二线云服务提供商也能获得以前只有大型云服务提供商才有的采用FPGA方案的优势。adEednc

数据加速器四大应用

据Achronix Semiconductor公司市场营销副总裁Steve Mensor介绍,数据加速器的主要应用包括计算、网络、存储和传感器处理四大类。具体案例如下图所示。adEednc

Achronix-1adEednc

“和AI相关的,像语音识别、图像识别、文本分析、语义识别等热门应用,GPU也能做,但DPI、网络加速、网络监控、负载均衡、雷达处理、医疗影像、天气预报等,是FPGA的传统应用领域,这些都不是GPU或CPU所能胜任的。”Mensor介绍说,“在网络方面,以前对于10G以下的速率,都是用服务器CPU来进行处理,而到25G到100G,再用传统的服务器CPU,就来不及处理这些网络负载,因为CPU不仅要处理网络数据,还要处理应用业务。因此,几年前业界开始将一些网络处理交给FPGA来做。在存储方面,同理,随着移动互联和5G产生的数据越来越多,数据最后的存储与分析如果还是依赖服务器CPU处理,性能(处理速度)和功耗都将显著恶化。因此业界都在转用专用CPU或FPGA来卸载这些负载。在信号处理方面,例如天气预报、雷达等都是传统的FPGA加速应用,在这之中,CPU只是用来控制。”adEednc

FPGA与传统CPU相比性能提升

FPGA和传统CPU相比,性能可提升10-100倍;在实现同样功能时,功耗会低得多。具体数据如下。adEednc

Achronix-2adEednc

为何设计基于FPGA的PCIe加速卡?

下图是基于FPGA的PCIe加速卡的市场趋势。BittWare公司企业副总裁Sam Bichara介绍说,FPGA在加速卡市场的采用目前正处于上升期。一个很好的例子就是最开始将FPGA用在数据中心的是微软,那时候他们采用的是Altera的方案。然后Amazon追随微软设计,用的是Xilinx的方案。这两家大型云服务提供商有实力和工程资源将FPGA方案集成到自己服务器的板子上。而很多二线厂商没有这个设计实力但又想去用。adEednc

Achronix-3adEednc

在数据中心中应用FPGA可以带来以下几个好处。adEednc

Achronix-4adEednc

因此,BittWare联合Achronix发布了VectorPath加速卡,其特性如下。adEednc

Achronix-5adEednc

VectorPath加速卡功能一览

以下是其硬件功能和接口的概览。“PCIe业界目前还是采用Gen3 x16,这块板卡也是基于Gen3测试,但它是基于Gen4设计。未来,由于Achronix的FPGA芯片支持PCIe Gen5 32Gbps,因此随着Gen4和Gen5成为服务器主流时,这个板卡只需要做软件升级,就可以在客户端应用。”Bichara说,“网络接口还会提供硬件MAC和PEC IP,支持客户做网络接口的开发。网络接口有两种:QSFP56和QSFP-DD,分别提供200GbE和400GbE速率,并可通过铜缆和光模块分解成多路10/25/40/50GbE。存储主要采用GDDR6,与集成到芯片内的HBM2相比配置灵活,价格很低。对于有些应用,没必要把数据和计算放到GDDR6上,DDR4可以提供更好的性价比。OCuLink高速接口可实现接口扩展。它是PCIe规定的标准接口,可以和NVMe闪存直接连接,也可以做板卡级联,提供高速通道……”另外,它提供时钟和扩展接口。时钟输入用于级联,为每块板卡提供同步。GPIO接口则可以用于扩展附加应用和控制。”adEednc

Achronix-6adEednc
Achronix-7adEednc
Achronix-8adEednc

什么是2D片上网络(NoC)?

下图说明了Speedster7t的部分特性。adEednc

Achronix-9adEednc

Speedster7t提供独特的2D片上网络(NoC)。“这个网络非常重要,它就好比城市里的高架路。传统的FPGA里是没有2D片上网络的,它里面的布线好比2车道、4车道,没有这么高的带宽。”adEednc

Achronix-10adEednc

AFX是种标准接口,可以使用户非常容易地把其逻辑接入到这个高速网络。这对开发者来说开辟了一种新的开发方式,大大降低了其开发难度。adEednc

Speedster7t NoC开创新的设计方式

下面是一个用传统FPGA设计的例子。“假定它里面有两个功能,它们都需要读取外部存储。为了完成这件事情,除了两个功能本身的逻辑外,它还有很多辅助电路——这在传统FPGA中必须存在,但是又没必要。外部存储器控制电路的频率非常高,比如DDR4是一两G,但FPGA内部功能一般只有几百M,这就需要跨时钟域处理电路。然后,在两个功能之间需要有仲裁电路,从而避免它们同时读取相同地址的存储单元。这就会占用FPGA内部的逻辑资源和布线资源,并使设计复杂化。”adEednc

Achronix-11.jpgadEednc

Speedster7t当中具有二位片上网络,因此开辟了新的开发场景。上述问题在Speedster7t上完全不存在,开发者只要专注开发自己的功能核心,然后把它连到高速网络即可——高速网络就会处理上述所有事情。adEednc

Achronix-12.jpgadEednc

另外,Speedster7t专为计算密集型人工智能/机器学习(AI/ML)应用而优化,特点如下。adEednc

Achronix-13.jpgadEednc

同时提供TeraBox FPGA服务器

最后,BittWare除了提供FPGA板卡,还提供TeraBox FPGA服务器,从而可以让客户直接放在机架上运行业务。它的密度可以从1U扩展到5U,里面可以集成多种BittWare的基于FPGA的板卡,同时可以通过板卡去配合戴尔、慧与等OEM供应商。adEednc

Achronix-14.jpgadEednc

本文为电子技术设计原创文章,未经授权禁止转载。请尊重知识产权,违者本司保留追究责任的权利。
赵明灿
赵明灿是EDN China的产业分析师/技术编辑。他在电子行业拥有10多年的从业经验。在加入ASPENCORE之前,他曾在电源和智能电表等领域担任过4年的工程师。
  • 微信扫一扫
    一键转发
  • 最前沿的电子设计资讯
    请关注“电子技术设计微信公众号”
  • 因眼睛小车主被辅助驾驶误判“开车睡觉”,小鹏、蔚来回 昨日,汽车博主@常岩CY 发博称自己突然上了热搜,原来就是因自己眼睛小被小鹏汽车自动驾驶误判“开车睡觉”,不住的发出提醒。此外,@常岩CY 称在多款车型上都收到此困扰。无论是红外还是摄像头,只要开始检测眼睛,就会判定过度疲劳。小鹏P7会提示他睡觉,蔚来ET7一开车就认为其疲劳和走神,岚图FREE会在冬天为了让其“别困”而打开冷风……
  • 国际象棋机器人Chessrobot夹断对手手指,意外还是设计缺 据悉,在7月19日的莫斯科国际象棋公开赛期间,一位7岁小男孩疑似因提前走子犯规手,意外被“对手”国际象棋机器人Chessrobot夹住手指,造成指骨骨折,该事件登上了热搜榜。该男孩是莫斯科9岁以下最强的30位棋手之一。
  • “智能家居”未来将可通过呼吸控制操作 凯斯西储大学的研究人员创造了一个简单的原型设备,使用户能够通过改变他们的呼吸模式来控制“智能家居”。这种自供电装置可放入鼻孔,并有可能提高行动不便或无法清晰说话的人的生活质量。如果个人呼吸困难,它也可以编程为医务人员提供自动警报。
  • 核酸采样机器人将取代“大白”?用了哪些技术保证采样准 取棉签、核酸采样、储存核酸采样管、设备消杀……动作精准流畅,今后给你核酸采样的可能不再是“大白”,而是机器人。EDN小编就带大家来看看,目前已被使用的核酸采样机器人有哪些?
  • 一个AI程序就可将手机电池增加30% 一项尖端的人工智能开发可以将智能手机的电池寿命延长 30%。这项应用则是利用 AI 分析正在使用的应用程序的 FPS 变化,并试图找到 CPU 和 GPU 处理器的最佳运行频率以适应变化,同时消耗设备中最少的功率和温度增益……
  • AI视觉芯片如何赋能两轮车出行? 6月29日,在由全球领先的专业电子机构媒体AspenCore和深圳市新一代信息通信产业集群联合主办的“2022国际AIoT生态发展大会-智慧两轮车分论坛”中,嘉楠科技副总裁汤炜伟以《勘智AI视觉芯,赋能智眼两轮行》为主题,向大家分享了嘉楠地芯片设计创新历程,及其RISCV架构AI芯片技术路线图,并以具体案例展示AI视觉芯片如何赋能两轮车出行。
  • 碎片化、成本高是难题,AIoT行业需要哪些改变? 作为AIoT的行业基石,物联网市场到2022年预计将达到 144 亿活跃连接。随着供应限制的缓解和增长的进一步加速,IoT Analytics 最新预测指出,到2025年全球将有大约 270 亿台联网物联网设备。中国物联网链接到2025年也将达到80亿。随着整个AIoT和IoT市场的快速成长与变化,我们将面临哪些风险和挑战?
  • 英特尔张宇:边缘AI有三个阶段,我们还处在山脚 在AspenCore举办的“2022国际AIoT生态发展大会”上,英特尔公司高级首席工程师、物联网事业部中国区首席技术官张宇博士通过视频方式分享了“边缘AI技术发展趋势与展望”主题演讲。
  • 世界上尺寸最大的芯片Wafer Scale Engine-2打破了在单 Cerebras公司售价数百万美元的“全球最大AI芯片”Wafer Scale Engine-2又有新消息,在基于单个Wafer Scale Engine-2芯片的CS-2系统上训练了世界上最大的拥有200亿参数的NLP(自然语言处理)人工智能模型。
  • 婴儿或可帮助解锁下一代人工智能 都柏林圣三一学院的神经科学家及其同事刚刚发布了改进人工智能的新指导原则,他们表示,婴儿可以帮助解锁下一代人工智能(AI)。
  • 日本要利用机器学习实现半导体研究自动化 新型薄半导体材料的开发需要对大量反射高能电子衍射(RHEED)数据进行定量分析,既耗时又需要专业知识。为了解决这个问题,东京理科大学的科学家们确定了可以帮助自动化 RHEED 数据分析的机器学习技术。他们的发现可以极大地加速半导体研究,并为更快、更节能的电子设备铺平道路。
  • 纯视觉自动驾驶更安全?美国交通部发布数据打脸特斯拉 特斯拉的纯视觉自动驾驶到底效果如何?真的如马斯克所说的:“通过摄像头和计算机网络让自动驾驶比人类驾驶更安全”吗?近日美国国家公路交通安全管理局发布了一份新的数据,颇有打脸特斯拉的意味。
广告
热门推荐
广告
广告
EE直播间
在线研讨会
广告
广告
面包芯语
广告
向右滑动:上一篇 向左滑动:下一篇 我知道了