耗时三年打造，融合ASIC的全新FPGA如何做到比对手快10倍？-EDN 电子技术设计

 这款新产品他们在三年前就开始规划，过程中，Achronix工程团队重新构想了整个FPGA架构，要平衡片上处理、互连和外部输入输出接口（I/O），以实现数据密集型应用吞吐量的最大化，应用场景包括高性能AI/ML应用、数据中心的边缘计算、网络处理、5G网络处理、存储、IP授权技术。

随着人工智能、机器学习等应用场景快速发展演进，对芯片的算力、安全性等性能也提出了更高的诉求。59Kednc

据市场调研公司Semico Research数据显示，2018年FPGA市值约为10亿美元，在未来4年内，人工智能应用中FPGA的市场规模将增长3倍，达到52亿美元。59Kednc

015ednc20190530 59Kednc

Achronix Semiconductor总裁兼首席执行官Robert Blake表示：“目前人工智能、机器学习等应用场景的FPGA市场约为25%，预计两年后将达到72%。如此庞大的市场空间，则需要性能更高、更加灵活的AI算法解决方案。”59Kednc

为满足人工智能/机器学习（AI/ML）和高带宽数据加速应用日益增长的需求。5月21日，Achronix在深圳召开媒体交流会，宣布推出采用了TSMC的7nm FinFET工艺制造的，具有创新性的、全新FPGA系列产品Speedster®7t系列。59Kednc

据Achronix总裁兼首席执行官Robert Blake介绍，Speedster7t系列基于一种高度优化的全新架构，从而获得有类似ASIC一样的性能、可简化设计的FPGA灵活性和增强功能，会远高于传统的FPGA解决方案。59Kednc

023ednc20190530 59Kednc

Achronix总裁兼首席执行官Robert Blake59Kednc

FPGA技术与ASIC核心效率的融合

Robert Blake表示Speedster7t是Achronix历史上最令人激动的发布，代表了建立在四个架构代系的硬件和软件开发基础上的创新和积淀，以及与我们领先客户之间的密切合作。59Kednc

016ednc20190530 59Kednc

Speedster 7t是灵活的FPGA技术与ASIC核心效率的融合，提供了一个全新的“FPGA+”芯片品类，可将高性能技术的极限大大提升。Robert指出，这款新产品他们在三年前就开始规划，过程中，Achronix工程团队重新构想了整个FPGA架构，要平衡片上处理、互连和外部输入输出接口（I/O），以实现数据密集型应用吞吐量的最大化，应用场景包括高性能AI/ML应用、数据中心的边缘计算、网络处理、5G网络处理、存储、IP授权技术。59Kednc

此外，Achronix在SpeedcoreeFPGA IP中采用了与Speedster7t FPGA中使用的同一种技术，可支持从Speedster7t FPGA到ASIC的无缝转换。FPGA应用通常具有必须保持可编程性的功能，而其他固定功能则是专用于特定的系统应用。对于ASIC的转换而言，固定功能可以被固化进ASIC结构中，从而减小芯片面积、成本和功耗。当使用SpeedcoreeFPGA IP将Speedster7t FPGA转换为ASIC时，客户有望节省高达50％的功耗并降低90％的成本。59Kednc

全新机器学习处理器（MLP）

传统的基于DSP的FPGA计算单元是针对无线滤波等复杂应用而设计的，其DSP、LUTs、存储单元是分立的，需要高精度和浮点数字格式，布线也限制了其性能，在处理AI/ML应用时不仅不能高效地支持AI模型的不同数值精度，还要消耗额外逻辑的存储资源，难以达到AI算法的要求。59Kednc

017ednc20190530 59Kednc

Speedster7t FPGA是在传统的架构上进行改进，设计出了MLP单元，采用阵列式乘累积计算架构，每个乘累加单元（MAC）支持最多32个乘法器，实现计算的可配置。同时，MLP单元集成同时支持浮点MAC和整数MAC，包括对TensorFlow的16位格式的支持，以及可使每个MLP的计算引擎加倍的增压块浮点格式的直接支持。59Kednc

此外，MLP与嵌入式存储器模块紧密相邻，通过消除传统设计中与FPGA布线相关的延迟，来确保以750MHz的最高性能将数据传送到MLP。59Kednc

据Robert Blake介绍，MLP的效率比传统FPGA的性能提升了5倍，使这款FPGA能以每秒万亿次运算数量为单位（TOPS）。算法在不断的改变，但底层的需求都是一样的，他们希望建立一个很好的硬件底层，让算法无论怎么改变，需求都可以被满足。59Kednc

GDDR6控制器：高速存储带宽和接口

决定AI处理器最终性能的除了高性能计算和机器学习系统之外，还对数据的存储及传输有着极高的要求。59Kednc

据了解，目前的高速储存标准有HBM和GDDR6，Speedster7t器件采用的是GDDR6存储器，能够以HBM一半的成本提供与HBM等效的存储带宽，并且最多可以支持8个GDDR6控制器，每个GDDR6控制器可以支持512Gbps带宽，8个GDDR6的总带宽高达4Tbps。59Kednc

018ednc20190530 59Kednc

除了这种非凡的存储带宽，Speedster7t器件还包括业界最高性能的接口端口，以支持极高带宽的数据流。Speedster7t器件拥有多达72个业界最高性能的SerDes，可以达到1到112 Gbps的速度。59Kednc

019ednc20190530 59Kednc

还带有前向纠错（FEC）的硬件400G以太网MAC，支持4x 100G和8x 50G的配置，每个控制器有8个或16个通道的硬件PCI Express Gen5控制器。为了应对400G以太网数据的处理需求，Achronix采用的是将数据进行分割并行处理的方法。59Kednc

二维片上网络（NoC）实现超高效率的数据移动

来自Speedster7t高速I / O和存储器端口的数万兆比特数据很容易淹没传统FPGA面向比特位的可编程互连逻辑阵列的路由容量。与Achronix年初发布的Speedcore 7t所采用的bus走线相比，Speedster7t采用的二维片上网络（NoC）可谓是这款新产品架构的另一大关键创新，它可横跨和垂直跨越FPGA逻辑阵列，连接到所有FPGA的高速数据和存储器接口。59Kednc

020ednc20190530 59Kednc

Robert Blake将其形象地比喻为“叠加在FPGA互连这个城市街道系统上的空中高速公路网络”，极大地简化了高速数据移动，并确保数据流可以轻松地定向到整个FPGA结构中的任何自定义处理引擎。59Kednc

021ednc20190530 59Kednc

NoC中的每一行或每一列都可作为两个256位实现，单向的、行业标准的AXI通道，工作频率为2Ghz，同时可为每个方向提供512 Gbps的数据流量。最重要的是，NOC消除了传统FPGA使用可编程路由和逻辑查找表资源在整个FPGA中移动数据流中出现的拥塞和性能瓶颈。不仅可以提高Speedster7t FPGA的总带宽容量，还可以在降低功耗的同时提高有效LUT容量。59Kednc

Robert Blake表示：NoC可能比竞争对手的速度快10倍。59Kednc

底层软件对硬件的重要性

Robert Blake在会上强调，底层的软件非常重要，如果NOC软件做不好，就很难实现真正的提升。59Kednc

据Robert透露，Achronix在软件和硬件方面的投资相当，并且在公司创立的时候很大的优势就是软件技术，这也是他们今天能做到高端配置的的重要原因。59Kednc

022ednc20190530 59Kednc

Achronix专门推出了配套的ACE软件设计工具，该软件与业界标准的逻辑综合工具配合使用，支持FPGA设计人员便捷地将其设计映射到Speedster7t FPGA、Speedcore eFPGA和Speedchip FPGA chiplets产品中，该ACE软件设计工具可直接获得。59Kednc

小结：未来AI芯片将如何演进？

对比GPU、FPGA和ASIC的特点我们发现，FPGA相对于CPU与GPU有明显的性能或者能耗优势，但对使用者要求高；ASIC可以更有针对性地进行硬件层次的优化，从而获得更好的性能、功耗比，但弊端在于ASIC芯片的设计和制造需要大量的资金、较长的研发周期和工程周期，而且深度学习算法仍在快速发展，若深度学习算法发生大的变化，FPGA能很快改变架构，适应最新的变化，ASIC类芯片一旦定制则难于进行修改。59Kednc

Robert表示，CPU、GPU、FPGA、ASIC每一类芯片都有其技术长处，并且AI芯片的市场在增长，所有的芯片类型都会从中受益。59Kednc

而随着AI的发展，芯片发生了一些变化，ASIC也需要一些可编程的能力，而我们现在也在FPGA当中增加了ASIC的属性，因此未来FPGA和ASIC都可能不再是传统定义。59Kednc

59Kednc

阅读全文，请先

夏菲

Aspencore助理产业分析师，专注行业市场前沿及技术发展趋势。

进入专栏

上一篇： 中国的WAPI更安全，但为何却“打不赢”美国的Wi-Fi？ 下一篇： 细数工业自动化和机器人技术的创新

微信扫一扫
一键转发
最前沿的电子设计资讯
请关注“电子技术设计微信公众号”

2025松山湖中国IC创新高峰论坛：继续聊聊机器人去年的主题是智慧机器人，今年的主题仍然聚焦于机器人身上，不过变为了具身智慧机器人……
鹏瞰TS-PON Gen2芯片，用光协议重塑机器人“神经网络” TS-PON Gen2芯片是一款灵活的软件定义 SoC，适用于多种场景。它基于无源光网（PON）技术，具备高带宽（目前10G，未来可拓展至25G、50G）、低时延（微秒级）、高确定性等特性···
让人形机器人“耳聪目明”，昆泰芯KTM5900磁性编码器解编码器芯片作为机器人的核心传感器之一，对于提升机器人的感知能力、安全性和生产效率具有重要意义···
如何让具身机器人“看”得清？思特威给出了这个答案相比于滚动快门传感器，全局快门传感器能够同时曝光整个画面，有效避免了运动过程中产生的图像形变，为机器视觉提供高精度、无畸变的图像···
极海推出全球首款双核Cortex-M52实时控制MCU/DSP 随着机器人技术的不断发展，其应用领域从传统的工业制造逐步拓展至医疗、农业等多个新兴领域，这对机器人的控制系统提出了更高的要求，当前机器人控制系统当前主要面临高爆发、高动态、高精度和高安全这四方面的挑战···
比人类更灵活？先楫HPM6E8Y机器人关节控制解决方案 HPM6E8Y通过硬件加速器将电机控制算法执行时间缩短至2.8μs，以全链路高实时通信与多轴协同能力，开启机器人关节“芯”时代。
为旌科技感算控一体化芯片落地，带来6倍效率提升？具身智能的本质是‘大脑（认知）+小脑（控制）+感官（感知）’的协同进化，需要芯片层面实现三者深度融合。
爱芯元智发布AX8850：让AI算力更便宜，让智能更可及爱芯元智希望把算力做得更加便宜具智价比，普惠AI，让我们的边缘智能更加触手可及···
万有引力EB100芯片亮相，空间计算走向低功耗新时代？ EB100芯片将为XR和机器人行业带来更好、更低功耗的空间计算和显示能力，开启空间计算时代的无限可能···
芯驰D9 Max：为具身智能而生的高性能SoC，一颗芯片顶五颗我们希望以1个芯片完成5个芯片完成的事情。当应用发生爆炸性的变化，融合一定是一个非常大的趋势，而且融合的过程会使软件的开发更简单，系统的开发更简单，成本控制得更好···
情境感知AI：利用FPGA技术增强边缘智能现场可编程门阵列（FPGA）的灵活性、现场升级能力和互操作性，结合其低功耗、低延迟和并行处理能力，使其成为开发者克服挑战并优化情境边缘AI应用的关键工具。
ADAS 系统中的传感器创新如何在道路交通中挽救生命在本文中，我们将探讨 ADAS 在提高道路安全方面的作用，以及各种对实现这一目标至关重要的传感器技术。

25年第19周新能源周销量：不同价格带的车型走势解析本周插混与增程车型市场呈现出“两极化”趋势：一方面，10-15万元级的主流家用轿车与SUV销量强劲；另一方面，20万元
拆解报告：甲骨文3060W碳化硅服务器电源模块甲骨文服务器电源模块输入输出均为专用接口，采用热拔插设计。电源模块支持200-277V交流和240-380V直流输入，输
评测：森海塞尔ACCENTUM Open真无线耳机半入耳机森海塞尔ACCENTUM Open 真无线耳机采用半入耳式设计，搭配约4.4克的重量，佩戴舒适。耳机充电盒轻盈小巧，携带外
人形机器人如何做到“手眼”协同+“大小脑”协同？人形机器人正站在“走出实验室”的临界点。从本体制造、控制系统、核心零部件到应用场景拓展，技术与产业生态
南非2025年4月：奇瑞和长城汽车快速上升 2025年4月的南非车市增长，马恒达和现代的强劲回归是一个信号，而中国品牌的集体崛起，则预示着未来竞争将更加多
4月新能源车领跑汽车出口增长，中国汽车走向全球的新引擎 2025年开年以来的出口数据呈现出清晰的结构升级路径。新能源产品在出口中扮演的角色日益重要，不再只是锦上添
拆解报告：vivo手机原装90W氮化镓闪充充电器 vivo 90W氮化镓闪充充电器采用经典直板造型设计，同时附带一条专门量身定制的8.5A大电流数据线，配合信号屏蔽层
拆解报告：HONOR荣耀手环10 荣耀手环10在外观方面，延续了上代的轻薄双曲面设计，同时采用全新的双色NCVM镀膜工艺，使之更加的时尚精致。标配
2025年4月中国车企加速渗透土耳其市场：比亚迪Seal U打响突围战 2025年4月，土耳其市场的爆发式增长为全球车企提供了重要信号：新兴市场正在进入电动化转型的加速期，而土耳其作
2025年第19周新能源周销量：问界起势 2025年第19周，中国乘用车市场的周度销量达到44.4万辆，其中新能源车占比突破50%，达22.3万辆，占比50.2%。比亚迪体
2024年4月汽车市场终端数据：自主崛起、新势力分化、合资承压从整体销量数据来看，4 月汽车终端销量达 169.7 万，同比增长 9.3% ，在目前的价格力度下，这个销售数字差强人意。2
拆解报告：华为750W钛金牌服务器电源华为这款服务器电源型号为PAC750S12-TE，支持220V交流或240V直流输入，输出电压为12V，输出电流为62.5A，输出端设有

史密斯英特康推出新一代“ DaVinci Gen V”测试插座史密斯英特康推出新一代“ DaVinci Gen V”测试插座，为人工智能、6G通信及先进计算应用领域的芯片提供超
意法半导体高集成度低边电流测量放大器简化高准确度电流检测意法半导体的 TSC1801低边电流测量放大器集成了设定增益所需的匹配电阻，从而简化了电路设计，节省了物料清单
意法半导体推出创新的、带有可改变存储配置存储器的车规微控制器新推出的Stellar微控制器内置了xMemory技术，它为正在发展的软件定义汽车以及不断进化的电动汽车架构提供了一
新系列串口EEPROM内置唯一ID码，适合设备识别、溯源和可持续性应用意法半导体 (ST) 推出了一系列内置128位唯一只读ID码 (UID) 的串口EEPROM芯片，以满足市场对产品识别、溯
Vishay新添增强短瞬态脉冲防护性能的经AEC-Q200认证的厚膜功率电这些器件采用夹片式TO-247 封装形式，可直接安装在散热器上，具有高达 75 J/0.1 s的高脉冲吸收能力和 150
凉棚集成Nordic 技术实现Matter over Thread连接为家庭和企业 StruXure+ 凉棚和小屋系列集成 Nordic 的 nRF5340 SoC以提供无缝的 Matter over Thread 连接
智能楼宇技术全球领导者与Nordic Semiconductor携手合作确保楼业界连手推动NR+成为智能楼宇的全球连接标准···
Cadence 率先推出 eUSB2V2 IP 解决方案，助力打造高速连接新范 Cadence 在业内率先推出 eUSB2V2 IP，此 IP 基于先进的台积公司 N3P 工艺，符合最新的嵌入式 USB2 版
纳芯微发布双通道电流检测放大器NSCSA285，赋能工业与能源管理近日，上海 —— 纳芯微电子（简称“纳芯微”）发布全新高精度双通道电流检测放大器NSCSA285系列···
攻克PWM高频瞬态干扰难题！纳芯微发布车规级电流检测放大器NSCSA24 近日，纳芯微发布全新车规级双向电流检测放大器NSCSA240-Q1系列，专为汽车高压PWM系统打造解决方案···
TE Connectivity 推出INMORO系列：致力于满足中国市场需求而打造的连接和传感解决方案提供商泰科电子（TE Connectivity，以下简称 TE）工业事业部隆重推出INMORO 系列，致力于满足中
破解汽车与工业等应用新挑战，TDK展示多传感器融合与AI+发展趋势在新能源汽车应用中，热管理系统既要能高效地冷却和加热电池、电机与OBC等车辆核心部件，确保其处于最佳运行温

热门评论
最新评论

换一换

杂志声明

耗时三年打造，融合ASIC的全新FPGA如何做到比对手快10倍？