广告

Intel推全新系列FPGA Agilex:和Stratix 10大不同

2019-04-04 赵明灿 阅读:
我们正在从以电脑为中心的时代逐渐转向以数据为中心的时代。在这个背景下,Intel全新系列的FPGA Agilex应运而生。它不是Stratix的延续,而是一个全新的品牌。

现在,我们正在从以电脑为中心的时代逐渐转向以数据为中心的时代。到2020年,普通互联网用户产生的数据量为1.5GB/天,智慧医院为3TB/天,自动驾驶汽车为4TB/天,而连网飞机和智慧工厂则分别为40TB/天和1PB/天。我们有很多的数据需要处理;我们需要去理解它们,懂得它们,才能利用它们创造收入。FjDednc

同时,业界也涌现出了很多的新技术,例如人工智能/深入学习等。在各种技术快速发展的时候,我们需要有定制化的解决方案,来解决数据处理的难题。FjDednc

在这个背景下,Intel全新系列的FPGA Agilex应运而生。英特尔可编程解决方案事业部(PSG)的首席产品营销官Patrick Dorsey在产品发布会上向媒体朋友指出,它不是Stratix的延续,而是一个全新的品牌。(请看下文解读)FjDednc

webwxgetmsgimg (1).jpgFjDednc

英特尔可编程解决方案事业部(PSG)首席产品营销官Patrick DorseyFjDednc

FjDednc

三类应用及其关键词

Dorsey介绍说,我们可以把数据应用大概划分成三个类别:嵌入式/边缘、通信基础设施和云/企业。在嵌入式或边缘应用方面,我们面临的一个问题是,如何把各种海量数据(包括图片、视频、视觉等等)实时提取出来进行分析。FjDednc

在通信基础架构方面,所面临的问题是,以Rakuten(乐天)公司为例,它需要做负载平衡——需要对连到网络上的数据进行分析、处理,做跟网络相关的数据平衡工作。中国移动的做法则是把网络进行虚拟化,从而提高它的效率,使得数据处理、数据分析能够进行得更快、更有效。FjDednc

在云或数据中心方面,所有企业,不管它的数据中心是在云上,还是云下/自己公司的数据库,都要进行数据处理和数据分析。FjDednc

在这三个方面,嵌入式/边缘方面的关键词是实时,即针对当下发生的事件和相关的信息,进行实时的反应和分析处理。通信基础设施方面的关键词是带宽,即提供足够的带宽去进行更多的数据处理和分析。云/企业方面的重点是把数据拿过来,储存起来,对它们进行更快的分析。FjDednc

Agilex:全面借助于英特尔自己的能力

Dorsey谈到一个重点叫“全面借助于英特尔自己的能力“,它包括以下几个方面。首先,它用到的基础架构是英特尔自己开发出来的基础架构。第二,它采用的是英特尔自己的处理技术。第三,它采用了英特尔最新的Foveros 3D封装。第四,它里面的软件,不只是FPGA本身的软件,还有微处理器的软件,都是Intel自己的软件。FjDednc

Agilex的特点如下:FjDednc

1.采用10nm工艺。FjDednc

2.内存一致性。在协处理器之间有非常紧密的内存一致性。FjDednc

3.采用3D封装技术。可以把不同类型、不同半导体工艺节点的芯片封装到FPGA内部。FjDednc

4.可以根据客户的需求或市场的需求,把最合适的功能或小芯片(Chiplet)快速地封装进来,快速地给用户需要的产品。FjDednc

5.面向任何开发者——包括硬件和软件方面的开发者。FjDednc

intel-1.jpgFjDednc

FjDednc

Agilex适合做三类事

Agilex适合做三类事情:处理数据,存储数据,和传输数据。FjDednc

在数据处理方面,它采用了英特尔自己开发的HYPERFLEX架构,可提供如图所示的超高性能。FjDednc

在数据存储方面,它既包括传统的DDR5接口,也包括高带宽存储接口HBM。此外,它还使用了英特尔的Optane技术,可以在至强(Xeon)和处理器之间建立非常密切的内存一致性。FjDednc

在数据传输方面,它可以提供112G的数据传输速率。FjDednc

intel-2.jpgFjDednc

支持任意异构3D集成

它支持Any-to-Any(任意)异构3D集成。对于跟计算有关的接口、存储等等,在需要的时候就可以把它们集成到FPGA上去。这样,在需要进行数据处理、数据分析的时候,异构集成的方式就可以使速度提高很多,使开发成本降低,使得它更加敏捷、更加快速,也更加灵活。FjDednc

intel-3.jpgFjDednc

去年,英特尔收购了一家公司eASIC。这家公司一个很大的优势是,它能够非常快速地生产ASIC芯片。FjDednc

收购这家公司后,英特尔获得了一种可编程能力或者灵活性,不管是在工艺、性能还是成本方面,都可以按照客户的要求,非常快地进行模块定制化或者优化。FjDednc

适用于数据中心加速

Agilex还可以通过计算快速链接(CXL)在至强(Xeon)和FPGA之间建立连接。这样就无需在处理器和加速器之间进行反复复制。这也意味着它的总拥有成本(TCO)会更低,性能会更高。FjDednc

intel-4.jpgFjDednc

数据传输最关键的要求就是速度快。Agilex可以做到112G的速率,目前为止是行业第一。再加上PCIe GEN5,以及CXL(运行在PCIe GEN5上),就可以为高性能数据中心的数据负载进行更好的处理。因此,Agilex非常适合作人工智能的加速器。在这方面,谷歌的TPU里所采用的BFLOAT16新标准,Agilex也提供支持。FjDednc

intel-5.jpgFjDednc

开发者工具

在开发工具方面,除了面向硬件开发者的Quartus Prime以外,英特尔还推出了面向软件开发者的One API工具。FjDednc

Agilex的三个型号FjDednc

Agilex包括三个型号,如下。FjDednc

intel-6.jpgFjDednc

总结

总的来说,Agilex的独特性如下:FjDednc

英特尔Agilex家族完美地结合了基于英特尔10nm工艺技术构建的FPGA架构和创新型异构3D SiP技术,将模拟、内存、定制计算、定制I/O、英特尔eASIC和FPGA逻辑结构集成到一个芯片封装中。英特尔在从FPGA到结构化ASIC的迁移过程中,可提供带有可复用IP的定制逻辑连续统(custom logic continuum)。One API提供软件友好的异构编程环境,支持软件开发人员轻松利用FPGA的优势实现加速。FjDednc

intel-7.jpgFjDednc

本文为EDN电子技术设计 原创文章,禁止转载。请尊重知识产权,违者本司保留追究责任的权利。
赵明灿
赵明灿是EDN China的产业分析师/技术编辑。他在电子行业拥有10多年的从业经验。在加入ASPENCORE之前,他曾在电源和智能电表等领域担任过4年的工程师。
  • 微信扫一扫
    一键转发
  • 最前沿的电子设计资讯
    请关注“电子技术设计微信公众号”
  • Microchip模拟嵌入式SuperFlash技术助力存算一体创新 SuperFlash memBrain存储器解决方案使知存科技片上系统(SoC)能够满足最苛刻的神经处理成本、功耗和性能要求
  • 用TinyML开始设计——开发评估套件 本文中展示的开发套件和评估板得到一些流行的机器学习库和用于 TinyML 工作流程资源的支持,包括用于微控制器的 Google TensorFlow Lite 和 Edge Impulse,因而它们能够成为您第一个项目的理想起点。
  • “中国IC设计成就奖”提名产品简介:高性能GPU芯片及解 沐曦致力于提供国际顶尖的高性能通用GPU芯片及解决方案,结合我国人工智能等领域对GPU芯片的强烈市场需求,对标当前国际领先的GPU芯片产品立项开展技术研发。
  • “中国IC设计成就奖”提名产品简介:全志科技高性能智能 高性能三重异构智能语音应用处理器R329芯片,采用业界先进的半导体工艺,首款集成Arm中国周易语音处理器。集成DSP、NPU、64位CPU及丰富的外设接口,创新突破了低功耗、边缘语音AI超级算力、多重异构通讯、多核调度等关键技术,处于国内领先水平。
  • “中国IC设计成就奖”提名产品简介:追萤3D AI芯片Ai310 埃瓦科技自主研发的追萤 3D AI芯片创新的采用了异构架构 SOC 设计和微内核架构设计,包含 NPU 神经网络加速核、3D 立体匹配加速核、ISP 核等功能性处理核心;其中 NPU 神经网络加速核基于可重构以及片上多级存储和缓存设计,使数据可高效送达加速核心,使该芯片拥有领先的高效智能处理能力、分析以及低功耗管理的能力;其设计架构的资源复用性使硬件计算单位可灵活分配,适应于不同场景的计算需求;在 3D 视觉算法加速方面创新的采用了自研立体匹配算法的 3D 加速微内核架构设计,可有效加速双目立体视觉、结构光等多种 3D 视觉算法。
  • “中国IC设计成就奖”提名产品简介:ada200优势 1.九天睿芯,感存算一体芯片,可以在功耗和性能满足”低功耗AI场景“的同时,成本也大幅度下降。2.采用模数混合的存内计算架构,ADA200相比传统数字芯片,1/3成本,1/10功耗。
  • “中国IC设计成就奖”提名产品简介:面向边缘视觉分析的 面向边缘视觉分析的数据流AI芯片CAISA是鲲云科技自主研发的专为人工智能图像提供高性能计算加速的AI芯片产品,是全球首个量产的数据流AI芯片。
  • “中国IC设计成就奖”提名产品简介:人工智能语音芯片CI 1、人工神经网络硬件引擎架构:具备高计算性能,进行神经网络计算时相当于数十个CPU并行计算的能力;低访问带宽和低功耗,通过并行计算和共用神经元权重参数,大幅降低访问带宽及功耗;高可配置性,支持神经元层数和节点数、神经网络结构的配置。 2、单、双、及麦克风阵列降噪增强技术:支持各种平稳、非平稳环境噪声抑制;可支持线阵、圆阵结构等常用麦阵结构;采用定向波束形成与自适应信号处理技术相结合;拾取方向动态可调;支持单声道、立体声等回声抑制;采用独立研发的空间预测技术,支持强回声情况下回声抑制;与降噪处理技术相结合;自动增益调节、高通、带通滤波等。 3、低功耗和可靠性设计技术:具备低功耗集成电路设计技术,包括基于活动语音检测的低功耗控制技术和时钟门控技术。 4、逻辑设计技术:掌握了语音信号处理IP的设计方法,包括算法硬件化、定点、浮点运算处理等。同时积累了整套SoC设计所需的控制类IP,并成功通过流片验证。
  • “中国IC设计成就奖”提名产品简介:智能安防AI SoC芯片 亿智SV826是2021年推出的高性能的安防AI SoC芯片,主要面向视频编解码AI摄像机产品。
  • “中国IC设计成就奖”提名产品简介:高性能大算力全场景 - AI性能跑分更强,超越Nvidia Orin - 应用当前先进的安全技术和研发流程 - 国内唯一可获得、支持快速量产的整车智能计算平台芯片
  • “中国IC设计成就奖”提名产品简介:玉龙人工智能芯片Yu 玉龙(YULONG)是欧比特公司推出的新一代嵌入式人工智能系列处理器芯片,是目前市面上唯一的军用级人工智能芯片,并且实现了自主可控国产化生产。芯片聚焦于前端图像处理、前端信号处理和智能控制,芯片具有深度学习、神经网络算法的平台加速能力。Yulong810APro芯片为异构多核架构(CPU+AI加速器),采用FD-SOI生产工艺,具有高性能、高可靠、低功耗的特点,芯片面向航空航天、智能安防、机器人、AIoT、智能制造、智慧交通等应用场景。
  • “中国IC设计成就奖”提名产品简介:智能图像芯片TX510 TX510是一款面向IoT设备的超低功耗视觉处理芯片,以可重构架构,实现高性能计算,低功率消耗的超强能效比,峰值算力达2TOPS。芯片支持AlexNet、GoogleNet、ResNet、VGG、Faster-RCNN、Yolo、SSD、FCN和SegNet等主流神经网络;内置3D引擎,可实现人脸识别、物体识别、手势识别、目标跟踪等功能,可应用于智能安防监控、智能家居、新零售等领域。
广告
热门推荐
广告
广告
EE直播间
在线研讨会
广告
广告
面包芯语
广告
向右滑动:上一篇 向左滑动:下一篇 我知道了