广告

云服务器FPGA架构及其电源方案初探

2019-09-26 15:04:23 Cyntec 阅读:
随着时间的推移,FPGA 可重配置及可再程序设计的固有能力或许是其在快速发展领域中的最大优势。FPGA 可利用动态重配置,在不到一秒的时间内针对不同设计快速变化,从而可针对新的工作负载进行硬件优化。 因此,FPGA 能提供复杂多变超大规模应用所需的灵活性、应用广度和功能速度,这是 GPU 和定制 ASIC 无法实现的。

随着高性能计算和人工智能技术的快速发展以及大数据的爆发式增长,人工智能的算法设计理念发生了转变。人工建立算法的做法被计算机通过从大数据中自动学习的方法所取代,使得计算机视觉、语音识别、自然语言处理等关键领域都出现了重大突破。深度学习是这些领域中最常使用的技术,也被业界大为关注。然而,深度学习模型需要极为大量的数据和计算能力,只有更好的硬件加速条件,才能满足现有数据和模型规模继续扩大的需求。现有的解决方案使用图形处理单元(GPU),尽管 GPU 对深度学习算法而言在性能方面是一种更好的选择,但其功耗太高使得应用也受到很大限制。YeOednc

今天的 CPU 一直无法满足当前计算密集型应用(如机器学习、数据分析和视频处理等)的需求。加上网络与存储方面日益明显的瓶颈,云服务供货商转而采用加速器来提高其云数据中心的整体吞吐量和效率。YeOednc

亚马逊、微软和百度等大型云端服务供货商已宣布在其超大规模数据中心部署 FPGA 技术,推动其服务业务在竞争极为激烈的市场不断发展。FPGA 能与高度灵敏的云计算环境形成全面互补,因为它们不仅可程序设计性,而且还能针对任何新应用或新算法进行硬件优化。YeOednc

022ednc20190926YeOednc

图一 服务器部署 FPGA 的架构YeOednc

随着时间的推移,FPGA 可重配置及可再程序设计的固有能力或许是其在快速发展领域中的最大优势。FPGA 可利用动态重配置,在不到一秒的时间内针对不同设计快速变化,从而可针对新的工作负载进行硬件优化。 因此,FPGA 能提供复杂多变超大规模应用所需的灵活性、应用广度和功能速度,这是 GPU 和定制 ASIC 无法实现的。其实FPGA不仅在计算的加速具有良好效果,其也可以应用于数据中心存储和网络的加速,FPGA可为云服务计算、存储、网络带来综合的提升。YeOednc

FPGA作为一个加速卡,已经有几十年的历史。但是在数据中心应用有所不同,FPGA首先要提供云服务,能够满足大规模部署和运维的需求,满足云服务的特性,包括远程监控管理、在线动静态逻辑的重构,也需要支持各种虚拟机访问以及支持各种驱动兼容性,整个加速卡也需要有更高的RAS特性,这些在服务器里面,可能是比较通用的性质,但是先前的FPGA加速卡,并没有这类应用场景需求,也不具备这些特性,存在很大缺失。FPGA更重要的是一种FaaS(FPGA as a Service)服务,一种方案能够将软件、算法和硬件板卡集成,以软硬一体化的形式。FaaS围绕深度学习预测、视音频处理、基因测序、金融分析、IoT等热点行业提供了非常完备的解决方案。YeOednc

023ednc20190926YeOednc

图二 FaaS(FPGA as a Service)YeOednc

云端运算数字多台并联DC-DC电源模块,可应用之输入电压范围从8.0~15V,输出电压则为0.6~1.8V,IC操作频率为500KHz,搭载尺寸13.5x13.7mm,双组电感,感值为0.2uH电感,另为了满足数字化的需求及提供监控方法,我们采用I2C通讯协议作为客户取得模块内部信息,如下表。YeOednc

024ednc20190926YeOednc

表3 设计目标规格YeOednc

025ednc20190926YeOednc

1. 电路架构YeOednc

根据下图三为整合具备数字及并联能力的控制IC与高积体MOSFET及双线圈厄流器(Power Choke),透电路设计,计算出电感之感量需求,以及减少铜线线圈及磁性粉材量,进而开发出市面上大功率数字DC-DC 模块。图四为四组并联线路,依据单组模块进行并联使用,可在现有输出60A以下再增加输出电流至200A,采用PM-Bus Interface 控制方法,并且利用I2C传输接口控制各模块输出电压、侦测输出电流、温度以及控制每个模块电流均流。YeOednc

026ednc20190926YeOednc

图三、云端运算数字DC-DC电源模块(Block diagram)YeOednc

027ednc20190926YeOednc

图四 云端运算数字DC-DC电源模块并联模式(Block diagram)YeOednc

2. 电性特性比较YeOednc

根据计算结果与实测分析,我司生产制作大功率数字DC-DC 产品,其效率优于市面上产品,因为我们采用堆栈制程,将电感堆栈至模块上方,利用铜柱搭接,增加电流路径,降低损耗,并且选用高积体  MOSFET 减少开关切换的损耗,依据以上原因进而提高满载整体效率。YeOednc

028ednc20190926YeOednc

图五、模块效率量测YeOednc

3. 模块并联均流YeOednc

MSN12AD60-RUD 该模块具备自动均流的功能,并且此功能再多颗模块并联时,也能够及时运算并且调整各组模块的电流一致性,防止在并联时模块发生功率不一致。图量测模块电感电流YeOednc

029ednc20190926.jpgYeOednc

图六、模块输出电流均流YeOednc

030ednc20190926.jpgYeOednc

图七、动态模块输出电流均流YeOednc

4. PMBus通讯协议测试YeOednc

因我司研发的大功率数字模块,采用PMbus通讯协议并且利用I2C传输,可以藉由PC搭配GUI与DONGLE(图19) 进而对模块进行数据读取与控制输出电压,因此这边针对该功能进行测试。  YeOednc

 YeOednc

031ednc20190926.jpgYeOednc

图八、PMbus 系统架构YeOednc

032ednc20190926.pngYeOednc

图九、GUI实测状态YeOednc

Cyntec利用GUI该套软件,可以直接监控模块目前状况以及,错误讯息,上图可以发现监测部分输入电压、输出电压以及电流与温度,右侧可以显示目前模块的状态,是否有错误讯息。YeOednc

033ednc20190926.jpgYeOednc

图十、Labview 测试状态YeOednc

Cyntec利用Labview 撰写程序仿真MCU在工作的时候,送入PMbus 讯号,也是可以监控模块目前状态以及系统参数。YeOednc

 YeOednc

  • 对电源来说 的确是一个突破
  • 微信扫一扫
    一键转发
  • 最前沿的电子设计资讯
    请关注“电子技术设计微信公众号”
  • 高通发布4nm骁龙W5+骁龙W5芯片,专为可穿戴设计 据EDN电子技术设计报道,高通7月20日正式发布了全新4nm制程的骁龙可穿戴平台W5 Gen1和骁龙W5+ Gen。与两年前的上一代产品骁龙wear 4100相比,骁龙W5与W5+采用了全新的命名方式,整体功耗降低超50%。SoC工艺从12nm提升到4nm,协处理器使用22nm制程工艺。
  • 苹果新款Apple Watch Series 8新增内置传感器,可监测体 据最新报道称,由于新的内置传感器,即将推出的Apple Watch Series 8将能够告诉佩戴者是否体温高于正常水平。
  • 小米12s系列发布:首款徕卡品牌、1 英寸摄像头传感器、 继一加牵手哈苏(HASSELBLAD)以及 Vivo 牵手蔡司之后,小米和徕卡在今年早些时候也宣布建立合作伙伴关系。小米在六月底宣布,小米 12S 系列将成为该交易的第一批手机,就在昨日,小米举办了小米12S系列新品发布会,包括小米12S、小米12S Pro、小米12S Ultra三款手机,这三款手机均提供徕卡 Summicron 镜头以减少眩光并提高透光率,同时还提供徕卡成像配置文件。
  • 莱迪思半导体CEO Jim Anderson:“与优秀的人一起工作 我父亲一直是我的导师。他是一名高中理科老师,后来成了校长。在我的成长过程中,他一直都会给我我所需要的建议——并不总是我所想要的,而是我所需要的建议。他给我最好的建议是要我和我后来娶的那个女孩约会。我们结婚已经超过25年了。对于任何重大的个人决定,我仍然会征求他的意见。
  • 苹果最新芯片技术曝光:A16仍使用5nm,M2将升级为3nm 据EDN电子技术设计报道,日前Twitter 用户“ShrimpApplePro”爆料称苹果正在开发“最终”的 M1 芯片变体,它使用 A15 中更强大的内核。郭明錤今天在Twitter 上引用 ShrimpApplePro 的帖子,证实了有关 A16 和“M2”芯片的这些传闻。
  • 苹果iPhone 14的最新爆料:关于摄像头、处理器、基带、 选用的将是夏普和LG Innotek供应iPhone14的前置摄像头,也有其它渠道消息显示两家制造商的供应比例是相同的。
  • AMD 推出了基于其 Kria FPGA 模块的机器人入门套 AMD 推出了基于其 Kria FPGA 模块的机器人入门套件,售价 349 美元,交付周期为 20 周。这是 Kria 自适应系统模块(SOM)和开发套件组合的最新产品。
  • 赛灵思强劲的AI引擎能为AMD带来哪些新发展? AMD收购赛灵思的目的在于将其差异化IP集成到公司未来旗下的CPU中,Xilinx无论是从丰富的计算引擎还是其AI引擎技术都能让AMD在服务器CPU市场上扩大影响力
  • 为何10BASE-T1S是汽车通信中缺失的以太网链路 新的IEEE汽车以太网标准不断涌现,10BASE-T1S以太网是最新标准之一。本文讨论汽车行业的发展趋势,它们反映了汽车电子/电气(E/E)架构的变化,以及新10BASE-T1S标准如何支持和推动这种新架构的部署。
  • 工程师如何打造专属居家办公室? 2021年11月初,当我提笔写这篇文章时,掐指一算,自己在家工作的岁月将近25个年头了。诸如‘Zoom’等视频会议如今已是常态,说不定摄影机也都得处于常开状态。除了我那只丑陋的马克杯和自己单调的表达方式之外,接下来分享我所学到的:如何影音双管齐下地在在线展现自我……
  • 传感器技术在构建实时监控系统中的作用 无线传感器技术正在成为一个有前途的概念,这对每个虚拟市场都有重大影响。随着需要更快计算处理的数据密集型应用的数量增加,对实时监控系统的需求呈指数增长。尽管传感器节点的需求随着应用的规模而扩大,但终端设备却已通过对智能传感器的高效建模不断改进数据处理。
  • 售价超25万美元,苹果第一批Apple-1电脑主板长什么样? 一台罕见的苹果 Apple-1 电脑近日正在被拍卖,据外媒报道,目前这台电脑的出价已超过 25 万美元(约 167.25 万元人民币)。这台待售的 Apple-1 的注册号为 7,并带有乔布斯手写的序列号。
广告
热门推荐
广告
广告
EE直播间
在线研讨会
广告
广告
面包芯语
广告
向右滑动:上一篇 向左滑动:下一篇 我知道了