广告

后SoC时代或将迎来Chiplet拐点

2020-03-10 痴笑 阅读:
后SoC时代或将迎来Chiplet拐点
这里先把结论罗列出来(1)Chiplet拐点将带领集成电路生态将迈入“打土豪分田地"的新时期;(2)Chiplet拐点面前,新形态体系结构形态的将提倡富含想象力的小而美,并且“去中心化”;(3)Chiplet拐点将诞生一类新型态的富含模拟电路芯片——有源基板,它将终结低电压低增益低匹配的先进工艺模拟设计困局。

ISSCC 2020 顶着新冠疫情,于2月16日开始在旧金山地下室继续召开。开会的结果就是会议结束后,旧金山市宣布进入面的疫情紧急状态。虽然今年没有去开成会,但是不影响小编的撸文章/Slides进程。许多公众号都已经把今年ISSCC的核心焦点放在Chiplet——这个说新不新,却再次绽放光芒的设计方法——上。小编也在此分享个人关于Chiplet对于集成电路生态、体系结构、模拟电路影响的一些思考。KjUednc

导读一:虽然本文有着科普的初心,但是为了节约篇幅,对于Chiplet一些基础知识大家可参考黄老师的《ISSCC 2020看Chiplet研究现状》,我们的《ISSCC 2020 观感:高级封装正在成为潮流》,以及唐博士的《从AI Chip到AI Chiplet》,本文不赘述技术细节。KjUednc

导读二:本文的观点可能比较科幻,纯属个人臆测,大家自行决定是否相信,这里先把结论罗列出来(1)Chiplet拐点将带领集成电路生态将迈入“打土豪分田地"的新时期;(2)Chiplet拐点面前,新形态体系结构形态的将提倡富含想象力的小而美,并且“去中心化”;(3)Chiplet拐点将诞生一类新型态的富含模拟电路芯片——有源基板,它将终结低电压低增益低匹配的先进工艺模拟设计困局。KjUednc

打土豪,分田地

如果用一个字来概来涵盖单芯片片上系统(Monolithic SoC)方案与芯粒(Chiplet)方案,我会选天朝人民最耳熟能详的“拆”字。简而言之,就是把原来一块大的单芯片,拆分为多个小芯片的组和,然后通过高级封装重组。以前我们也把这样的模式称为System-in-Package,2.5D/3D封装。2015年,Marvell的老板还把这样的模式称为芯片界的乐高——抹茶计划(Mochi)。KjUednc

KjUednc

但是SiP早期只是满足不同工艺间芯片的链接,比如CPU/GPU和DRAM的异构集成。所以当时Chiplet被提出以后,也就是少数几个学有余力的学霸间的花式表演。SoC在过去的很长一段时间,仍然是主流,Chiplet拐点从未真正到来。KjUednc

然而,世界发展地太快。AI来了,贪欲来了,土豪炫富心态也来了。Monolithic SoC芯片在过去几年进入了“贫穷限制了想象力”的新境界——KjUednc

首先推波助澜的英伟达黄教主,收到人工智能的助力,英伟达的旗舰GPU从100mm2,开始指数级发展。去年发布的Volta架构核弹级GPU——GV100的面积率先突破800mm2大关,据说今年即将推出的Ampere系列新核弹级GPU将在7nm工艺达到826mm2 【瑟瑟发抖地 】。KjUednc

KjUednc

然后就是那些不要face的初创小妮子们,为了造一个个大新闻,变得毫无”节止“(此处不带贬义)—— 其中最有名的当推硅谷初创 Cerebras Systems的AI芯片,面积达到了令人发指的46,225mm2,(你没有看错,那是逗号!)片上SRAM达到18GB 【我只能说你咋不上天呢?】:KjUednc

KjUednc

如此大面积的芯片,有良率么,有意义么?下图统计了良率与面积大小的关系,对于小于10mm2的芯片而言,monolithic方案和chiplet方案的良率差别很小,但是一旦芯片面积超过200mm2,monolithic方案的良率会比chiplet方案低超过20%。可以预期,在700-800mm2的面积上,monolithic方案的良率很可能不超过10%。KjUednc

KjUednc

由此,对于要商业化卖钱的芯片而言成本问题就活生生地体现了。假设研发费用是相同的,那么可以分摊研发一次性费用NRE的芯片数量,chiplet会比monolithic高3-4倍。如果忽略制造成本,但chiplet方案的成本价将远远低于monolithic方案。KjUednc

AMD公司在ISSCC2020年上就以其多核架构为例子,对比了AMD服务器级别设计中,采用chiplet方案和monolithicSoC方案的成本,可见芯片越大monlithic方案和的成本比在chiplet高的越多,并且能保持在一倍以上。KjUednc

KjUednc

诚然,土豪们与新贵们依旧可以炫富。但是chiplet却是高性能芯片(组)打开市场化,完成生态的最有效捷径。KjUednc

正所谓,他强由他强,清风拂山岗;他横由他横,明月照大江;他自狠来他自恶,我自一口真气足。“小而美”的专用芯片们,只要能搭上chiplet高速列车,终究笑到最后才是王道。KjUednc

去中心化的新架构形态

故事讲到这里,看官们你或许会问,chiplet是不是只会给庞然大物带来冲击?小打小闹的呢?我在过去的很长一段时间,也简单的认为,chiplet是是巨头们的乐高玩具,学术界的玩家既玩不起,也没啥必要玩。KjUednc

直到今年的ISSCC,当头一棒点醒了我。KjUednc

还用乐高做例子。乐高除了有图纸按图索骥的标准玩法,还有给出元模块自定义乐高的高级版——Lego MOC (My Own Creations),每年乐高官方都会有Lego MOC的最佳评比。小编某天还在B站抖音刷到过一个用乐高做的洗丑袜子专用迷你洗衣机。KjUednc

即便如此,乐高迷们仍然不足以满足MoC的需求,此时,3D打印的普及进一步冲击了乐高的世界——用户可以自定义元积木的任何形状,然后打印出来,以填补官方元间库的不足。好事者还用Lego MOC自己打造打一个3D打印机的教程。于是,乐高的世界打开了新维度的新大门~KjUednc

KjUednc

当3D打印遇上乐高MOCKjUednc

搭乐高当然有不同的搭法,搭chiplet也一样。常规方法就是按照目前高性能计算体系结构的研究成果,按图索骥搭出如下类SoC的标准化结构,以主控/多核CPU为核心+并行计算协处理器(GPU,AI芯片)+ 堆叠的Memory+IO是常规操作。(下图来自ISSCC 2020 法国CEA的chiplet paper)KjUednc

KjUednc

与常规操作相对应的,就是非主流杀马特了。Chiplet的发展会催生非常多目前不存在的芯片形态,或者大大简化某些形态的芯片进入主流平台的过程。KjUednc

在这个过程中,“去中心化”或将成为一个重要的特点。KjUednc

先来看AMD的Server级处理器Chiplet方案——二代EPYC。(这家伙在7nm工艺下耗电280W,据前方记者报道,该芯片在ISSCC现场demo用液氮冷却云山雾罩,远观还以为是炊烟袅袅)KjUednc

KjUednc

AMD的Chiplet方案方案,由其Ryzen系列芯片演化而来。然而,在逐渐演化的过程中,系统的核心从CCX高性能计算核,逐步变成了一颗一存储和互联为主的IOD核。而且AMD还给IOD的互联拓扑结构,起了一个“复仇者联盟”式的名字——无限结构,infinity fabric。KjUednc

KjUednc

而原本在系统中起着关键作用的处理器核心,变成了一个可以被scaling的元素:2/4/6/8,任意数量的核心方案都可以定制,要多少买多少,经济实惠。KjUednc

KjUednc

Chiplet的这种新型配置带来的主客异位的变化是否会引发体系结构的新一轮讨论?这种新形态下的互联方式和存储模式,还有没有必要遵从目前主流的片上网络/总线的模式?毕竟从物理学上,其电路的拓扑结构已经不一样了。他也应该不同于现在繁琐的PCIe等一链接版上原件为主的桥连接方法,毕竟还是够近,通信间即便需要一些协议,也应该是简单的。KjUednc

法国CEA在ISSCC 2020提出了他们的建议:采用如下的全数字,全摆幅,极简的准同步握手机制,完成chiplet间通信。chiplet间通信的延时采用延时补偿的机制,相比于片内SoC的延迟,只提高了1到3倍,根据距离长短,完全可估计。相比于目前的LPDDR之类的协议,无论在电路复杂度还是能效上都有显著提高。KjUednc

KjUednc

在这种特征下,“去中心”化的设计理念是保障芯片组间可以静态重构的重要前提。毕竟很可能Chiplet的主体再也不是拥有译码能力的处理器核心,而是一个并没有多少处理能力的片上网络。与此同时,每一个Chiplet的键位上可以放芯片类型也将更加不拘一格。除了今年ISSCC提到的微处理器,还可以是如今火爆的存算一体芯片,领域专用芯片,非典型CMOS工艺(ReRAM / MEMS / TFET / ...)的IoT芯片等等,以及更多发挥想象力的新型芯片。只要你流的起片,去他的超大规模SoC设计验证,小而美的百花齐放才是春天。KjUednc

总之一句,Chiplet拐点到来后,玩家绝不仅是土豪,去中心化发展会让土豪们面临各种“特洛伊”陷阱。KjUednc

模拟电路能摆脱scaling down噩梦了?

不同于AMD,Intel和CEA设计chiplet方案时,还推出了一种全新功能定义的电路来实现chiplet——active interposer,有源基板。KjUednc

早期的Chiplet基板,实现的功能完成芯片间的互联和芯片pin脚到封装pin脚的扇出功能,取代wire bond方案里面长长引线的寄生效应,可以简单的理解为是密度更高、体积更小的PCB版,也被称为无源基板, passive interposer。KjUednc

KjUednc

但是,今年ISSCC上法国CEA提出的有源基板却令人眼前一亮:KjUednc

KjUednc

有源基板讲白了就是一颗工艺节点大、面积大、能做底盘的新型芯片,由于是完整的芯片,设计师可以自定义这颗芯片的方案。KjUednc

在CEA的方案中,不仅可以用于链接,同时通过实现路由功能(router)在基板上完成类片上网络的互联。更惊艳的是,他在基板上实现了基于开关电容的稳压电源。由于基板工艺的节点比高性能计算的节点大很多、成本低很多,所以,用基板工艺做一些用能量存储的大容量片上电容一点都不心疼。这时候也完全不用担心先进工艺下各种开关的各种非理想(漏电/浅沟槽阈值调制)等非理想效应。KjUednc

KjUednc

过去十年,模拟电路工程师们被摩尔定律逼的要多惨有多惨。Scaling下先进工艺那低于1V的电源电压,(却没有scaling热噪声的幅度,SNR又不允许下降);越来越低的输出阻抗,导致放大器的增益难以为继;甚至是40nm后开始的不可理喻的版图匹配要求,还有FinFET开始的栅极电阻……种种麻烦都在把基于运算放大器的传统模拟电路往绝路上逼。模拟工程师们只能调转枪头往Digital PLL / Digial LDO / SAR ADC / Digital PA等不少基于数字电路的模拟设计上走,可总有些电路是要靠放大器的。KjUednc

然而chiplet却给了让这一困局新的思路——把适合大工艺节点的模拟电路放在有源基板上。同时,还包括那些占面积超大的无源器件,这个方法同时还能将最大程度地提高先进工艺的利用效率,把昂贵的工艺花在刀刃上。让做放大器的模拟工程师远离先进工艺的噩梦,回到亚微米时代自由发挥的黄金岁月。KjUednc

下图是Intel在今年ISSCC 2020的Chiplet 产品——lakefield的Foveros 3D封装平台里提到的如何布局计算芯片(Compute Die)和基板芯片(Base Die)的策略。高压(比如高压串行接口USB/LVDS,用于同步的晶振)、无源、电源管理、以及对Scaling Down不敏感的模拟电路,还有各类经典(温度等)传感器统统可放在基板大节点工艺上。KjUednc

KjUednc

顺带提一句,当在选择不同节点的基板时,还能发挥初异构的功耗优势。比如Intel在选择基板上用了超低漏电的节点(22FFL),然后将standby的相关电路集成到大基板上去,进一步优化stand功耗。这是传统SoC不具有的选项。KjUednc

KjUednc

chiplet拐点也让模拟工程师可以喘口气,不再被scaling down追着打了。KjUednc

(本文授权转载自公众号矽说,作者:痴笑,版权归作者所有,转载请联系矽说;责编:Demi Xia)KjUednc

本文为EDN电子技术设计 原创文章,禁止转载。请尊重知识产权,违者本司保留追究责任的权利。
  • 微信扫一扫
    一键转发
  • 最前沿的电子设计资讯
    请关注“电子技术设计微信公众号”
  • 安卓旗舰标配的屏下指纹,或将登上苹果iPhone 13 屏下指纹在安卓旗舰手机中早就普及,小米、OV、三星,以及华为等都配置了屏下指纹。可是,在屏下指纹领域,苹果一直没有动静,不过,最近有爆料称下一版本iPhone 13或将同时配备屏下指纹和Face ID传感器。
  • 英国暴风雪第六代战斗机将采用人工智能、大数据全新雷 越来越多的军用产品逐渐采用目前最先进的科技,譬如AI人工智能、大数据分析,以及先进的雷达系统。英国 "暴风雪"第六代战斗机的制造商透露:人工智能、大数据雷达系统 在新款战机中配备。
  • 微软会不会基于Linux内核重构Windows? 最近,关于微软会不会基于Linux内核重构Windows的问题出现了两种完全不同的观点,开源软件爱好者 Eric S Raymond 认为微软应该重构,而有些人持反对观点,那么微软到底会不会基于Linux重构Windows呢?
  • Imagination多核架构GPU IP面积缩减25%,功耗降低达30% 10月13日,Imagination发布了最新一代IMG B系列高性能GPU IP,这款多核架构GPU IP 4个系列内核有33种配置。B系列能够提供6 TFLOPS(每秒万亿次浮点运算)的计算能力,与上一代IMG A系列产品相比,功耗降低达30%,面积缩减了25%,且填充率比竞品IP内核高2.5倍。
  • 苹果iPhone 12发布,A14芯片性能再次跃升,高通、三星谁能 苹果iPhone 12于今日正式发布了,芯片方面的亮点在于A14和5G,5G采用高通的基带集成在A14中。A14芯片性能的提升主要在于晶体管数量增多,GPU,NPU以及DSP信号处理技术。在高端手机芯片领域,除了苹果,仅有高通,三星了,还有被封杀的华为麒麟,那么谁能与A14一较高下?
  • 安谋中国“周易”Z2 AIPU正式发布,性能翻倍、效率翻番 2020年10月13日——安谋科技(中国)有限公司(“安谋中国”)今天正式发布“周易”Z2 AIPU(AI Processing Unit),单核算力最高可达4TOPS,较“周易&
广告
热门推荐
广告
广告
EE直播间
在线研讨会
广告
广告
面包芯语
广告
向右滑动:上一篇 向左滑动:下一篇 我知道了