广告

“后摩尔”技术包含哪些?从ISSCC 2021说起

2021-05-20 13:31:36 矽说 阅读:
什么是“后摩尔”?为什么“后摩尔”要提升到国家战略程度?“后摩尔”技术包含哪些?本期矽说小编就来谈一谈我眼中的后摩尔。

最近的一则新闻把一个原本在学术界的词汇——“后摩尔”拉升到了公众视野。9Ncednc

什么是“后摩尔”?为什么“后摩尔”要提升到国家战略程度?“后摩尔”技术包含哪些?本期矽说小编就来谈一谈我眼中的后摩尔,因为一直欠着大家一篇ISSCC 2021的review,正好有机会借着这个话题来一起讨论下。9Ncednc

后摩尔定义:尺寸微缩的边际效应递减

历史上的摩尔定律,一般分为两个阶段,第一个阶段是从Gordon Moore提出摩尔定律开始,到2000年前后,这个阶段一般称为 Full Scaling或者恒定电场微缩阶段,这个阶段的摩尔定律是温馨且甜蜜的童话,所有的性能指标都微缩,单位面积上的发热量保持不变。9Ncednc

PPA(Power/Performance/Area),无论哪个都在有条不紊提升。9Ncednc

也正是这个时期开始,芯片厂商们意识到,押注摩尔定律稳赚不赔,就像投资北上广深的房价。9Ncednc

9Ncednc

 9Ncednc

然而好景不长,由于晶体管的阈值电压在到100nm以后几乎无法下降,Full scale的摩尔定律遇到了阻碍。9Ncednc

于是一种新的摩尔定律产生——我们一般称为恒定电压微缩。9Ncednc

虽然尺寸还在变小,速度还在变快,但是恒定电压微缩下,单位面积下的发热量是随微缩节点平方率上升。9Ncednc

换言之,这样的摩尔定律一定带来芯片发热的爆炸。如果我们芯片充分利用微缩带来益处,小小芯片很可能其发热密度能赶上核电站甚至是火箭推进器。9Ncednc

9Ncednc

问题来了,20nm以下的工艺发展,且不论能否造出来,假设CMOS器件制造无碍,能否继续享受摩尔定律器件微缩带来的芯片性能的上升红利?9Ncednc

由于发热宛如小火炉现象,实际摩尔定律发展边际效应已然递减。而且,更现实的问题是设计成本。9Ncednc

20nm以下的工艺采用FinFET/GAA等立体结构,无论数字还是模拟电路,设计难度指数级上升,设计成本更是让一般的芯片公司望洋兴叹。9Ncednc

一颗5nm SoC的设计成本是28nm的10倍之多。相比之下,带来性能跃迁只有2、3倍。从经济的角度,除了少部分出货量超过100KK的芯片,大部分芯片的微缩已经停滞在了28nm节点上下。9Ncednc

当然,这种停滞还可能源于某些国际政治的因素。比如某西方大国不让我们的某实力大厂在某岛的代工厂上流14nm以下的工艺等。还有就是,2nm以下的芯片能不能造出来,大家也没啥谱。毕竟已经是十几个原子的事情了,现在基于量子力学的半导体物理理论管不管用还两说呢。9Ncednc

 9Ncednc

总而言之,所谓“后摩尔”指的就是当摩尔定律对于大部分芯片设计公司来说已经停滞时,有没有什么颠覆性技术可以让芯片在没有尺寸微缩的前提下继续保持PPA的提升。9Ncednc

简单而言,可以从器件、架构、集成方法的角度来讨论后摩尔的关键技术。9Ncednc

后摩尔器件:CMOS工艺的百尺竿头

既然CMOS器件在先进节点已经如此挣扎,那“后摩尔”时期,是否可以找一些能和CMOS工艺的兼容的新器件代替传统的MOS器件呢?这一想法的率先在存储器中完成落地。9Ncednc

ISSCC 2021中,中科院微电子所在14nm FinFET工艺节点上,用忆阻器实现的阻变RAM(ReRAM)代替了传统的基于Flash 浮栅MOS管9Ncednc

在CMOS兼容的工艺里,采用新原理器件实现了FinFet工艺的非易失存储。9Ncednc

相比之下,Flash工艺在28nm,甚至40nm就已经达到了工艺微缩的极限。9Ncednc

 9Ncednc

9Ncednc

不仅用于存储,由于ReRAM的器件具有电阻特性,与电流、电压可通过欧姆定律、基尔霍夫定律实现乘和累加的物理关系,因此可被广泛用于并行模拟计算电路中,这种电路也被称为存算一体9Ncednc

ISSCC 2021中,台湾清华大学通过数模混合的计算电路,首次基于ReRAM的实现8位的存算一体电路,且能效保持在11TOPS/W。9Ncednc

其电路模块结构如下所示:9Ncednc

9Ncednc

 9Ncednc

后摩尔架构:算法与电路的紧耦合契机

除了器件本身,“后摩尔”的另一潜力的来源是其专用性。9Ncednc

传统的通用电路性能饱和,所以这两年“领域专用”的设计如火如荼。ISSCC自然也不能缺席。特别是在人工智能芯片领域。目前AI算法发展速度是每3.4个月算力翻倍,而摩尔定律最快也得1.5年单位面积上的尺寸翻倍。9Ncednc

若要能稍稍赶上这一发展速度,就得联合算法寻找新的契机。9Ncednc

9Ncednc

在ISSCC的AI芯片Session中,几乎所有芯片设计都紧紧拥抱了算法,基于协同设计催化出更好的性能。9Ncednc

例如,IBM提出的基于混合8位浮点的AI训练芯片。通过自定义FP8的数据格式,完成训练。精度上,和标准32位浮点的训练精度相差不超过1%,同时功耗又能保持在3TOPS/W以上,避免GPU百瓦级的耗电与发热。9Ncednc

 9Ncednc

9Ncednc

 9Ncednc

还有清华大学在ISSCC 2021报告的两篇存算一体SoC的论文。9Ncednc

第一篇通过利用传统Cache一致性机制中的Set Associative技术,存算一体系统芯片中的再发明,完成了对稀疏输入的高效读写与计算,用更小的硬件代价完成更大规模的计算。9Ncednc

9Ncednc

第二篇通过利用In-tensor decomposition train算法将最占据存储空间的神经网络权重最大的三维卷积核 分解为多个小向量的乘积,通过仅存储这些小向量的方式,结合量化和稀疏性优化实现高性能片上存储空间。9Ncednc

9Ncednc

可见,上述方法的性能提升及其背后的新架构探索,都不适用于通用计算,但是通过算法与电路的更紧密结合,突破目前“摩尔时期”通用模块的性能瓶颈的效果显著。9Ncednc

后摩尔集成:3D视角重新定义芯片与互联

摩尔定律的“初心”判断标准是单位面积上的晶体管数量的增长速度。9Ncednc

在过去的很多年里,摩尔定律关心的都是二维平面上CMOS器件的尺寸微缩。但在后摩尔时代,如果二维的增长饱和了,为什么不考虑三维呢?ISSCC 2021上有多篇从3D视角切入的芯片可以提供讨论。9Ncednc

首先是来自Sony的智能CIS传感芯片。由于人工智能应用的兴起,进传感器侧的AI芯片一直是CIS领域的热门话题。9Ncednc

Sony通过三维封装与Cu-Cu互联,将一个CMOS图像传感器阵列与模拟前端、AI芯片集成在一个封装内。利用Cu-Cu互联高带宽避免了额外的传感器与处理器数据通信瓶颈。9Ncednc

 9Ncednc

此外,三维封装的另一个火热话题是Chiplet。虽然ISSCC 2021的论文中未有太多的Chiplet paper,但是在forum上,也披露了不少已发表的Chiplet高性能处理器的设计细节。9Ncednc

比如AMD 二代EPYC架构服务器处理器芯片中基于Chiplet、无源连接基板和有源硅互联芯片的协同设计方法,阐述了其从芯片级到板级到系统级的考虑。9Ncednc

9Ncednc

还有Nvidia的Chiplet多AI加速器MCM集成芯片,进一步讨论了其互联与软件部署算法的系统设计考虑。这种场景下,芯片的设计视角需要跳脱单芯片的局部优化,而走向超大规模算力集成下的软硬件协同优化。9Ncednc

有可能,我们即将来到一个3D封装重新定义单芯片的新格局。9Ncednc

9Ncednc

在这一背景下,大厂们也开始积极布局面向Die-to-Die的互联电路,Wireline session中Samsung、Cadence都有高性能片间互联的新电路设计。但目前为止,还是经典的Serdes的高能效设计,能否有颠覆性技术出现让我们拭目以待。9Ncednc

9Ncednc

其实还有很多ISSCC 的好paper难以穷举,你眼中的后摩尔技术还有什么呢?9Ncednc

 9Ncednc

(本文授权转载自公众号矽说,版权归矽说所有,转载请联系矽说)责编:胡安9Ncednc

 9Ncednc

  • 微信扫一扫
    一键转发
  • 最前沿的电子设计资讯
    请关注“电子技术设计微信公众号”
  • 商务部暂停天然砂对台湾地区出口,台积电难受了 据EDN电子技术设计了解,商务部网站8月3日早晨8点发布最新消息,表示将从即日起暂停天然砂对台湾地区出口。不少网友认为暂停天然砂对台湾地区的出口,此举将严重影响台湾的建筑业,实则影响不仅仅如此。台湾地区天然砂进口量的90%以上来自大陆,而台湾芯片占台湾2021年出口额的34.8%。网友称商务部暂停天然砂对台湾地区出口是捏到了台湾半导体制造业的七寸。
  • 美国参议院批准价值2460亿美元的芯片法案 美国参议院周三通过立法,以超过 750 亿美元支持国内半导体产业。GlobalFoundries、英特尔、三星代工厂、德州仪器、台积电和其他在美国建立半导体制造设施的公司或将受益。
  • 空调也“怕热”?空调工作临界点到底是什么? 深圳最高气温突破40℃!很多网友戏称:这条命是空调给的,不敢走出空调房。但同时,这两天明显感觉空调动力不足了,以为家里的空调坏了。与此同时,关于格力空调“怕热”遭遇“空调工作临界点”罢工的成了网友关注的热点。
  • 林志颖驾特斯拉出车祸:特斯拉回应起火原因不明,网友质疑 据EDN电子技术设计了解,7月22日上午10时50分左右,林志颖驾驶特斯拉Model X,在路口处掉头后加速向前行驶,但在前方道路分叉口处,因不明原因突然偏离车道自撞指示杆,整辆车陷入火海。此事引起网友关注热议,特斯拉客服表示,暂不清楚起火原因,但车身没有特别容易起火的材质。但有台媒指出,林志颖最爱特斯拉的自动驾驶功能,这也引起了网友对事故是否与自动驾驶有关的猜测。
  • 售价将超50万美元,乔布斯的Apple-1原型机电路板长什么 这块在 1976 年由史蒂夫-沃兹尼亚克手工焊接的 Apple Computer A 印刷电路板被史蒂夫-乔布斯用来向保罗-特雷尔演示 Apple-1 电脑,后者是加州山景城 The Byte Shop 的老板。这台原型机在“苹果车库”里保存了很多年,然后在大约 30 年前由史蒂夫-乔布斯交给了它现在的主人。当时,乔布斯已被苹果公司赶走。乔布斯当时认为这个原型不是要供奉的东西,而是要被重新利用的东西。
  • 利用反极性MOSFET帮助555振荡器忽略电源和温度变化 恒定频率振荡器是555定时器的经典应用之一。然而,由于所用二极管的特性不理想,占空比的间隔会随着温度和V+电源的变化而变化。本设计实例给出了一种解决方法:利用反极性P沟道MOSFET引导电容的充电电流而不产生任何明显压降。
  • 高通发布4nm骁龙W5+骁龙W5芯片,专为可穿戴设计 据EDN电子技术设计报道,高通7月20日正式发布了全新4nm制程的骁龙可穿戴平台W5 Gen1和骁龙W5+ Gen。与两年前的上一代产品骁龙wear 4100相比,骁龙W5与W5+采用了全新的命名方式,整体功耗降低超50%。SoC工艺从12nm提升到4nm,协处理器使用22nm制程工艺。
  • M2 Pro 和 M2 Max 或是苹果首款采用台积电3nm 工艺的 M1 Pro 和 M1 Max 最多可配置 10 核 CPU 和 32 核 GPU。借助 M2 Pro 和 M2 Max,Apple 有望突破这一门槛,为这两个领域带来更多的核心数量。目前M2 Pro相关的爆料很少,但据称M2 Max 有12 核 GPU 和 38 核 GPU。12 核 CPU 将包括 10 个性能核心和两个能效核心。
  • 华为鸿蒙3.0即将发布,首款新品是一款11英寸高端旗舰平 据EDN电子技术设计报道,终端官方微博昨天正式宣布,将于7月27日正式发布Harmony OS 3.0手机操作系统,新系统重点升级了流畅度、万物互联,以及鸿蒙车机等功能。此外,还将带来的首款新品:华为MatePad Pro 11,从宣传海报来看这是一款11英寸高端旗舰平板.
  • 中信拆了辆特斯拉Model 3,发现多个领域技术引领行业 EDN电子技术设计在6月底报道了海通国际手动拆解十万元的比亚迪“元”的详细拆解图,如今不到一个月的时间,中信证券微信公众号发表了一篇《从拆解Model 3看智能电动汽车发展趋势》的文章,文中称对特斯拉Model 3的E/E架构、三电、热管理、车身等进行了详细深入地分析,并坚定看好中国智能电动化发展趋势,引起了广泛关注。
  • 经典电子小制作项目:DS18B20制作的测温系统原程序原理 下面介绍的这款DS18B20制作的测温系统,测量的温度精度达到0.1度,测量的温度的范围在-20度到+50度之间,用4位数码管显示出来。DS18B20的外型与常用的三极管一模一样,用导线将JK—DS的DA端连到P3.1上。连接好DS18B20注意极性不要弄反,否则可能烧坏。
  • OPPO被曝测试240W快充,但实际速度不及vivo的200W 爆料称OPPO正在试产24V10A的240W充电器。对于采用双电芯三电荷泵设计的电池而言,其理论峰值功率可以达到300W,但目前的USB Type-C接口规范的最高功率为240W,OPPO这次一下子将C口快充做到了“天花板”级别。不过,OPPO和vivo不太一样,虽然前者测试的是240W快充,但充电策略偏向保守,实际速度可能不如vivo的200W。
广告
热门推荐
广告
广告
EE直播间
在线研讨会
广告
广告
面包芯语
广告
向右滑动:上一篇 向左滑动:下一篇 我知道了