广告

全球最大晶圆级AI处理器:14336个ARM核心,2048个小芯片

2021-10-18 14:09:14 综合报道 阅读:
加州大学洛杉矶分校和伊利诺伊大学厄巴纳-香槟分校的研究人员已经设计并正在制作“2048-chiplet、14336-core 晶圆级处理器”的原型,该系统包括 1024 个小块的阵列,其中每个小块由两个小芯片组成,总共 2048 个小芯片和大约 15,000 mm 2的总面积。

日前,加州大学洛杉矶分校和伊利诺伊大学厄巴纳-香槟分校的研究人员发表了一篇新论文,称大规模芯片/系统集成的最佳路径是使用小芯片技术,使用无源硅互连技术将各种设备安装到单个硅晶片上,这种方法更灵活、可以扩展并具有显着的成本优势。Scaednc

研究人员团队已经设计并正在制作“2048-chiplet、14336-core 晶圆级处理器”的原型,该系统包括 1024 个小块的阵列,其中每个小块由两个小芯片组成,总共 2048 个小芯片和大约 15,000 mm 2的总面积。Scaednc

Scaednc

他们总结工作的论文很好地展示了chiplet 方法的优势和挑战。Scaednc

“据我们所知,这是有史以来最大的基于小芯片组装的系统,”该团队在论文中说。“就活动区域而言,我们的原型系统比 Nvidia/AMD 的单个基于小芯片的系统大约 10 倍,比来自 Nvidia 的 64 个小芯片 Simba 研究系统大约 100 倍。”Scaednc

相比之下,Cerebras 的第二代 AI 系统在单个晶圆上拥有 850,000 个优化的张量核心,面积为 46,225 平方米。Scaednc

加州大学洛杉矶分校开发的基于小芯片的晶圆级系统使用硅互连结构 (Si-IF) 将许多小芯片紧密集成在高密度互连晶圆上的基于细间距铜柱(10μm 间距)的 I/O 上,这些 I/O 至少为比基于中介层的系统中使用的传统 µ-bumps 密度高 16 倍,以及~100µm 的小芯片间距。Scaednc

这些小芯片可以采用异构技术制造,并且可以潜在地提供更好的性价比权衡,100s Tbit/s 的 TB 内存以及高性能计算和 AI 应用程序的 PFLOP 计算吞吐量。Scaednc

“这个原型系统的规模迫使我们重新思考设计流程的几个方面。因为这是构建这样一个系统的第一次尝试,所以在制造和组装过程中有几个未知数,”该团队在论文中说。“因此,容错和弹性是我们做出设计决策背后的主要驱动因素之一。我们还确保设计决策不会太复杂,这样他们就可以由一个小团队可靠地实施,”他们说。Scaednc

每个 tile 由两个小芯片组成:一个计算小芯片和一个内存小芯片。每个 40nm 计算小芯片包含 14 个独立可编程的 ARM Cortex-M3 处理器内核和 64kbits 的本地 SRAM,而内存小芯片提供 512KB 的全局共享内存。该系统被构建为一个统一的内存系统,其中任何区块上的任何内核都可以使用互连直接访问整个晶圆级系统的全局共享内存。Scaednc

小芯片采用 TSMC 40nm-LP 工艺设计和制造,并终止于构建细间距 I/O 焊盘的顶部铜金属层。晶圆级基板是一个无源基板,包含小芯片和铜柱之间的互连布线,以连接到小芯片 I/O。小芯片倒装芯片键合到晶圆级基板上,并通过边缘连接提供功率。Scaednc

由于晶片基板的尺寸远大于掩模版的最大尺寸,因此必须将 Si-IF 基板设计为可步进重复。Scaednc

整个晶片被分成较小的相同光罩,并通过缝合这些光罩制造,每个光罩由 72 个瓦片 (12x6) 组成。Scaednc

每个标线内的小芯片间链接的宽度为 2 µm,间距为 3 µm,但在每个标线的边缘,链接逃逸变得更粗(宽度增加到 3 µm,间距减小到 2 µm),同时保持间距不变,以减少标线拼接误差的影响。Scaednc

来自网格边缘每个瓦片的多个 I/O 需要扇出到晶圆边缘并连接到外部连接器,因此扇出布线和边缘 I/O 焊盘被设计成每个标线。来自边缘光罩的 Si-IF 基板上的小芯片插槽将保持未填充状态,并且外部连接器将连接到这些光罩中的焊盘。Scaednc

为确保这些 I/O 焊盘不会导致小芯片粘合的问题,该团队使用自定义块蚀刻工艺去除不需要的焊盘。如果代工厂支持每个晶片有多个光罩,也可以使用单独的掩模印刷晶片的边缘。Scaednc

责编:DemiScaednc

  • 微信扫一扫
    一键转发
  • 最前沿的电子设计资讯
    请关注“电子技术设计微信公众号”
  • 华盛顿大学首创用人体热能为可穿戴电子设备供电 从健康和健身追踪器到虚拟现实设备,可穿戴电子产品已成为我们日常生活的一部分,但找到持续为这些设备供电的方法是一项挑战。华盛顿大学的研究人员开发了一种创新的解决方案:首创的柔性、可穿戴热电设备,可将体热转化为电能。
  • 深圳允许完全自动驾驶车辆上路,主驾无需坐人 据EDN电子技术设计引援央视财经报道,从8月1日开始,《深圳经济特区智能网联汽车管理条例》正式实施,智能网联汽车列入国家汽车产品目录或者深圳市智能网联汽车产品目录,这也让深圳成为了国内首个允许L3级别自动驾驶车辆合法上路的城市。
  • 理想ONE高速起火烧成光架,其1.2T三缸增程器曾被指隐藏 近期,网络平台上发布了一段理想ONE在行驶过程中,车辆出现起火的视频内容。现场拍摄的灭火后图片显示,该轿车过火后仅剩骨架,车辆前部增程器位置受损严重,车辆尾门已经在过火后从车身主体脱落。此前,曾有国内汽车媒体对一台行驶了10万公里的理想ONE的东安1.2T三缸增程发动机进行拆解,被指隐藏暗病。
  • 上海微系统所使用石墨烯纳米带研制出世界上最小尺寸的 非易失性相变随机存取存储器(PCRAM)被认为是大数据时代新兴海量存储的有希望的候选者之一。然而,相对较高的编程能量阻碍了 PCRAM 中功耗的进一步降低。利用石墨烯的窄边接触可以有效降低每个电池中相变材料的活性体积,从而实现低功耗运行。
  • 可解决工业自动化和IIoT挑战的MCU 工业自动化和工业物联网(IIoT)设计人员的性能要求不断变化。就MCU而言,他们希望获得更快的处理速度、更多的内存、更好的连接性和更多的安全功能。
  • 我国建成开通5G基站数达185.4万个 工信部近日透露,截至2022年6月底,中国5G基站数达到185.4万个,其中二季度新增基站近30万个,已建成全球规模最大、技术领先的网络基础设施,实现“县县通5G、村村通宽带”。。
  • 苹果发布2022财年第三财季业绩,营收829.59亿美元 Apple 今日公布了 2022 年第三财季的财务业绩。报告显示,苹果公司第三财季公布收入为 829.59亿美元,去年同期为 814 亿美元,同比增长2%;季度净利润为 194 .4亿美元,去年同期为217 亿美元,同比下降10.6%;其中,iPhone带来的营收406.7亿美元,同比增长3%。
  • 工程师开发出可以看到身体内部的贴纸 麻省理工学院的工程师设计了一种贴片,可以产生身体的超声图像。这种邮票大小的设备贴在皮肤上,可以提供 48 小时内脏器官的连续超声成像。
  • 第三代半导体——碳化硅材料之制程与分析 SiC功率电子是加速电动车时代到来的主要动能。以SiC MOSFET取代目前的Si IGBT,不仅能使电力移转时的能源损耗降低80%以上,同时也可让芯片模块尺寸微缩至原本的1/10,达到延长电动车续航里程及缩短充电时间的功效。
  • 开源软件真的可靠吗? 乍看之下,采用开源软件似乎是个不错的办法,但归根究底,开源软件有几个特性可能会使其变得“邪恶”...
  • 俄罗斯要绕过5G直接开发6G!投资300亿卢布够吗? 在全球通信技术竞争上,中国的5G发展速度遥遥领先于其他国家,更多国家开始在6G上较劲儿。今日,“俄罗斯决定绕过5G直接开发6G网络”登上热榜,引起网友热议。
  • GaN是否可靠? GaN产业已经建立一套方法来保证GaN产品的可靠性,因此问题并不在于“GaN是否可靠?”,而是“如何验证GaN的可靠性?”
广告
热门推荐
广告
广告
EE直播间
在线研讨会
广告
广告
面包芯语
广告
向右滑动:上一篇 向左滑动:下一篇 我知道了