采用全球最大AI芯片，Lassen超算系统集成Cerebras 1.2万亿晶体管-EDN 电子技术设计

 劳伦斯利弗莫尔国家实验室（Lawrence Livermore National Laboratory，LLNL）今天表示，已经将美国国家核安全局（National Nuclear Security Administration）的Lassen超级计算机与1.2万亿芯片进行了集成。

劳伦斯·利弗莫尔国家实验室（LLNL）和AI公司Cerebras Systems今天宣布，将1.2万亿塞雷布拉斯的晶圆级引擎（WSE）芯片集成到国家核安全局（NNSA）的23 petaflop拉森超级计算机中。拉森的仿真能力与Cerebras的机器学习计算系统，以及容纳该芯片的CS-1加速器系统的结合，使LLNL“成为第一家将AI平台与大型超级计算机集成在一起并创建全新类型的架构"。9Lzednc

超算Lassen

9Lzednc

此次集成意味着Lassen系统（如图所示）成为全球第一台将人工智能技术与高性能计算建模和仿真功能相结合的超级计算机。9Lzednc

劳伦斯利弗莫尔国家实验室表示，该系统旨在实现所谓的“认知模拟”，让研究人员可以研究用于预测建模的创新方法。该计划有几个目标，包括协助在美国国家点火设施进行融合内爆实验、材料科学、以及通过“医学治疗研发计划”快速开发用于治疗新冠病毒和癌症的新药。9Lzednc

Lassen超级计算机是目前全球排名第14的超级计算机，每秒浮点运算性能超过23 petaflops。劳伦斯利弗莫尔国家实验室表示，该系统已经集成了Cerebras Systems的CS-1加速器硬件系统，后者基于Wafer Scale Engine专用AI芯片，尺寸是标准数据中心GPU的57倍，封装了1.2万亿多个晶体管。9Lzednc

9Lzednc

去年Cerebras宣布，配置了40万个处理核心的WSE芯片已经针对AI工作负载进行了优化，配备18 GB高速板载内存。9Lzednc

该项目得到了美国国家核安全局（NNSA）的高级仿真和计算计划的资助，在该计划下，这款增强的系统将在未来十年内用于加速美国能源部和美国国家安全任务的一系列应用。9Lzednc

劳伦斯利弗莫尔国家实验室首席技术官Bronis R. de Supinski表示，该计划是在对计算提出了更高需求的情况下孕育而生的。由于计算需求已经远远超过了摩尔定律（根据摩尔定律，芯片上的晶体管密度每两年翻一番），因此已经无法通过常规手段提升计算性能了。9Lzednc

他说：“认知仿真是一种可以推动容量呈现指数级持续提升的方法，而像Cerebras CS-1这样系统级的异构方法，是实现这一提升的一个重要组成部分。”9Lzednc

研究人员通过这种方法探索一种所谓“异构性”的新概念，在这个概念下，超级计算机的不同元素负责某个特定工作负载的不同方面。根据De Supinski的说法，这样就可以运行数据生成和纠错之类的操作，从而为各种科学问题提供了一种更高效、更具成本效益的解决方案。9Lzednc

劳伦斯利弗莫尔国家实验室计算机科学家Ian Karlin表示：“异构的系统让我们能够确定，我们所使用的应用，其不同组成部分是可以同时执行各种任务的。对于我们的认知模拟工作负载来说，我们将在Cerebras硬件上运行机器学习负载，在GPU上运行高性能计算模拟负载，从而缩短了生成解决方案的时间。”9Lzednc

这意味着，研究人员可以跳过工作流程中很多不必要的处理，加速深度学习神经网络，最大程度上减少了将某些问题“切片和切成小块”的需要。9Lzednc

劳伦斯利弗莫尔国家实验室计算机科学家Brian Van Essen表示：“我们可以在更短的计算时间内进行科学探索，也可以在科学不确定性更高的领域进行更深入的研究，在有了更多计算时间的同时，得到更好的答案。”9Lzednc

Van Essen正在领导一个研究小组，该小组选择在CS-1系统上运行两种AI模型，初步工作重点是从多达50亿张模拟激光内爆图像中进行学习，优化用于国家点火装置实验的聚变目标，最终实现高能量输出，以及更强大的核武器储备管理应用聚变内爆。9Lzednc

与此同时，劳伦斯利弗莫尔国家实验室和Cerebras将合作建立一个人工智能卓越中心（Artificial Intelligence Center of Excellence），旨在确定认知模拟的最佳参数，这项研究可能会促使劳伦斯利弗莫尔国家实验室向Lassen及其他超级计算机平台中配置更多的CS-1。9Lzednc

作为该中心的负责人，Van Essen表示：“我是一名受过培训的计算机架构师，因此有机会构建这样的系统，并成为大规模部署这些系统的第一人，令人非常兴奋。将其集成并耦合到像Lassen这样的系统中，给我们提供了一个独有的机会，让我们能够率先去探索这种框架。”9Lzednc

简单粗暴的产品逻辑

去年EDN电子技术设计姐妹媒体《电子工程专辑》也报道指出，开发出 WSE 系列 AI 芯片的 Cerebras Systems 是一家2016年才成立的新创 AI 芯片公司。公司资历不长，但是却经历了三轮融资，分别是2016年5月份的2700万美元的A轮融资，2017年1月2500万美元的B轮融资，随后不到一年时间里，Cerebras Systems再次融资6000万美元，彼时估值达到8.6亿美元。9Lzednc

因为人工智能产业也恰巧在那个时候开始盛行，Cerebras Systems也因此被许多人看好。而这家公司发展产品的逻辑不同于其他AI芯片公司，就是奉行一个路子：“简单，粗暴”。为了满足 AI 计算的高性能需求，放弃其他厂商芯片越小越好的思维，以尽可能生产大面积芯片为主。由于面积越大的芯片，其中能整合越多的核心与晶体管，其相对计算效能也越强，但同时也提升了生产成本。9Lzednc

2019 年 11 月份，该公司正式推出了 WSE 系列芯片的第一代，采用台积电 16 纳米工艺，并以整个 12 吋晶圆来打造一个庞大的 AI 芯片。所以，WSE 系列芯片的第一代就整合了40 万个 AI 核心，1.2 万亿个晶体管，面积也高达 4.6 万平方毫米。9Lzednc

当时其性能之强大，让其他以大著称的芯片甘拜下风。9Lzednc

比如英伟达的GV100芯片号称最强GPU，211亿晶体管，核心面积815平方毫米，而WSE芯片晶体管数量是GV100的60倍，面积则是它的56倍多。WSE与当时的CPU芯片相比同样震撼，AMD 64核EPYC二代处理器才320亿晶体管，封装总面积也不过4410平方毫米，光是核心面积WSE就是EPYC二代处理器的10倍有余。9Lzednc

从性能上来看，WES芯片带宽超过100Pb／s，一般的计算芯片以Tb／s级别的单位都难以跟起比较。9Lzednc

除了贵，都挺好的

在关于WSE介绍的白皮书中，有这么一句话——“通过加速人工智能计算，WSE清除了阻碍人工智能进步的最大路障——时间。将训练时间从几个月缩减为几分钟，从几周减少到几秒。让深度学习实践者更快的验证自己的假设，从而不用去担心一些体系机构导致无法测试或者太大风险。WSE降低了好奇心的成本，加速了人工智能新思想和新技术的到来。”9Lzednc

虽然堪称芯片工艺史上的一大“奇迹”的WSE 芯片第一代之后被顺利生产出来，但是其造价不斐，可以想见的是会采购的单位或企业更是少之又少。最后，还是美国劳伦斯利福摩尔国家实验室（LLNL）把WSE集成到美国国家核安全管理局的拉森超级计算机中，再由美国政府旗下的美国国家科学基金会（NSF）出手相助，购买了两套以 WSE芯片为主的超级计算机CS-1，总价约 500 万美元。9Lzednc

9Lzednc

第一代的WSE（有一套电力传输和冷却系统）9Lzednc

从整机价格推算，每片 WSE芯片的价格约为 200 万美元（约合人民币1384万元），Cerebras创始人兼CEO 安德鲁 · 费尔德曼（Andrew Feldman）也曾透露称这种巨无霸芯片及系统的售价在几百万美元级别。9Lzednc

Cerebras Systems公司透露，这款WSE芯片，他们已经接到了十几片的订单。9Lzednc

9Lzednc

Cerebras Systems的联合创始人兼首席执行官安德鲁 · 费尔德曼（Andrew Feldman）9Lzednc

二代产品晶体管数翻倍

WSE 系列芯片第一代采用的是台积电 16 纳米工艺，现在新一代产品也问世。在日前举办的年度半导体盛会Hot Chips 2020 大会上，WSE2 AI 芯片正式发布。该公司表示，已经在实验室中运行了新款芯片。9Lzednc

虽然具体细节还没公布，但受到晶圆尺寸的限制，会与第一代采用相同的芯片面积。但是因为采用了新一代的台积电 7 纳米工艺，AI 核心数翻倍成长到了 85 万个，而晶体管数量更是一口气增加至 2.6 万亿个，相比之前的规格增加了一倍有余，相信价格也会随之提高。9Lzednc

9Lzednc

此外，预计该公司还将增加芯片内置的内存容量并加强芯片互连速率，以提高芯片内数据传输的带宽。去年的第一代芯片具有9PB/s的内存带宽，并且这样一个芯片的TDP为15KW。9Lzednc

目前 7 纳米工艺的最大芯片是英伟达（NVIDIA）的 GA100 GPU，芯片面积达到 826 平方毫米，拥有 540 亿个晶体管。比较之下，Cerebras Systems 新发布的 WSE2 AI 芯片无论从晶体管数，还是芯片面积都是庞然大物，预计售价也会非常高昂。9Lzednc

9Lzednc

WSE芯片尺寸达到了46225平方毫米，比最大的GPU核心要大56倍9Lzednc

晶圆级晶片除了像Cerebras这样制作计算芯片的应用外，也有应用于存储方面的研究。铠侠（前东芝存储）正在进行的新研究就是——通过跳过传统闪存和SSD制造方法过程中所有切割，组装，封装等操作，直接生产晶圆级的SSD ，这样可以极大地降低制造成本和交货时间，并且得到高性能的大量数据存储解决方案。9Lzednc

不过虽然铠侠提出了“晶圆级固态硬盘”的概念，但是还处在早期开发阶段，距离实际上市和应用还很早。目前受瞩目的晶圆级晶片还是Cerebras WSE，而关于第二代Cerebras WSE的更多信息，还是得到该公司宣布最终产品时才能知道。9Lzednc

9Lzednc

本文综合自Technews、超能网、电子工程专辑9Lzednc

责编：Challey9Lzednc

Van Essen正在领导一个研究小组，该小组选择在CS-1系统上运行两种AI模型，初步工作重点是从多达50亿张模拟激光内爆图像中进行学习，优化用于国家点火装置实验的聚变目标，最终实现高能量输出，以及更强大的核武器储备管理应用聚变内爆。

除了贵，都挺好的
在关于WSE介绍的白皮书中，有这么一句话——“通过加速人工智能计算，WSE清除了阻碍人工智能进步的最大路障——时间。将训练时间从几个月缩减为几分钟，从几周减少到几秒。让深度学习实践者更快的验证自己的假设，从而不用去担心一些体系机构导致无法测试或者太大风险。WSE降低了好奇心的成本，加速了人工智能新思想和新技术的到来。”
虽然堪称芯片工艺史上的一大“奇迹”的WSE 芯片第一代之后被顺利生产出来，但是其造价不斐，可以想见的是会采购的单位或企业更是少之又少。最后，还是美国劳伦斯利福摩尔国家实验室（LLNL）把WSE集成到美国国家核安全管理局的拉森超级计算机中，再由美国政府旗下的美国国家科学基金会（NSF）（美国科学家都是国家发工资吗？）出手相助，购买了两套以 WSE芯片为主的超级计算机CS-1，总价约 500 万美元。

这是简单，粗暴吗？
个人觉得是简单，科学
想问一下，国内非美国技术的芯片，可以做到多少纳米。手机是否也可以这样设计，整个手机主板作为基板，把手机所有的功能都集成在一起，不要分成不同的芯片。整个手机主板就是一个大大的IC。

阅读全文，请先

模拟/混合信号/RF

上一篇： Intel推出神经拟态研究芯片“Loihi”，能效最高可达通用芯片的1000倍 下一篇： 安川Sigma-7伺服放大器拆解

微信扫一扫
一键转发
最前沿的电子设计资讯
请关注“电子技术设计微信公众号”

2025松山湖中国IC创新高峰论坛：继续聊聊机器人去年的主题是智慧机器人，今年的主题仍然聚焦于机器人身上，不过变为了具身智慧机器人……
鹏瞰TS-PON Gen2芯片，用光协议重塑机器人“神经网络” TS-PON Gen2芯片是一款灵活的软件定义 SoC，适用于多种场景。它基于无源光网（PON）技术，具备高带宽（目前10G，未来可拓展至25G、50G）、低时延（微秒级）、高确定性等特性···
让人形机器人“耳聪目明”，昆泰芯KTM5900磁性编码器解编码器芯片作为机器人的核心传感器之一，对于提升机器人的感知能力、安全性和生产效率具有重要意义···
如何让具身机器人“看”得清？思特威给出了这个答案相比于滚动快门传感器，全局快门传感器能够同时曝光整个画面，有效避免了运动过程中产生的图像形变，为机器视觉提供高精度、无畸变的图像···
匠芯创M7000系列远超传统微秒级芯片，响应速度不到300纳 M7000 系列芯片已在人形机器人、机器人关节、高功率伺服驱动器等多个领域实现落地应用，与众多头部企业展开紧密合作···
极海推出全球首款双核Cortex-M52实时控制MCU/DSP 随着机器人技术的不断发展，其应用领域从传统的工业制造逐步拓展至医疗、农业等多个新兴领域，这对机器人的控制系统提出了更高的要求，当前机器人控制系统当前主要面临高爆发、高动态、高精度和高安全这四方面的挑战···
比人类更灵活？先楫HPM6E8Y机器人关节控制解决方案 HPM6E8Y通过硬件加速器将电机控制算法执行时间缩短至2.8μs，以全链路高实时通信与多轴协同能力，开启机器人关节“芯”时代。
为旌科技感算控一体化芯片落地，带来6倍效率提升？具身智能的本质是‘大脑（认知）+小脑（控制）+感官（感知）’的协同进化，需要芯片层面实现三者深度融合。
爱芯元智发布AX8850：让AI算力更便宜，让智能更可及爱芯元智希望把算力做得更加便宜具智价比，普惠AI，让我们的边缘智能更加触手可及···
万有引力EB100芯片亮相，空间计算走向低功耗新时代？ EB100芯片将为XR和机器人行业带来更好、更低功耗的空间计算和显示能力，开启空间计算时代的无限可能···
芯驰D9 Max：为具身智能而生的高性能SoC，一颗芯片顶五颗我们希望以1个芯片完成5个芯片完成的事情。当应用发生爆炸性的变化，融合一定是一个非常大的趋势，而且融合的过程会使软件的开发更简单，系统的开发更简单，成本控制得更好···
ST移动安全解决方案：构建全场景安全连接生态随着移动设备的普及与应用场景的复杂化，移动安全体系正经历关键变革——从早期依赖手机SIM卡的单一安全架构，逐步向融合NFC近场通信、嵌入式安全元件（eSE）及嵌入式SIM卡（eSIM）的多元技术体系演进。

25年第19周新能源周销量：不同价格带的车型走势解析本周插混与增程车型市场呈现出“两极化”趋势：一方面，10-15万元级的主流家用轿车与SUV销量强劲；另一方面，20万元
拆解报告：甲骨文3060W碳化硅服务器电源模块甲骨文服务器电源模块输入输出均为专用接口，采用热拔插设计。电源模块支持200-277V交流和240-380V直流输入，输
评测：森海塞尔ACCENTUM Open真无线耳机半入耳机森海塞尔ACCENTUM Open 真无线耳机采用半入耳式设计，搭配约4.4克的重量，佩戴舒适。耳机充电盒轻盈小巧，携带外
人形机器人如何做到“手眼”协同+“大小脑”协同？人形机器人正站在“走出实验室”的临界点。从本体制造、控制系统、核心零部件到应用场景拓展，技术与产业生态
南非2025年4月：奇瑞和长城汽车快速上升 2025年4月的南非车市增长，马恒达和现代的强劲回归是一个信号，而中国品牌的集体崛起，则预示着未来竞争将更加多
4月新能源车领跑汽车出口增长，中国汽车走向全球的新引擎 2025年开年以来的出口数据呈现出清晰的结构升级路径。新能源产品在出口中扮演的角色日益重要，不再只是锦上添
拆解报告：vivo手机原装90W氮化镓闪充充电器 vivo 90W氮化镓闪充充电器采用经典直板造型设计，同时附带一条专门量身定制的8.5A大电流数据线，配合信号屏蔽层
拆解报告：HONOR荣耀手环10 荣耀手环10在外观方面，延续了上代的轻薄双曲面设计，同时采用全新的双色NCVM镀膜工艺，使之更加的时尚精致。标配
2025年4月中国车企加速渗透土耳其市场：比亚迪Seal U打响突围战 2025年4月，土耳其市场的爆发式增长为全球车企提供了重要信号：新兴市场正在进入电动化转型的加速期，而土耳其作
2025年第19周新能源周销量：问界起势 2025年第19周，中国乘用车市场的周度销量达到44.4万辆，其中新能源车占比突破50%，达22.3万辆，占比50.2%。比亚迪体
2024年4月汽车市场终端数据：自主崛起、新势力分化、合资承压从整体销量数据来看，4 月汽车终端销量达 169.7 万，同比增长 9.3% ，在目前的价格力度下，这个销售数字差强人意。2
拆解报告：华为750W钛金牌服务器电源华为这款服务器电源型号为PAC750S12-TE，支持220V交流或240V直流输入，输出电压为12V，输出电流为62.5A，输出端设有

史密斯英特康推出新一代“ DaVinci Gen V”测试插座史密斯英特康推出新一代“ DaVinci Gen V”测试插座，为人工智能、6G通信及先进计算应用领域的芯片提供超
意法半导体高集成度低边电流测量放大器简化高准确度电流检测意法半导体的 TSC1801低边电流测量放大器集成了设定增益所需的匹配电阻，从而简化了电路设计，节省了物料清单
意法半导体推出创新的、带有可改变存储配置存储器的车规微控制器新推出的Stellar微控制器内置了xMemory技术，它为正在发展的软件定义汽车以及不断进化的电动汽车架构提供了一
新系列串口EEPROM内置唯一ID码，适合设备识别、溯源和可持续性应用意法半导体 (ST) 推出了一系列内置128位唯一只读ID码 (UID) 的串口EEPROM芯片，以满足市场对产品识别、溯
Vishay新添增强短瞬态脉冲防护性能的经AEC-Q200认证的厚膜功率电这些器件采用夹片式TO-247 封装形式，可直接安装在散热器上，具有高达 75 J/0.1 s的高脉冲吸收能力和 150
凉棚集成Nordic 技术实现Matter over Thread连接为家庭和企业 StruXure+ 凉棚和小屋系列集成 Nordic 的 nRF5340 SoC以提供无缝的 Matter over Thread 连接
智能楼宇技术全球领导者与Nordic Semiconductor携手合作确保楼业界连手推动NR+成为智能楼宇的全球连接标准···
Cadence 率先推出 eUSB2V2 IP 解决方案，助力打造高速连接新范 Cadence 在业内率先推出 eUSB2V2 IP，此 IP 基于先进的台积公司 N3P 工艺，符合最新的嵌入式 USB2 版
纳芯微发布双通道电流检测放大器NSCSA285，赋能工业与能源管理近日，上海 —— 纳芯微电子（简称“纳芯微”）发布全新高精度双通道电流检测放大器NSCSA285系列···
攻克PWM高频瞬态干扰难题！纳芯微发布车规级电流检测放大器NSCSA24 近日，纳芯微发布全新车规级双向电流检测放大器NSCSA240-Q1系列，专为汽车高压PWM系统打造解决方案···
TE Connectivity 推出INMORO系列：致力于满足中国市场需求而打造的连接和传感解决方案提供商泰科电子（TE Connectivity，以下简称 TE）工业事业部隆重推出INMORO 系列，致力于满足中
破解汽车与工业等应用新挑战，TDK展示多传感器融合与AI+发展趋势在新能源汽车应用中，热管理系统既要能高效地冷却和加热电池、电机与OBC等车辆核心部件，确保其处于最佳运行温

热门评论
最新评论

换一换

杂志声明

采用全球最大AI芯片，Lassen超算系统集成Cerebras 1.2万亿晶体管

超算Lassen

简单粗暴的产品逻辑

除了贵，都挺好的

二代产品晶体管数翻倍