广告

采用全球最大AI芯片,Lassen超算系统集成Cerebras 1.2万亿晶体管

2020-08-21 10:26:32 阅读:
劳伦斯利弗莫尔国家实验室(Lawrence Livermore National Laboratory,LLNL)今天表示,已经将美国国家核安全局(National Nuclear Security Administration)的Lassen超级计算机与1.2万亿芯片进行了集成。

劳伦斯·利弗莫尔国家实验室(LLNL)和AI公司Cerebras Systems今天宣布,将1.2万亿塞雷布拉斯的晶圆级引擎(WSE)芯片集成到国家核安全局(NNSA)的23 petaflop拉森超级计算机中。拉森的仿真能力与Cerebras的机器学习计算系统,以及容纳该芯片的CS-1加速器系统的结合,使LLNL“成为第一家将AI平台与大型超级计算机集成在一起并创建全新类型的架构"。yGnednc

超算Lassen

yGnednc

此次集成意味着Lassen系统(如图所示)成为全球第一台将人工智能技术与高性能计算建模和仿真功能相结合的超级计算机。yGnednc

劳伦斯利弗莫尔国家实验室表示,该系统旨在实现所谓的“认知模拟”,让研究人员可以研究用于预测建模的创新方法。该计划有几个目标,包括协助在美国国家点火设施进行融合内爆实验、材料科学、以及通过“医学治疗研发计划”快速开发用于治疗新冠病毒和癌症的新药。yGnednc

Lassen超级计算机是目前全球排名第14的超级计算机,每秒浮点运算性能超过23 petaflops。劳伦斯利弗莫尔国家实验室表示,该系统已经集成了Cerebras Systems的CS-1加速器硬件系统,后者基于Wafer Scale Engine专用AI芯片,尺寸是标准数据中心GPU的57倍,封装了1.2万亿多个晶体管。yGnednc

yGnednc

去年Cerebras宣布,配置了40万个处理核心的WSE芯片已经针对AI工作负载进行了优化,配备18 GB高速板载内存。yGnednc

该项目得到了美国国家核安全局(NNSA)的高级仿真和计算计划的资助,在该计划下,这款增强的系统将在未来十年内用于加速美国能源部和美国国家安全任务的一系列应用。yGnednc

劳伦斯利弗莫尔国家实验室首席技术官Bronis R. de Supinski表示,该计划是在对计算提出了更高需求的情况下孕育而生的。由于计算需求已经远远超过了摩尔定律(根据摩尔定律,芯片上的晶体管密度每两年翻一番),因此已经无法通过常规手段提升计算性能了。yGnednc

他说:“认知仿真是一种可以推动容量呈现指数级持续提升的方法,而像Cerebras CS-1这样系统级的异构方法,是实现这一提升的一个重要组成部分。”yGnednc

研究人员通过这种方法探索一种所谓“异构性”的新概念,在这个概念下,超级计算机的不同元素负责某个特定工作负载的不同方面。根据De Supinski的说法,这样就可以运行数据生成和纠错之类的操作,从而为各种科学问题提供了一种更高效、更具成本效益的解决方案。yGnednc

劳伦斯利弗莫尔国家实验室计算机科学家Ian Karlin表示:“异构的系统让我们能够确定,我们所使用的应用,其不同组成部分是可以同时执行各种任务的。对于我们的认知模拟工作负载来说,我们将在Cerebras硬件上运行机器学习负载,在GPU上运行高性能计算模拟负载,从而缩短了生成解决方案的时间。”yGnednc

这意味着,研究人员可以跳过工作流程中很多不必要的处理,加速深度学习神经网络,最大程度上减少了将某些问题“切片和切成小块”的需要。yGnednc

劳伦斯利弗莫尔国家实验室计算机科学家Brian Van Essen表示:“我们可以在更短的计算时间内进行科学探索,也可以在科学不确定性更高的领域进行更深入的研究,在有了更多计算时间的同时,得到更好的答案。”yGnednc

Van Essen正在领导一个研究小组,该小组选择在CS-1系统上运行两种AI模型,初步工作重点是从多达50亿张模拟激光内爆图像中进行学习,优化用于国家点火装置实验的聚变目标,最终实现高能量输出,以及更强大的核武器储备管理应用聚变内爆。yGnednc

与此同时,劳伦斯利弗莫尔国家实验室和Cerebras将合作建立一个人工智能卓越中心(Artificial Intelligence Center of Excellence),旨在确定认知模拟的最佳参数,这项研究可能会促使劳伦斯利弗莫尔国家实验室向Lassen及其他超级计算机平台中配置更多的CS-1。yGnednc

作为该中心的负责人,Van Essen表示:“我是一名受过培训的计算机架构师,因此有机会构建这样的系统,并成为大规模部署这些系统的第一人,令人非常兴奋。将其集成并耦合到像Lassen这样的系统中,给我们提供了一个独有的机会,让我们能够率先去探索这种框架。”yGnednc

简单粗暴的产品逻辑

去年EDN电子技术设计姐妹媒体《电子工程专辑》也报道指出,开发出 WSE 系列 AI 芯片的 Cerebras Systems 是一家2016年才成立的新创 AI 芯片公司。公司资历不长,但是却经历了三轮融资,分别是2016年5月份的2700万美元的A轮融资,2017年1月2500万美元的B轮融资,随后不到一年时间里,Cerebras Systems再次融资6000万美元,彼时估值达到8.6亿美元。yGnednc

因为人工智能产业也恰巧在那个时候开始盛行,Cerebras Systems也因此被许多人看好。而这家公司发展产品的逻辑不同于其他AI芯片公司,就是奉行一个路子:“简单,粗暴”。为了满足 AI 计算的高性能需求,放弃其他厂商芯片越小越好的思维,以尽可能生产大面积芯片为主。由于面积越大的芯片,其中能整合越多的核心与晶体管,其相对计算效能也越强,但同时也提升了生产成本。yGnednc

2019 年 11 月份,该公司正式推出了 WSE 系列芯片的第一代,采用台积电 16 纳米工艺,并以整个 12 吋晶圆来打造一个庞大的 AI 芯片。所以,WSE 系列芯片的第一代就整合了40 万个 AI 核心,1.2 万亿个晶体管,面积也高达 4.6 万平方毫米。yGnednc

当时其性能之强大,让其他以大著称的芯片甘拜下风。yGnednc

比如英伟达的GV100芯片号称最强GPU,211亿晶体管,核心面积815平方毫米,而WSE芯片晶体管数量是GV100的60倍,面积则是它的56倍多。WSE与当时的CPU芯片相比同样震撼,AMD 64核EPYC二代处理器才320亿晶体管,封装总面积也不过4410平方毫米,光是核心面积WSE就是EPYC二代处理器的10倍有余。yGnednc

从性能上来看,WES芯片带宽超过100Pb/s,一般的计算芯片以Tb/s级别的单位都难以跟起比较。yGnednc

除了贵,都挺好的

在关于WSE介绍的白皮书中,有这么一句话——“通过加速人工智能计算,WSE清除了阻碍人工智能进步的最大路障——时间。将训练时间从几个月缩减为几分钟,从几周减少到几秒。让深度学习实践者更快的验证自己的假设,从而不用去担心一些体系机构导致无法测试或者太大风险。WSE降低了好奇心的成本,加速了人工智能新思想和新技术的到来。”yGnednc

虽然 堪称芯片工艺史上的一大“奇迹”的WSE 芯片第一代之后被顺利生产出来,但是其造价不斐,可以想见的是会采购的单位或企业更是少之又少。最后,还是美国劳伦斯利福摩尔国家实验室(LLNL)把WSE集成到美国国家核安全管理局的拉森超级计算机中,再由美国政府旗下的美国国家科学基金会(NSF)出手相助,购买了两套以 WSE芯片为主的超级计算机CS-1,总价约 500 万美元。yGnednc

yGnednc

第一代的WSE(有一套电力传输和冷却系统)yGnednc

从整机价格推算,每片 WSE芯片的价格约为 200 万美元(约合人民币1384万元),Cerebras创始人兼CEO 安德鲁 · 费尔德曼(Andrew Feldman)也曾透露称这种巨无霸芯片及系统的售价在几百万美元级别。yGnednc

Cerebras Systems公司透露,这款WSE芯片,他们已经接到了十几片的订单。yGnednc

yGnednc

Cerebras Systems的联合创始人兼首席执行官安德鲁 · 费尔德曼(Andrew Feldman)yGnednc

二代产品晶体管数翻倍

WSE 系列芯片第一代采用的是台积电 16 纳米工艺,现在新一代产品也问世。在日前举办的年度半导体盛会Hot Chips 2020 大会上,WSE2 AI 芯片正式发布。该公司表示,已经在实验室中运行了新款芯片。yGnednc

虽然具体细节还没公布,但受到晶圆尺寸的限制,会与第一代采用相同的芯片面积。但是因为采用了新一代的台积电 7 纳米工艺,AI 核心数翻倍成长到了 85 万个,而晶体管数量更是一口气增加至 2.6 万亿个,相比之前的规格增加了一倍有余,相信价格也会随之提高。yGnednc

yGnednc

此外,预计该公司还将增加芯片内置的内存容量并加强芯片互连速率,以提高芯片内数据传输的带宽。去年的第一代芯片具有9PB/s的内存带宽,并且这样一个芯片的TDP为15KW。yGnednc

目前 7 纳米工艺的最大芯片是英伟达(NVIDIA) 的 GA100 GPU,芯片面积达到 826 平方毫米,拥有 540 亿个晶体管。比较之下,Cerebras Systems 新发布的 WSE2 AI 芯片无论从晶体管数,还是芯片面积都是庞然大物,预计售价也会非常高昂。yGnednc

yGnednc

WSE芯片尺寸达到了46225平方毫米,比最大的GPU核心要大56倍yGnednc

晶圆级晶片除了像Cerebras这样制作计算芯片的应用外,也有应用于存储方面的研究。铠侠(前东芝存储)正在进行的新研究就是——通过跳过传统闪存和SSD制造方法过程中所有切割,组装,封装等操作,直接生产晶圆级的SSD ,这样可以极大地降低制造成本和交货时间,并且得到高性能的大量数据存储解决方案。yGnednc

不过虽然铠侠提出了“晶圆级固态硬盘”的概念,但是还处在早期开发阶段,距离实际上市和应用还很早。目前受瞩目的晶圆级晶片还是Cerebras WSE,而关于第二代Cerebras WSE的更多信息,还是得到该公司宣布最终产品时才能知道。yGnednc

 yGnednc

本文综合自Technews、超能网、电子工程专辑yGnednc

责编:ChalleyyGnednc

  • Van Essen正在领导一个研究小组,该小组选择在CS-1系统上运行两种AI模型,初步工作重点是从多达50亿张模拟激光内爆图像中进行学习,优化用于国家点火装置实验的聚变目标,最终实现高能量输出,以及更强大的核武器储备管理应用聚变内爆。

    除了贵,都挺好的
    在关于WSE介绍的白皮书中,有这么一句话——“通过加速人工智能计算,WSE清除了阻碍人工智能进步的最大路障——时间。将训练时间从几个月缩减为几分钟,从几周减少到几秒。让深度学习实践者更快的验证自己的假设,从而不用去担心一些体系机构导致无法测试或者太大风险。WSE降低了好奇心的成本,加速了人工智能新思想和新技术的到来。”
    虽然 堪称芯片工艺史上的一大“奇迹”的WSE 芯片第一代之后被顺利生产出来,但是其造价不斐,可以想见的是会采购的单位或企业更是少之又少。最后,还是美国劳伦斯利福摩尔国家实验室(LLNL)把WSE集成到美国国家核安全管理局的拉森超级计算机中,再由美国政府旗下的美国国家科学基金会(NSF)(美国科学家都是国家发工资吗?)出手相助,购买了两套以 WSE芯片为主的超级计算机CS-1,总价约 500 万美元。

    这是简单,粗暴吗?
    个人觉得是简单,科学
  • 想问一下,国内非美国技术的芯片,可以做到多少纳米。手机是否也可以这样设计,整个手机主板作为基板,把手机所有的功能都集成在一起,不要分成不同的芯片。整个手机主板就是一个大大的IC。
  • 微信扫一扫
    一键转发
  • 最前沿的电子设计资讯
    请关注“电子技术设计微信公众号”
  • 商务部暂停天然砂对台湾地区出口,台积电难受了 据EDN电子技术设计了解,商务部网站8月3日早晨8点发布最新消息,表示将从即日起暂停天然砂对台湾地区出口。不少网友认为暂停天然砂对台湾地区的出口,此举将严重影响台湾的建筑业,实则影响不仅仅如此。台湾地区天然砂进口量的90%以上来自大陆,而台湾芯片占台湾2021年出口额的34.8%。网友称商务部暂停天然砂对台湾地区出口是捏到了台湾半导体制造业的七寸。
  • 华盛顿大学首创用人体热能为可穿戴电子设备供电 从健康和健身追踪器到虚拟现实设备,可穿戴电子产品已成为我们日常生活的一部分,但找到持续为这些设备供电的方法是一项挑战。华盛顿大学的研究人员开发了一种创新的解决方案:首创的柔性、可穿戴热电设备,可将体热转化为电能。
  • 深圳允许完全自动驾驶车辆上路,主驾无需坐人 据EDN电子技术设计引援央视财经报道,从8月1日开始,《深圳经济特区智能网联汽车管理条例》正式实施,智能网联汽车列入国家汽车产品目录或者深圳市智能网联汽车产品目录,这也让深圳成为了国内首个允许L3级别自动驾驶车辆合法上路的城市。
  • 理想ONE高速起火烧成光架,其1.2T三缸增程器曾被指隐藏 近期,网络平台上发布了一段理想ONE在行驶过程中,车辆出现起火的视频内容。现场拍摄的灭火后图片显示,该轿车过火后仅剩骨架,车辆前部增程器位置受损严重,车辆尾门已经在过火后从车身主体脱落。此前,曾有国内汽车媒体对一台行驶了10万公里的理想ONE的东安1.2T三缸增程发动机进行拆解,被指隐藏暗病。
  • 上海微系统所使用石墨烯纳米带研制出世界上最小尺寸的 非易失性相变随机存取存储器(PCRAM)被认为是大数据时代新兴海量存储的有希望的候选者之一。然而,相对较高的编程能量阻碍了 PCRAM 中功耗的进一步降低。利用石墨烯的窄边接触可以有效降低每个电池中相变材料的活性体积,从而实现低功耗运行。
  • 可解决工业自动化和IIoT挑战的MCU 工业自动化和工业物联网(IIoT)设计人员的性能要求不断变化。就MCU而言,他们希望获得更快的处理速度、更多的内存、更好的连接性和更多的安全功能。
  • 我国建成开通5G基站数达185.4万个 工信部近日透露,截至2022年6月底,中国5G基站数达到185.4万个,其中二季度新增基站近30万个,已建成全球规模最大、技术领先的网络基础设施,实现“县县通5G、村村通宽带”。。
  • Nothing Phone 1 官方承认品控缺陷,但拆解后有新发现 前一加手机联合创始人裴宇创立的 Nothing 公司在国外备受关注,但Nothing Phone 1发布之后却被网友爆料大量翻车现场。目前官方也已承认了Nothing Phone 1 在前摄开孔位置附近出现了坏点或绿晕的问题。但Nothing Phone 1也并非一无是处,著名的 JerryRigEverything 耐用性测试就称其“超级坚固”。
  • 苹果发布2022财年第三财季业绩,营收829.59亿美元 Apple 今日公布了 2022 年第三财季的财务业绩。报告显示,苹果公司第三财季公布收入为 829.59亿美元,去年同期为 814 亿美元,同比增长2%;季度净利润为 194 .4亿美元,去年同期为217 亿美元,同比下降10.6%;其中,iPhone带来的营收406.7亿美元,同比增长3%。
  • 工程师开发出可以看到身体内部的贴纸 麻省理工学院的工程师设计了一种贴片,可以产生身体的超声图像。这种邮票大小的设备贴在皮肤上,可以提供 48 小时内脏器官的连续超声成像。
  • 美国参议院批准价值2460亿美元的芯片法案 美国参议院周三通过立法,以超过 750 亿美元支持国内半导体产业。GlobalFoundries、英特尔、三星代工厂、德州仪器、台积电和其他在美国建立半导体制造设施的公司或将受益。
  • 第三代半导体——碳化硅材料之制程与分析 SiC功率电子是加速电动车时代到来的主要动能。以SiC MOSFET取代目前的Si IGBT,不仅能使电力移转时的能源损耗降低80%以上,同时也可让芯片模块尺寸微缩至原本的1/10,达到延长电动车续航里程及缩短充电时间的功效。
广告
热门推荐
广告
广告
EE直播间
在线研讨会
广告
广告
面包芯语
广告
向右滑动:上一篇 向左滑动:下一篇 我知道了