广告

谷歌在I/O大会上推出第四代TPU,MLPerf结果表明不容小觑

2021-05-19 15:34:21 阅读:
Google正式宣布了其第四代张量处理单元(TPU),TPUv4芯片提供的矩阵乘法TFLOP是第三代TPU(TPUv3)的两倍以上,其中一个TFLOP相当于每秒1万亿个浮点运算。

在Google I / O 2021上,Google正式宣布了其第四代张量处理单元(TPU)。1W9ednc

该公司声称可以在接近记录的时间内完成AI和机器学习训练工作量。谷歌表示,在对象检测,图像分类,自然语言处理,机器翻译和推荐基准等工作负载方面,TPUv4集群可以超越上一代TPU。1W9ednc

1W9ednc

据介绍,TPUv4芯片提供的矩阵乘法TFLOP是第三代TPU(TPUv3)的两倍以上,其中一个TFLOP相当于每秒1万亿个浮点运算。矩阵通常用于表示输入到AI模型的数据。1W9ednc

它还提供了“显着”的内存带宽提升,同时受益于互连技术的未指定进步。谷歌表示,总体而言,在相同的64芯片规模下,不考虑软件带来的改善,TPUv4的性能平均要比TPUv3提升2.7倍。1W9ednc

据Google介绍,TPUv4集群(即“ pod”)共有4,096个芯片,互连的带宽是大多数其他网络技术的10倍。这使TPUv4 Pod可以提供超过exaflop的计算能力,这相当于大约1000万台平均性能达到峰值的笔记本电脑处理器。1W9ednc

"这是我们在Google部署过的最快的系统,对我们来说是历史性的里程碑,"皮查伊说。"以前要想获得1个exaflop的算力,通常需要建立一个定制的超级计算机,但我们今天已经部署了许多这样的计算机,很快就会在我们的数据中心有几十个TPUv4 pods,其中许多将以90%或接近90%的无碳能源运行。而我们的TPUv4 pods将在今年晚些时候提供给我们的云客户"。1W9ednc

今年的MLPerf结果表明,谷歌的第四代TPU不容小觑。1W9ednc

在涉及使用ImageNet数据集对算法(ResNet-50 v1.5)进行至少75.90%的准确度训练的图像分类任务中,谷歌全新TPU在1.82分钟内完成了256个。这几乎与768个Nvidia A100图形卡,192个AMD Epyc 7742 CPU内核(1.06分钟)以及512个华为AI优化的Ascend910芯片与128个Intel Xeon Platinum 8168内核(1.56分钟)组合在一起的速度一样快。1W9ednc

当负责在大型维基百科语料库上训练BERT模型时,第四代TPU的得分也很高。1W9ednc

使用256个第四代TPU进行培训需要1.82分钟,仅比使用4,096个第三代TPU进行培训所需的0.39分钟稍慢。1W9ednc

同时,使用Nvidia硬件要达到0.81分钟的培训时间,需要2,048张A100卡和512个AMD Epyc 7742 CPU内核。1W9ednc

TPU是Google的第一批定制芯片之一,当包括微软在内的其他公司决定为其机器学习服务采用更灵活的FPGA时,Google很早就在这些定制芯片上下了赌注,2016年首次被谷歌公开承认。1W9ednc

虽然它们的开发时间稍长,而且随着技术的变化很快就会过时,但用于特定场景的运算时可以提供明显更好的性能。1W9ednc

谷歌表示,从今年晚些时候开始,云客户将可以使用TPUv4 pod。1W9ednc

  • TPUv4 Pods人工智能芯片的运算速度是上一版本的两倍,而量子运算将挑战100万量子位运算规模,是Google目前部署的最快一代系统。今年下半年,谷歌计划将该芯片作为云平台的一部分提供给开发者。
  • 微信扫一扫
    一键转发
  • 最前沿的电子设计资讯
    请关注“电子技术设计微信公众号”
  • 高通推断:苹果成功自研5G基带芯片,明年见 高通CEO兼总裁克里斯蒂亚诺·阿蒙表示,苹果与高通至今尚未讨论过2024年的5G基带芯片订单一事,他推测这可能代表苹果打算在2024年推出的iPhone 16系列中,开始采用自家研发的5G基带芯片。
  • 谷歌支持LTE的Pixel Watch BoM 报告:成本123美元,三星占 据EDN电子技术设计报道,根据Counterpoint的材料清单报告显示,支持 LTE 的 Pixel Watch 的制造成本为123美元。此版本的Pixel Watch发售时售价为 399 美元,成本价格比零售价低约276 美元。
  • 晶圆厂联手封测厂,为供应链赋予新意 在半导体产业日益关注封装技术创新,以超越芯片微缩的困境之际,晶圆厂联手封测厂的合作伙伴关系将支撑起下一代封装技术,并彰显封装技术在半导体供应链的重要意义...
  • 称可超越ChatGPT,微软推出新人工智能模型——Kosmos-1 微软推出了 Kosmos-1,据称它是一种多模式大型语言模型 (MLLM),不仅可以对语言提示做出反应,还可以对视觉线索做出反应,可用于一系列任务,包括图像说明、视觉问题回答等等。
  • 风禾尽起!忆芯科技高端企业级主控芯片及方案全球首发! 忆芯科技在国产高端企业级SSD赛道上,再迎来新里程碑——“风禾尽起  忆芯科技高端企业级芯片及方案发布会”在合肥天鹅湖大酒店隆重举行,面向全球正式首发全新一代高端企业级SSD主控芯片及方案。
  • MWC 2023落下帷幕,盘点国产厂商的那些亮眼表现 MWC 2023(世界移动通信大会2023)于2月27日在巴塞罗那正式向全球移动产业伙伴开启,大会也于3月2日正式落下帷幕。展会持续五天,根据官方数据统计,2023年MWC有2000多家全球厂商参展,中国有以OPPO、荣耀为代表的共计28个国产厂商参展。本次展会,各大厂商纷纷拿出自己的看家本领,可谓是亮点多多,今天就带大家一起看看展会上国产厂商展现的那些亮眼技术吧~
  • 维持ChatGPT运行将需要超过3万块Nvidia显卡 据TrendForce的最新预测,人工智能(AI)将成为Nvidia的最大收入来源之一。该研究公司估计,OpenAI的ChatGPT最终将需要超过3万块Nvidia显卡的算力以维持运行。
  • IEC 61000-4-3标准的步进频率 本文重点在于讨论如何使用更简略的步骤进行IEC 61000-4-3标准的EMI/EMC测试,以加快产品开发时间...
  • 小米预研固态电池技术前景诱人,能量密度突破1000Wh/L 3月1日,小米又宣布预研固态电池技术,通过将电解液替换为固态电解质,不仅能量密度突破1000Wh/L,更大幅提升低温放电性能和安全性,称“有望一举解决手机电池三大痛点”。
  • Win11端Phone Link添加新支持,iPhone能在PC端接打电话 3月1日,微软宣布,为Win11平台上的Phone Link应用程序添加对iPhone的支持。用户通过该应用程序连接PC和iPhone之后,可以在PC端拨打和接听电话、发送和接收短信、直接在PC上查看iPhone的通知。预览版要求Phone Link应用程序版本1.23012.169.0或更高版本。
  • 用于GaN HEMT的超快速分立式短路保护 GaN HEMT的保护电路必须比硅基MOSFET中使用的传统短路和过流保护方法更快。
  • 【电驱变革深探】: 从测试角度看800V超充技术下的电驱 市场调研数据显示,超过80%的用户对电动汽车的充电速度和续航里程表示不满,虽然新能源汽车市场在近几年飞速变化,但距离满足消费者心理预期的更高使用需求,尚有较大提升空间。预测数据显示,到2025年,800V SiC的市场占比将达到15%左右;不过在电动汽车全球发展提速的大趋势下,这一预测节点也许会提前到来。
广告
热门推荐
广告
广告
EE直播间
在线研讨会
广告
广告
面包芯语
广告
向右滑动:上一篇 向左滑动:下一篇 我知道了