广告

谷歌在I/O大会上推出第四代TPU,MLPerf结果表明不容小觑

2021-05-19 阅读:
Google正式宣布了其第四代张量处理单元(TPU),TPUv4芯片提供的矩阵乘法TFLOP是第三代TPU(TPUv3)的两倍以上,其中一个TFLOP相当于每秒1万亿个浮点运算。

在Google I / O 2021上,Google正式宣布了其第四代张量处理单元(TPU)。6C6ednc

该公司声称可以在接近记录的时间内完成AI和机器学习训练工作量。谷歌表示,在对象检测,图像分类,自然语言处理,机器翻译和推荐基准等工作负载方面,TPUv4集群可以超越上一代TPU。6C6ednc

6C6ednc

据介绍,TPUv4芯片提供的矩阵乘法TFLOP是第三代TPU(TPUv3)的两倍以上,其中一个TFLOP相当于每秒1万亿个浮点运算。矩阵通常用于表示输入到AI模型的数据。6C6ednc

它还提供了“显着”的内存带宽提升,同时受益于互连技术的未指定进步。谷歌表示,总体而言,在相同的64芯片规模下,不考虑软件带来的改善,TPUv4的性能平均要比TPUv3提升2.7倍。6C6ednc

据Google介绍,TPUv4集群(即“ pod”)共有4,096个芯片,互连的带宽是大多数其他网络技术的10倍。这使TPUv4 Pod可以提供超过exaflop的计算能力,这相当于大约1000万台平均性能达到峰值的笔记本电脑处理器。6C6ednc

"这是我们在Google部署过的最快的系统,对我们来说是历史性的里程碑,"皮查伊说。"以前要想获得1个exaflop的算力,通常需要建立一个定制的超级计算机,但我们今天已经部署了许多这样的计算机,很快就会在我们的数据中心有几十个TPUv4 pods,其中许多将以90%或接近90%的无碳能源运行。而我们的TPUv4 pods将在今年晚些时候提供给我们的云客户"。6C6ednc

今年的MLPerf结果表明,谷歌的第四代TPU不容小觑。6C6ednc

在涉及使用ImageNet数据集对算法(ResNet-50 v1.5)进行至少75.90%的准确度训练的图像分类任务中,谷歌全新TPU在1.82分钟内完成了256个。这几乎与768个Nvidia A100图形卡,192个AMD Epyc 7742 CPU内核(1.06分钟)以及512个华为AI优化的Ascend910芯片与128个Intel Xeon Platinum 8168内核(1.56分钟)组合在一起的速度一样快。6C6ednc

当负责在大型维基百科语料库上训练BERT模型时,第四代TPU的得分也很高。6C6ednc

使用256个第四代TPU进行培训需要1.82分钟,仅比使用4,096个第三代TPU进行培训所需的0.39分钟稍慢。6C6ednc

同时,使用Nvidia硬件要达到0.81分钟的培训时间,需要2,048张A100卡和512个AMD Epyc 7742 CPU内核。6C6ednc

TPU是Google的第一批定制芯片之一,当包括微软在内的其他公司决定为其机器学习服务采用更灵活的FPGA时,Google很早就在这些定制芯片上下了赌注,2016年首次被谷歌公开承认。6C6ednc

虽然它们的开发时间稍长,而且随着技术的变化很快就会过时,但用于特定场景的运算时可以提供明显更好的性能。6C6ednc

谷歌表示,从今年晚些时候开始,云客户将可以使用TPUv4 pod。6C6ednc

  • TPUv4 Pods人工智能芯片的运算速度是上一版本的两倍,而量子运算将挑战100万量子位运算规模,是Google目前部署的最快一代系统。今年下半年,谷歌计划将该芯片作为云平台的一部分提供给开发者。
本文为EDN电子技术设计 原创文章,禁止转载。请尊重知识产权,违者本司保留追究责任的权利。
  • 微信扫一扫
    一键转发
  • 最前沿的电子设计资讯
    请关注“电子技术设计微信公众号”
  • 酒店房间装有摄像头?防偷窥神器是怎样检测出的? EDN小编在某科技类微信群看到了一条关于“酒店马桶内装有摄像头,用防偷拍神器可以检测到”的短视频,群里的科技大拿们对此展开了热烈讨论。有人提问说,这到底是摄像头还是智能马桶的红外感应器?有人说,看来智慧家居给偷拍产业提供了隐藏。还有人认为,这很可能是女主播为了带货拍的广告视频……那么事情的真相是什么?
  • iPhone 14 Pro 将采用“药丸+圆孔”双孔设计 传闻称苹果计划在今年推出的iPhone 14系列的部分机型上,更改刘海屏设计,iPhone 14 Pro和 14 Pro Max 将采用药丸形切口设计,可容纳Face ID元素和自拍相机的第二个孔。
  • 台积电、联电校招万人,业内人士:行业薪资达十年来最高水 近日,台积电、联电开启了校招活动,其中,台积电预计招募超过8000名新员工、联电预计招募 2000 名人才,硕士毕业工程师平均年薪上看200万新台币,约合人民币45万元。晶圆厂们大手笔扩招源于晶圆厂们2021年的“疯狂”扩产。
  • 黑客“开源”英伟达后续:开源三星源代码,下一个是高通 此前英伟达遭到了黑客组织的网络攻击,导致超过1TB的数据泄露,由于与英伟达交涉不畅,黑客组织现在正试图将窃取的信息出售给第三方。与此同时,黑客又“帮”三星把代码给开源了,顺便还把高通也捎上了。
  • 被二十余家科技巨头“制裁”,俄罗斯反击:停供美国火箭发 随着俄罗斯与乌克兰冲突的持续升级,以美国为首的北约成员国和欧洲国家纷纷对俄罗斯宣布制裁,不少科技行业也加入了制裁俄罗斯的队伍。如英特尔、AMD断供,苹果在俄停售,美国社交平台“禁言”俄罗斯媒体、甲骨文、SAP等云巨头停服俄罗斯等,但值得一提的是,俄罗斯也进行了反击。不仅停止了向美国交付火箭发动机,终止两国在国际空间站的实验合作,还启用本国互联网 Runet。
  • PCIe 5.0连接器线缆详细信息曝光,最高支持600W 日前,Twitter 用户@momomo_us透露了进一步研究 PCIe Gen 5.0 连接器标准的图片和内容。根据泄漏者 @momom_us 发布的 PPT显示,即将推出的 PCIe Gen5 显卡标准官方名称为“12VHPWR”,负责定义 ATX 规格的英特尔数据显示,该接口将支持 4 种电源配置,分别为 150W、300W、450W、600W。
  • 英特尔、AMD、Arm等九大企业宣布UCIe开放标准,推动Chip 英特尔、AMD、Arm 和所有领先的代工厂商齐聚一堂,包括高通、三星、台积电、日月光,以及Google Cloud、Meta、微软,宣布他们正在为小芯片互连制定一个新的开放标准Universal Chiplet Interconnect Express (UCIe),希望以UCIe 1.0规范建立芯片互连、兼容运作,让更多业者能依照此标准打造新款处理器,并且能配合不同微芯片建构差异化设计。
  • 英伟达被黑客组织勒索,网友从泄露数据中挖出核心机密信 NVIDIA近日被南美黑客组织勒索攻击一事引起了网友的关注。不同于竞品中的AMD FSR采样技术和英特尔XeSS采样技术,英伟达之前从未公布过DLSS的源代码,很不愿意将这个大量挣钱的独有技术给开源了。部分获得了这些数据的人已经开始了对代码的分析、并试图弄懂DLSS的工作原理。
  • 联发科超越高通,成美国Android手机芯片首选 据EDN电子技术设计报道,联发科在其天玑 8000 系列简报中报告称,在美国销售的所有Android手机中,联发科芯片占比排名第一,并引用了IDC 2021 年第四季度的统计数据。
  • 从技术角度分析,GaN和SiC功率器件上量还欠什么? 氮化镓(GaN)和碳化硅(SiC)这两种新器件正在推动电力电子行业发生重大变化,它们在汽车、数据中心、可再生能源、航空航天和电机驱动等多个行业取得了长足的进步。在由AspenCore集团举办的PowerUP Expo大会上,演讲嘉宾们深入探讨了包括GaN和SiC在内的宽禁带(WBG)器件的技术优势以及发展趋势。
  • 研发转至FAE(现场应用工程师),是否远离技术了?有前途吗? 前几日,EDN小编在浏览知乎的时候,发现了一个有趣的话题《FAE有什么发展前景吗?》,被浏览次数接近九万次。小编总结了一下题主的提问:FAE是否远离技术了?未来是否有发展前景?
  • 小米发布“小感量+磁吸”无线充电预研技术,最高支持50W 据EDN电子技术设计报道,昨日,@小米手机 官微宣布,正式发布小感量+磁吸”无线充电预研技术,其磁吸无线充电功率最高可达50W,损耗降低50%。据悉,该技术与传统无线充电方案采用大感量线圈不同,小米的小感量无线快充技术方案采用小感知线圈去感应发送端能量。
广告
热门推荐
广告
广告
EE直播间
在线研讨会
广告
广告
面包芯语
广告
向右滑动:上一篇 向左滑动:下一篇 我知道了