广告

详解Google第二代TPU,相比初代有哪些进步?

2017-05-19 张驰 阅读:
除了速度,第二代TPU最大的特色,是相比初代TPU它既可以用于训练神经网络,又可以用于推理。初代的TPU只能做推理,要依靠Google云来实时收集数据并产生结果,而训练过程还需要额外的资源。

5月18日凌晨,Google CEO Sundar Pichai在I/O大会上正式公布了第二代TPU,又称Cloud TPU或TPU 2.0,这一基于云计算的硬件和软件系统,将继续支撑Google最前沿的人工智能技术。Crgednc

第一代TPU于去年发布,它被作为一种特定目的芯片而专为机器学习设计,并用在了AlphaGo的人工智能系统上,是其预测和决策等技术的基础。随后,Google还将这一芯片用在了其服务的方方面面,比如每一次搜索都有用到TPU的计算能力,最近还用在了Google翻译、相册等软件背后的机器学习模型中。Crgednc

18日凌晨,Google宣布第二代的TPU系统已经全面投入使用,并且已经部署在了Google Compute Engine平台上。它可用于图像和语音识别,机器翻译和机器人等领域。Crgednc

新的TPU包括了四个芯片,每秒可处理180万亿次浮点运算。Google还找到一种方法,使用新的计算机网络将64个TPU组合到一起,升级为所谓的TPU Pods,可提供大约11500万亿次浮点运算能力。Crgednc

009ednc20170519Crgednc

强大的运算能力为Google提供了优于竞争对手的速度,和做实验的自由度。Google表示,公司新的大型翻译模型如果在32块性能最好的GPU上训练,需要一整天的时间,而八分之一个TPU Pod就能在6个小时内完成同样的任务。之所以开发新芯片,部分也是因为Google的机器翻译模型太大,无法如想要的那么快进行训练。Crgednc

除了速度,第二代TPU最大的特色,是相比初代TPU它既可以用于训练神经网络,又可以用于推理。初代的TPU只能做推理,要依靠Google云来实时收集数据并产生结果,而训练过程还需要额外的资源。Crgednc

机器学习的能力已经逐渐在消费级产品中体现出来,比如Google翻译几乎可以实时将英语句子变成中文,AlphaGo能以超人的熟练度玩围棋。所有这一切都要靠训练神经网络来完成,而这又需要计算能力。所以硬件越强大,得到的结果就越快。如果将每个实验的时间从几周缩短到几天或几个小时,就可以提高每个机器学习者快速迭代,并进行更多实验的能力。由于新一代TPU可以同时进行推理和训练,研究人员能比以前更快地部署AI实验。Crgednc

010ednc20170519Crgednc

过去十多年来,Google已经开发出很多新的数据中心硬件,其中包括服务器和网络设备,主要目的是扩张自己的在线帝国。而过去几年中,在AI方面Google也选择开发自己的硬件,为其软件做优化。神经网络是复杂的数学系统,通过分析大量数据来学习,这种系统从根本上改变了技术的构建和运行方式,影响范围也包括硬件。Crgednc

在某种程度上,初代的TPU被设计来是为了更好地支持TensoFlow机器学习框架。而归功于Google在软硬件上的进步与集成,TensorFlow已经成为构建AI软件的领先平台之一。这种优化,再加上Google大脑及其DeepMind子公司的内部人才,正是Google在AI领域保持领先的部分原因。Crgednc

芯片厂商NVidia的GPU几乎主宰了机器学习的市场,而现在,Google想通过专门设计用于训练神经网络的芯片,来改变市场提格局。Crgednc

011ednc20170519Crgednc

亚马逊和微软通过自己的云服务提供GPU处理,但他们不提供定制的AI芯片。Crgednc

不过Google也不能因此而高枕无忧,因为短期内竞争就会加剧。目前已经有几家公司,包括芯片巨头英特尔和一大批初创公司,正在开发专门的AI芯片,它们都可能替代Google TPU。Crgednc

首先开发出新的芯片并不能保证Google成功,要使用TPU 2.0,开发者要学习一种构建和运行神经网络的新方法。它不仅仅是一个新的芯片,TPU 2.0也是专门为TensorFlow设计。虽然Tensorflow是开源软件,但也有许多研究人员使用Torch和Caffe等类似的软件。新硬件需要新的软件优化,这需要不少时间。Crgednc

在Google推出TPU 2.0的几周之前,Facebook的AI研究主管Yann LeCun质疑称,市场可能不需要新的AI专用芯片,因为研究者已经对使用GPU所需的工具非常熟悉了。新的硬件意味着新的生态系统。Crgednc

另外,Google云服务的成功不仅取决于芯片的速度,以及使用的容易程度,还要考虑成本。所以,如果Google以比现有GPU服务更低的成本提供TPU服务,会得到更广泛的用户基础。Crgednc

Google自己当然会使用新TPU系统,但也会将它的能力开放给其它公司使用。Google表示,不会将芯片直接出售,而是会通过其新的云服务(年底前公布)提供,任何开发者都可以使用新处理器带来的计算能力。Crgednc

Google也重申了其对开源模式的承诺,表示会向同意发布研究结果的研究人员提供TPU资源,甚至可能开源代码。他甚至呼吁开发者加入TensorFlow Research Cloud计划,它会免费提供一组1000台TPU。Crgednc

新TPU的速度优势肯定会吸引到不少研究人员,毕竟AI研究要在大量硬件上广泛试错。就此而言,Google愿意免费提供计算资源对全世界的AI研究者来说都是有好处的,当然,这对Google来说也是有好处的。Crgednc

(来源:雷锋网)Crgednc

20160630000123Crgednc

本文为EDN电子技术设计 原创文章,禁止转载。请尊重知识产权,违者本司保留追究责任的权利。
  • 微信扫一扫
    一键转发
  • 最前沿的电子设计资讯
    请关注“电子技术设计微信公众号”
您可能感兴趣的文章
  • 详解电源保护技术 电源除了要能在发生负载和线路变化、系统瞬变,以及噪声等偏差的情况下提供稳定的DC (或AC)电压之外,还必须要保护自己免受临时和永久性故障(内部或外部)的影响,从而避免负载损坏。电源保护涉及很多方面,许多案例会将以下这些方案结合使用……
  • 神秘的MS-DOS重开机事件 上世纪90年代初,在笔者工作的电视台有一个新闻编辑室计算机系统,记者、主播和制片都用它来编写和制作新闻广播。该系统使用了一对冗余的服务器和一个充满PC工作站的新闻编辑室,一切都工作的相当好,直到…
  • 干货!20年以来,中国诞生了哪些本土EDA公司?(附名单) 2021年初始就传来EDA产业的好消息,1月13日,华大九天拟首次公开发行股票并在创业板上市,1月19日概伦电子在上海证监局进行了辅导备案计划在科创板挂牌上市,1月27日,国微思尔芯与中金公司签署了辅导协议,计划在科创板上市。那么20年以来,中国诞生了哪些本土EDA公司呢?
  • 低代码平台四大常见用例开发 低代码通过可视化开发工具和可重用组件,缩短了定制化网络和移动应用的交付时间,通过一套完整的工具解决了传统开发和运营的低效率问题,为快速、迭代开发周期提供了支持,并简化了整个应用生命周期。
  • Android手机年底也能用上3D dToF摄像头了 除了苹果之外,市面上主流的手机、平板所用的3D ToF,基本上都是iToF。这主要是因为iToF技术整体成熟,且成本控制到位。而dToF在3D感知方面似乎面临诸多挑战。
  • 【当代材料电学测试】系列之一: 纳米测试(下) 材料性质的研究是当代材料科学的重要一环,所谓材料的性质是指对材料功能特性和效用的定量度量和描述,即材料对电、磁、光、热、机械载荷的反应。源表SMU在当代材料科学研究中,起到举足轻重的作用,选择适合某类材料电性能测试的SMU,如何降低测试误差,测试中应当注意什么,这些问题都需要重点关注。泰克吉时利的品牌在全球许多学科工程师和科学家中享有盛誉,其高精度源表(SMU)、万用表、精密电源、微小信号测试以及数据采集产品,同泰克公司原有的产品线一同为当代材料科学研究提供多种测试方案。【当代材料电学测试课堂】系列涉及当代材料科学尖端的电运输及量子材料/超导材料测试、一维/碳纳米管材料测试、二维材料及石墨烯测试及纳米材料的应用测试。今天跟您分享第二篇,【当代材料电学测试课堂】系列之二: 纳米测试(下)。
相关推荐
    广告
    近期热点
    广告
    广告
    广告
    可能感兴趣的话题
    广告
    向右滑动:上一篇 向左滑动:下一篇 我知道了