广告

AMD的AI策略与Intel和Nvidia有何不同?

2019-08-28 10:14:28 包永刚 阅读:
在美国硅谷举办的Hot Chips 31上发布的两款最大芯片引人注目。分别是Cerebras最大的深度学习芯片WSE,还有赛灵思发布全球最大的FPGA。Intel发布的两款AI芯片Nervana NNP-T/NNP-I同样备受关注。不过,AMD在Hot Chips期间并没有获得巨大的关注,这或许是因为在当今AI大热的情况下,他们采用“观望式”的AI策略。

Intel、AMD和NVIDIA如何预估AI市场?

NVIDIA预计,其数据中心和人工智能潜在市场(TAM)到2023年将达到500亿美元。这包括HPC(高性能计算),DLT(深度学习训练)和DLI(深度学习推理)。3DGednc

英特尔估计,其DLT和DLI潜在市场在2020年将达到460亿美元。3DGednc

AMD尚未发布任何关于深度学习潜在市场的预测,因为它更专注于从英特尔和NVIDIA获得市场份额。因此,也没有看到AMD有专注于人工智能的芯片。3DGednc

不过,AMD首席执行官Lisa Su表示,我们正在努力成为人工智能领域更重要的参与者。3DGednc

AMD-F1-20190828.jpg3DGednc

Lisa Su:CPU的局限性

任何计算性能的讨论都始于摩尔定律,但摩尔定律正在放缓。摩尔定律指出,随着芯片尺寸缩小和晶体管密度增加,计算性能将每两年翻一番。3DGednc

在AnandTech Hot Chips 31的报道指出,Lisa Su在主题演讲中解释说,AMD通过各种方式改善了CPU的性能,包括工艺制程、芯片面积、TDP(热设计功耗)、电源管理、微体系结构和编译器。3DGednc

先进工艺制程的贡献最大,这使得CPU的性能提升了40%。增加芯片尺寸也可以带来两位数性能的提升,但这不符合成本效益。3DGednc

AMD通过微体系架构将EPYC Rome服务器CPU IPC(每个周期的指令)在单线程和多线程工作负载中分别提升了23%和15%。高于行业平均5%-8%的水平。上述所有方法在两年半内都会使性能翻倍。3DGednc

Lisa Su:人工智能所需的加速计算

Lisa Su表示,一方面,摩尔定律正在放缓。另一方面,世界上最快的超级计算机的性能每1.2年翻一番。这意味着过去十年的解决方案将失效。3DGednc

该行业目前的需求是优化系统的各个部分,使其成为人工智能工作负载的理想选择。她解释说,ASIC和FPGA的每瓦特性能最高,CPU最低。通用GPU在每瓦性能方面介于CPU和FPGA之间。3DGednc

AMD-F2-20190828.jpg3DGednc

Lisa Su指出,每个人工智能工作负载都有不同的计算要求。互连技术是解决方案,因为它将不同的部分互连到同一个系统。她用以下例子解释了这一点:3DGednc

• NAMD(纳米级分子动力学)工作负载取决于GPU3DGednc
• NLP(自然语言处理)工作负载在CPU、GPU、内存带3DGednc

宽和连接性之间保持平衡

业界使用传统方法提高了CPU和GPU的性能。Lisa Su强调,业界应该通过关注互连,I/O、内存带宽、软件效率和软硬件协同优化来提高性能。3DGednc

AMD的AI策略

Lisa Su表示,AMD已采用CPU/GPU/互连策略来挖掘人工智能和HPC的机会。她说,AMD将在Frontier超级计算机中使用其所有技术。该公司计划为实现超级计算机全面优化其EYPC CPU和Radeon Instinct GPU。它将通过其Infinity Fabric总线技术进一步增强系统性能,并通过其ROCM(Radeon Open Compute)软件工具解锁性能。3DGednc

与英特尔和NVIDIA不同,AMD没有专用的人工智能芯片或专用的加速器。尽管如此,苏还指出,“我们绝对会看到AMD在人工智能方面是一个很重要的参与者。”AMD正在考虑是否要建立一个专用的AI芯片,这一决定将取决于人工智能如何发展。3DGednc

Su补充说,许多公司正在开发不同的人工智能加速器,如ASIC、FPGA和张量(Tensor)加速器。这些芯片将缩小到最可持续的状态,然后AMD将决定是否构建可以广泛应用的加速器。3DGednc

与此同时,AMD将与第三方加速器制造商合作,并通过其Infinity Fabric互连将其芯片与自己的CPU/GPU连接。这个策略类似于其光线跟踪策略,NVIDIA去年推出了实时光线跟踪,但AMD并没有急于推出这项技术。不过,Su表示AMD将在生态系统完善并且该技术被广泛采用的情况下引入光线跟踪技术。3DGednc

鉴于AMD是一个相对较小的玩家,与拥有充足资源的大型玩家竞争,上述策略具有经济意义。在已经建立的市场中分享份额可以减少因采用率低而导致产品失败的风险,并保证最低的回报。3DGednc

AMD AI战略与英特尔和NVIDIA战略的不同

AMD在开发AI芯片之前采用了观望态度。他们现在做的,是利用其现有技术来满足AI工作负载。3DGednc

英特尔开发了全面的技术,包括Xeon CPU、Optane内存、Altera FPGA和互连技术。也在开发独立GPU Xe。在Hot Chip 31中,英特尔推出了专用于深度学习训练和深度学习推理的Nervana AI芯片。英特尔的芯片由自己生产,虽然这使英特尔能够更好地控制其技术,但需要大量的时间和资源。3DGednc

NVIDIA的AI策略是提供通用GPU以及可用于任何AI应用程序的CUDA软件支持。它还具有NVLink互连技术。英伟达正与合作伙伴共同探索人工智能新市场。虽然这种策略需要大量研究并且有很高的失败风险,但这些高风险也会带来高回报。3DGednc

(来源:雷锋网)3DGednc

  • 微信扫一扫
    一键转发
  • 最前沿的电子设计资讯
    请关注“电子技术设计微信公众号”
  • Nothing Phone 1 官方承认品控缺陷,但拆解后有新发现 前一加手机联合创始人裴宇创立的 Nothing 公司在国外备受关注,但Nothing Phone 1发布之后却被网友爆料大量翻车现场。目前官方也已承认了Nothing Phone 1 在前摄开孔位置附近出现了坏点或绿晕的问题。但Nothing Phone 1也并非一无是处,著名的 JerryRigEverything 耐用性测试就称其“超级坚固”。
  • 因眼睛小车主被辅助驾驶误判“开车睡觉”,小鹏、蔚来回 昨日,汽车博主@常岩CY 发博称自己突然上了热搜,原来就是因自己眼睛小被小鹏汽车自动驾驶误判“开车睡觉”,不住的发出提醒。此外,@常岩CY 称在多款车型上都收到此困扰。无论是红外还是摄像头,只要开始检测眼睛,就会判定过度疲劳。小鹏P7会提示他睡觉,蔚来ET7一开车就认为其疲劳和走神,岚图FREE会在冬天为了让其“别困”而打开冷风……
  • 国际象棋机器人Chessrobot夹断对手手指,意外还是设计缺 据悉,在7月19日的莫斯科国际象棋公开赛期间,一位7岁小男孩疑似因提前走子犯规手,意外被“对手”国际象棋机器人Chessrobot夹住手指,造成指骨骨折,该事件登上了热搜榜。该男孩是莫斯科9岁以下最强的30位棋手之一。
  • 拆解一个中国产的“树莓派”开发笔记本,售价279美元值 “树莓派”在全球市越来越受欢迎,甚至有家长开始让孩子用树莓派学习开发产品。有中国厂商嗅到,率先开发出了基于“树莓派”笔记本——CrowPi L ,外观看和普通笔记本差不多, 但却是基于树莓派Raspberry Pi 4B 开发板的套件,专为 STEM 教育而设计,带有可选的电子模块和教程。EDN发现有外媒对其进行了拆解,接下来将这篇拆解文章分享给大家:
  • 售价将超50万美元,乔布斯的Apple-1原型机电路板长什么 这块在 1976 年由史蒂夫-沃兹尼亚克手工焊接的 Apple Computer A 印刷电路板被史蒂夫-乔布斯用来向保罗-特雷尔演示 Apple-1 电脑,后者是加州山景城 The Byte Shop 的老板。这台原型机在“苹果车库”里保存了很多年,然后在大约 30 年前由史蒂夫-乔布斯交给了它现在的主人。当时,乔布斯已被苹果公司赶走。乔布斯当时认为这个原型不是要供奉的东西,而是要被重新利用的东西。
  • iFixit 拆解M2 MacBook Ai:没有散热器,但有用途不明的加 日前,iFixit发表了M2 MacBook Air的拆解视频,表示在M2 MacBook Air 中发现了新增的端口,以及加速度计。
  • 高通发布4nm骁龙W5+骁龙W5芯片,专为可穿戴设计 据EDN电子技术设计报道,高通7月20日正式发布了全新4nm制程的骁龙可穿戴平台W5 Gen1和骁龙W5+ Gen。与两年前的上一代产品骁龙wear 4100相比,骁龙W5与W5+采用了全新的命名方式,整体功耗降低超50%。SoC工艺从12nm提升到4nm,协处理器使用22nm制程工艺。
  • M2 Pro 和 M2 Max 或是苹果首款采用台积电3nm 工艺的 M1 Pro 和 M1 Max 最多可配置 10 核 CPU 和 32 核 GPU。借助 M2 Pro 和 M2 Max,Apple 有望突破这一门槛,为这两个领域带来更多的核心数量。目前M2 Pro相关的爆料很少,但据称M2 Max 有12 核 GPU 和 38 核 GPU。12 核 CPU 将包括 10 个性能核心和两个能效核心。
  • “智能家居”未来将可通过呼吸控制操作 凯斯西储大学的研究人员创造了一个简单的原型设备,使用户能够通过改变他们的呼吸模式来控制“智能家居”。这种自供电装置可放入鼻孔,并有可能提高行动不便或无法清晰说话的人的生活质量。如果个人呼吸困难,它也可以编程为医务人员提供自动警报。
  • 适用于CSP GaN FET的简单高性能散热管理解决方案 本文将演示芯片级封装(CSP) GaN FET提供的散热性能为什么至少能与硅MOSFET相当,甚至更胜一筹。GaN FET由于其卓越的电气性能,尺寸可以减小,从而能在不违背温度限制的同时提高功率密度。本文还将通过PCB布局的详细3D有限元仿真对这种行为进行展示,同时还会提供实验验证,对分析提供支持。
  • 核酸采样机器人将取代“大白”?用了哪些技术保证采样准 取棉签、核酸采样、储存核酸采样管、设备消杀……动作精准流畅,今后给你核酸采样的可能不再是“大白”,而是机器人。EDN小编就带大家来看看,目前已被使用的核酸采样机器人有哪些?
  • 研究人员开发出新设计框架,用于构建下一代模拟计算芯片 印度科学研究所 (IISc) 的研究人员开发了一种设计框架,用于构建下一代模拟计算芯片组,与目前大多数电子设备中的数字芯片相比,该芯片组速度更快、功耗更低。
广告
热门推荐
广告
广告
EE直播间
在线研讨会
广告
广告
面包芯语
广告
向右滑动:上一篇 向左滑动:下一篇 我知道了