广告

AMD公司Mark Papermaster:“我们重新设计了工程流程”,以实现模块化设计

2024-01-18 15:54:43 Pat Brans 阅读:
在AMD,Papermaster领导了工程流程的重新设计以及屡获殊荣的Zen高性能x86 CPU系列和高性能GPU的开发。

Mark Papermaster于2011年10月加入AMD,现任首席技术官兼执行副总裁。他负责微处理器设计、I/O和存储器、片上系统方法和高级研究等领域的产品开发和技术指导。他还负责监管IT部门,该部门负责提供公司的计算基础设施和服务。WU8ednc

在Papermaster 40多年的从业生涯中,他曾在思科(Cisco)和苹果担任领导职务——在前者领导硅片工程小组,在后者担任设备硬件工程高级副总裁。他还在IBM工作过26年,在技术和服务器开发方面担任过多个职务。WU8ednc

在AMD,Papermaster领导了工程流程的重新设计以及屡获殊荣的Zen高性能x86 CPU系列和高性能GPU的开发。WU8ednc

WU8ednc

超级计算就是异构计算,Mark Papermaster指出。WU8ednc

BransAMD在超级计算机市场上取得了成功。能谈谈这方面的情况吗?

Papermaster超级计算一直是AMD的重点。大约十年前,我们就开始恢复我们的CPU路线图。我们重新设计了我们的工程流程,其中之一就是采用更加模块化的设计方法,即我们开发可重复使用的部件,然后根据应用需求将其组合在一起。WU8ednc

我们投资开发了一系列新的高性能CPU,同时还努力将GPU提升到更高性能。这两种类型的处理单元都很重要,因为超级计算就是异构计算。它需要CPU和GPU协调工作,共同完成最繁重的任务。WU8ednc

我们与美国能源部合作,首次大规模展示了我们的正确战略,我们在那里介绍了能够满足他们需求的基本概念。他们非常喜欢,我们最终赢得了现在世界上最大的超级计算机的竞标。这就是美国橡树岭国家实验室的“前沿”(Frontier)计算机。它的计算量超过了1exaFLOPS,也就是1000FLOPS一千倍的计算量。这真的是一个怪物。你需要这种计算能力来进行最困难的模拟,例如高精度天气预报和计算流体动力学。WU8ednc

我们现在提供这种商业技术,并在市场上取得了巨大成功。事实上,我们在超级计算机TOP500榜单上的排名同比增长了29%,并在绿色超级计算机TOP500榜单的前10位超级计算机中,为其中的7台提供支持。这是因为我们在提供最高的计算机性能的同时,还非常注重节能。WU8ednc

这是大家近年来目睹的AMD扭转乾坤的故事,我们不打算放慢脚步。我们有一个路线图,它将引领我们走向更大、更好的目标。WU8ednc

Brans您提到了绿色计算,这在欧洲尤其重要。您能给我们介绍一下你们是如何提高能效的吗?

Papermaster首先,能源效率是我们设计过程的重要组成部分——这是一种不同的思维方式。大家应该还记得,摩尔定律认为晶体管密度每24个月就会翻一番,因此使用晶体管的设备性能也会随之提高。能效也会相应提高。WU8ednc

出于物理原因,这一速度放缓了——晶体管正在达到分子极限,这意味着将晶体管组合在一起的旧方法无法像以前那样扩展。这就要求在能源使用方式上进行更多创新。我们认为,正确的方法就是我们所说的整体设计——将能效和高性能结合起来考虑。WU8ednc

当你设计一款新的计算机芯片时,您需要考虑从制造工艺到应用开发和部署的方方面面。在设计阶段,你就需要与制造商密切合作——例如,在设计控制时,当你正在运行的任务不需要晶体管时,它就会关闭并停止消耗能量。WU8ednc

在设计阶段,你还需要考虑应用,以便开发它们所需的电路。而一旦你交付了硬件,就必须帮助应用开发人员充分利用它。就人工智能而言,我们拥有先进的算法和数学格式,可以运行近似值,从而提高人工智能的能效——这在整个堆栈中都如此。因此,整体设计意味着在设计过程的各个方面,从性能到能效,一直至应用,都要考虑到。WU8ednc

芬兰的LUMI就是我刚才描述的一个例子,根据最新的TOP500榜单,它是欧洲最强大的超级计算机,世界排名第三。LUMI是一台基于AMD CPU和AMD GPU的超级计算机。我们与LUMI、图尔库大学和艾伦研究所建立了良好的合作伙伴关系。通过与这些合作伙伴合作,我们能够为LUMI升级,使其能够高效地运行AI工作负载。目前,他们正在使用LUMI对芬兰语和其他语言的大型语言模型进行训练。WU8ednc

Brans随着人工智能算法规模逐年扩大,它们需要更多的计算能力。您认为这种趋势会持续下去,还是算法会变得更加高效?

Papermaster支持最复杂、最精确的人工智能模型对越来越大的计算机的需求确实在增长。大型语言模型和其他类型的生成人工智能确实推动了超级计算机的大规模扩展。WU8ednc

一方面,大型语言模型的运行参数多达数千亿个,而且正在向万亿个参数迈进。随着它们的成长,它们所创建的内容和回答的问题之多令人叹为观止。但是,这种惊人的能力是有代价的。WU8ednc

大型语言模型需要摄取大量的训练数据,这就需要超级计算机级的计算能力。由于这种需求将持续增长,我们必须拥有更先进的节能超级计算技术。我所描述的整体设计是实现这一目标的最佳途径。WU8ednc

另一方面,人工智能模型的使用方式也将不断创新。你不需要一个通用语言模型来完成特定任务。相反,如果将数据集限制在公司或行业所需的范围内,就可以使用缩小范围的模型。缩小范围可以缩小模型大小,这也是提高人工智能计算能效的另一种方式。WU8ednc

Brans我们谈到了支持人工智能的大型超级计算机。但我们不忘记那些那么雄心勃勃的应用服务的数据中心——我们每天都要依赖的普通数据中心。您如何切入这一市场

Papermaster对于AMD来说,这是一个非常强大的市场,而且AMD在这个市场上一直稳步前进。事实上,我们在运行商业应用的超大规模CPU集群中占据了大部分份额。目前,我们已经推出了第四代Zen系列高性能CPU,并在用于通用计算的第四代EPYC服务器中投入使用。WU8ednc

我们基于CPU的四代计算产品表现非常出色。我们每一代都增加了更多的CPU,最新一代EPYC服务器的每个芯片上都有96个CPU内核,并且每个内核上都运行两个工作线程。这意味着数据中心运营商通过每个芯片运行的工作线程数量立即翻了一番。最近,我们非常高兴地宣布了一个更加紧凑的版本,称为Zen 4c。我们让它在执行云原生任务时更加节能。WU8ednc

如果你在超大规模运行云原生应用,需要大量工作线程,那你就需要它们以非常节能的方式运行。我们的第四代处理器代号为贝加莫(Bergamo),CPU数量增至128个,并且每个芯片上的线程数量翻了一番。它非常高效,性能是竞争对手(例如同样为云原生工作负载设计的Ampere)的3.7倍。WU8ednc

回到我们如何根据应用领域的需求量身定制的问题上,针对科学计算,我们发布了AMD 3D V-Cache——我们采用了第四代x86内核并增加了额外的高速缓存。请记住,艰巨的科学任务需要数据非常接近处理核心。因此,我们垂直堆叠缓存,就在缓存在顶部。这极大地提高了电子设计自动化或计算机辅助设计工作负载的吞吐量。我们实现了显著的加速,这对Ansys等应用程序大有裨益。WU8ednc

附——Mark Papermaster采访视频:WU8ednc

WU8ednc

查看专题文章——与英特尔、英伟达和AMD三位CTO的独家对话WU8ednc

(原文刊登于EDN姊妹网站EE Times欧洲版,参考链接:AMD's Mark Papermaster: "We Reengineered Our Engineering Processes" to Enable Modular Design,由Franklin Zhao编译。)WU8ednc

本文为《电子技术设计》2024年2月刊杂志文章,版权所有,禁止转载。免费杂志订阅申请点击这里WU8ednc

责编:Franklin
本文为电子技术设计原创文章,未经授权禁止转载。请尊重知识产权,违者本司保留追究责任的权利。
  • 微信扫一扫
    一键转发
  • 最前沿的电子设计资讯
    请关注“电子技术设计微信公众号”
  • 像素不是越高越好?2023年十大“科学”流言你中招了几条 “身份证会被手机消磁”、“相机像素越高,拍出的照片越清晰”、“食用含碘盐可预防核辐射”……这些说法一直在网络上广为流传,但事实上它们都是流言,你中招了几条?
  • 英伟达公司Michael Kagan:以AI的“iPhone时刻”为基础 Kagan拥有40年的行业经验,他的职业生涯始于英特尔,参与了从i860到Pentium MMX的架构设计。
  • 全面解析,2023小华半导体全新动&静系列方案 在2023年度小华半导体产品&技术交流会上,小华半导体技术支持总监钟升分享了“2023小华全新推出的动&静系列方案全面剖析”的主题演讲,本文也将以此为基础展开,共同探秘小华在MCU解决方案上的创新···
  • 创芯未来 共筑生态 2023中国临港国际半导体大会暨司南 司南科技奖由全球科技领先媒体机构AspenCore分析师团队与业界最具专业性的专家组成的司南科技奖评委会,并邀请EETimes、EDN、ESMChina广泛的用户进行投票,综合评选出半导体领域的各项奖项,期望逐渐成为最具风向标价值的科技奖之一,作为科技领域的指南针,引导科技行业参与者乘风破浪,是司南科技奖期望传递的态度与坚持。
  • “创芯未来 共筑生态”  2023中国临港国际半导体大 本届半导体大会的下午议程还有国际汽车半导体峰会、AI芯片与高性能计算论坛、Chiplet与先进封装技术论坛,以及汽车电子与半导体产业生态闭门会议、光电子芯片制造与高端应用论坛等系列活动。此外,晚上还将举行司南科技奖颁奖盛典。
  • 类比半导体推出全新HD7xxxQ系列,高边驱动市场响起更多 11月3日,在2023国际集成电路展览会暨研讨会(IIC Shenzhen)同期举办的“芯”品发布会上,上海类比半导体技术有限公司发布了全新的车规级智能高边驱动HD7xxxQ系列,该系列产品包括车规级单通道高边驱动HD70xxQ和车规级双通道智能高边驱动HD70xx2Q。
  • 铭冠国际燕青:我的跨国之路——初探 在日前ASPENCORE举办的2023全球分销与供应链领袖峰会上,铭冠国际CEO燕青以“我的跨国之路——初探”为题,分享了作为分销商在走向国际时的心得与体会。
  • 应对云端嵌入式系统安全风险,一文详解 尽管采用云技术有诸多好处,但必须认识到跨多个云环境部署嵌入式系统的潜在安全威胁···
  • AMD Kria新品只有信用卡一半大,无需FPGA经验一小时内 日前,AMD宣布推出AMD Kria™ K24系统模块(SOM)和KD240驱动器入门套件,这是Kria自适应SOM及开发者套件产品组合的最新产品。AMD Kria K24 SOM能以小尺寸提供高能效计算,面向成本敏感型工业和商业边缘应用···
  • TI无线MCU创新方案,助力用户加速拥抱物联网 7月21日,由AspenCore主办的“2023全球MCU生态发展大会”在深圳罗湖君悦酒店隆重举行,特邀请到MCU领域的领军企业之一德州仪器(TI)参加了“无线MCU分论坛”,论坛上,TI无线产品工程师魏天华分享了主题为“创新型无线解决方案,助力不断发展的互联世界”的演讲,为现场观众带来了TI最新的无线MCU系列,以及对于这一市场的深刻思考。
  • 2023 AIoT生态大会:与时偕行,共话汽车智能化的下半场 6月8日,在由国际科技媒体集团Aspencore主办的2023国际AIoT生态发展大会智能网联汽车分论坛上,基本半导体、泰克科技、英伟达、易特驰等,来自芯片、方案及应用领域的厂商齐聚一堂,从碳化硅功率器件到车规级超大算力芯片,从以太网测试技术到汽车软件开发的整车OS,共话智能网联汽车。
  • 易特驰:未来整车OS,像开发手机软件一样开发汽车软件 为了确保功能安全和开发设计,汽车软件一个简单功能的实现甚至会需要半年以上的时间,因此汽车行业迫切需要一个集中式的系统,可以像开发手机软件一样去开发汽车软件。
广告
热门推荐
广告
广告
EE直播间
在线研讨会
广告
广告
面包芯语
广告
向右滑动:上一篇 向左滑动:下一篇 我知道了