广告

Imagination多核架构GPU IP面积缩减25%,功耗降低达30%

2020-10-15 11:43:31 综合报道 阅读:
10月13日,Imagination发布了最新一代IMG B系列高性能GPU IP,这款多核架构GPU IP 4个系列内核有33种配置。B系列能够提供6 TFLOPS(每秒万亿次浮点运算)的计算能力,与上一代IMG A系列产品相比,功耗降低达30%,面积缩减了25%,且填充率比竞品IP内核高2.5倍。

10月13日,Imagination发布了最新一代IMG B系列高性能GPU IP,这款多核架构GPU IP 4个系列内核有33种配置。B系列能够提供6 TFLOPS(每秒万亿次浮点运算)的计算能力,与上一代IMG A系列产品相比,功耗降低达30%,面积缩减了25%,且填充率比竞品IP内核高2.5倍。VyWednc

VyWednc

对于任何一种架构的处理器,对于更高性能的追求不会停止。Imagination技术产品管理高级总监Kristof Beets说:“客户用上我们去年12月发布的高性能 IMG A系列Power VR GPU后,问我们能否提供更高性能的多核GPU。于是,在大量投资及A系列技术优势的基础上,同时增加了多核技术,推出了IMG B系列,以惊人的33种全新配置扩展了Imagination的GPU产品系。”VyWednc

目前,IMG B系列已可提供授权,每个产品系列都已有厂商率先获得了授权。VyWednc

首款多核架构GPU IP,更适合小芯片趋势VyWednc

据悉,B系列能够提供6 TFLOPS(每秒万亿次浮点运算)的计算能力,与上一代IMG A系列产品相比,功耗降低达30%,面积缩减了25%,且填充率比竞品IP内核高2.5倍。Imagination表示,B系列可提供最高的性能密度(performance per mm2),同时提供多种全新配置,可以针对给定的性能目标实现更低的功耗和最高35%的带宽降低。VyWednc

VyWednc

具体而言,IMG B系列GPU IP针对特定市场提供BXE、BXM、BXT、BXS四个系列专业内核:VyWednc

  • IMG BXE:面向高清显示应用,专门针对用户界面(UI)渲染和入门级游戏设计,每个时钟周期可处理从1-16个像素,支持从720p到8K的分辨率,相较上一代内核,面积缩减达25%,填充率密度是竞品的2.5倍。VyWednc

  • IMG BXM:主打图形处理体验,这个系列是中端解决方案,引入客户可配置的最新缓存设计,实现了填充率和计算能力的更好平衡,可将带宽占用降低35%,为中档移动端游戏及用于数字电视和其他市场的复杂UI解决方案提供支持。VyWednc

  • IMG BXT:面向高性能应用,旗舰款B系列GPU内置四核,可提供6 TFLOPS的性能,每秒可处理192 Gigapixel(十亿像素),AI算力达24 TOPS,同时可提供行业最高的性能密度。VyWednc

  • IMG BXS:面向汽车应用,符合ISO 26262安全标准,提供从入门级到高级的完整产品系列,能将自动驾驶图形处理速度提升至竞品的60%以上,可为下一代人机界面(HMI)、UI显示、信息娱乐系统、数字驾舱、环绕视图提供解决方案,高算力的配置还可支持自动驾驶和辅助驾驶。VyWednc

B系列GPU最值得关注的特性是多核架构。Kristof Beets在沟通时表示,“从过去的经验看,当单核的高性能都发挥出来之后,就会走向多核的架构。这其中很重要的原因是多个单核很难提升架构性能,有很多控制逻辑需要管理。我们研发的多核架构整合了创新的分散管理方法,可提供高效的扩展特性,与小芯片(Chiplet)架构行业趋势相适。”VyWednc

Imagination首席营销官David Harold补充道:“我们观察到了小芯片在GPU市场的趋势,这种去中心化的设计不仅可以降低开发成本,也能降低开发时间。但是小芯片的信号传输是一个问题。”VyWednc

“过去GPU有很多次核,非常依赖主核的一些资源。我们的多核架构设计避免了中央的模块,小芯片有独立的资源,可以独立运行,同时也避免了一些复杂的逻辑,因此我们的设计非常符合小芯片的趋势。” Kristof Beets进一步表示。VyWednc

基于这样的多核架构设计,Imagination针对BXT和BXM内核的每个产品系列进行了优化,利用多个主核的扩展特性实现GPU内核的多核扩展,每个核既可以独立运行,也可以组合成一个大GPU来协力执行任务,能为单个应用提供最大化的性能,或支持不同内核运行独立的应用。VyWednc

VyWednc

VyWednc

BXE系列提供了主核-次核的扩展模式,这是一种面积优化的解决方案,通过单个GPU内核提供了高性能,同时利用Imagination的HyperLane技术进行多任务处理。VyWednc

BXS汽车GPU内核也利用了多主核可扩展的特性,支持性能扩展,以及跨多个内核进行安全检查,确保正确运行。VyWednc

值得注意的是,此次发布的B系列都给出了4核架构设计。Kristof Beets解释,“四核架构是根据我们的经验用户的反馈确定,4核架构是最能满足市场需求的性能和能效的平衡架构,未来会持续提升单核性能和拓展多核架构。我们有过最多14核的架构经验,多核对我们不是挑战。VyWednc

VyWednc

VyWednc

VyWednc

VyWednc

“需要看到,在服务器市场多核的拓展不是最重要的,而是机柜的拓展以及基于以太网的拓展。” Kristof Beets同时表示。VyWednc

33种配置,提升移动市场份额同时攻向桌面和云端市场VyWednc

Imagination显然希望通过4个系列,33种配置的GPU在保持移动市场竞争力的同时向更高性能的GPU市场拓展。VyWednc

数据显示,在GPU IP市场,Imagination的市场占有率最高,为35.5%,Arm以34.5%位列第二,高通拿下其余30%的市场份额。另外,在汽车GPU IP市场,Imagination的市场占有率更是高达43%。VyWednc

VyWednc

移动GPU IP市场占有率VyWednc

因此,面向移动设备,从入门级到高端B系列提供BXE、BXM和BXT三种选择。其中,BXE和BXM的性能和定位比较相似。Kristof Beets称:“这两个系列有非常紧密的联系,这两个系列的产品都对带宽和成本非常敏感,BXE更强调图形渲染能力,BXM兼具强图形渲染能力的同时又更大的浮点计算能力。”VyWednc

BXT不仅能够满足旗舰手机的需求,还能借助多核可扩展性进入桌面和云端市场。据悉,芯动科技已经将B系列BTX集成到能支持桌面和数据中心应用的PCI-E规格的GPU独立显卡芯片之中。VyWednc

芯动科技工程副总裁Roger Mao说:“我们即将推出一款高性能4K/8K图形 PCI-E Gen4 GPU独立显卡芯片;该独立显卡芯片将很快面市,将为未来5G云游戏和数据中心应用提供强大的支持。”VyWednc

VyWednc

为了更好地满足云端市场的需求,Imagination的GPU还能灵活的组合或拆分,在多实例环境也能提供硬件的虚拟功能,带来更好的灵活性和安全性。VyWednc

至于为何要为汽车市场专门推出BXS系列,David Harold表示,“这既是基于我们对汽车行业的了解,也是为了更好地满足汽车市场独特的需求。许多市面上的GPU IP并没有针对汽车市场做单独优化,这不仅在技术上不能很好地满足这一市场的需求,也不能让客户更快的通过汽车行业的相关认证。”VyWednc

“我们的BXS就是针对汽车市场需求的优化,不仅在性能特性上更符合汽车市场的需求,符合ISO 26262安全标准也能够帮助客户更快通过产品认证。” David Harold说:“BXS使用了RISC-V固件,这在业内还是首个,通过采用RISC-V我们也希望在汽车市场发现更多的机会。”VyWednc

多核架构带来的高性能,以及全面的可扩展组合,让Imagination的B系列可以应用于移动设备、消费类设备、物联网、微控制器、数字电视(DTV)和汽车等多个市场。但还有一个关键问题,核数增加带来的更多数据以及图像分辨率的增加,让带宽问题无法忽视。VyWednc

为此,B系列除了多核架构,还推出了一个重要的压缩技术IMGIC。IMGIC压缩技术可以提供四个等级,完全无所压缩以及压缩率分别为75%(质量接近完美)、50%(视觉无损)、25%(最节省带宽)的有损压缩。VyWednc

VyWednc

据悉,像采用4K显示屏、120Hz的刷新率的高端手机,读写速度接近8GB/s,使用IMGIC的无损模式,可在不影响质量的前提下降低到平均4GB/s;如果使用有损压缩,压缩率为75%、50%、25%时,带宽可分别降至6GB/s、4GB/s、2GB/s。VyWednc

光线追踪GPU明年上半年推出VyWednc

去年推出A系列GPU的时候,Imagination就透露其会在未来几年推支持光线追踪的产品。在B系列的发布会上,Kristof Beets进一步透露了Imagination的光线追踪进展。他说:“基于我们十年来对光线追踪的研究,我们认为光线追踪要到Level 4才能实现最好的用户体验、更高算力、更低带宽,可实现桌面级高效性能的提升。”VyWednc

VyWednc

所谓的Level4是Imagination对光线追踪的等级划分,为的是帮助业界更清晰地了解和比较各种光线追踪的差异,总共包含6个级别,Level4是硬件中的BVH处理和一致性排序功能。VyWednc

Kristof Beets透露,Imagination将在明年上半年正式推出Level 4光线追踪技术。VyWednc

Imagination的光线追踪技术会面向移动和桌面市场。目前Nvidia已经推出了支持光线追踪的桌面GPU,因此Imagination推出的光线追踪GPU在桌面市场能引发多大变化值得期待。另外,手机端没有实现对光线最终的支持,Imagination能否很好地解决移动端光线追踪的性能和能耗问题引发变革同样非常值得关注。VyWednc

小结VyWednc

对于Imagination而言,想要在IP市场的竞争中增强竞争力,自然需要保持并提升在移动市场和汽车GPU IP市场的市场占有率,同时向更多市场拓展。这也是为什么Imagination去年发布A系列GPU的时候表示接下来的B系列、C系列GPU会保持30%的性能提升。VyWednc

VyWednc

当然,为了更好地满足市场需求,Imagination也需要AI SYNERGY这样的协同技术,让其GPU不仅能处理图像,可能处理可编程的AI,还需要与AI加速器配合实现更好地AI性能。据透露,Imagination将在下月发布第四代神经网络加速器(NNA)产品。VyWednc

还有,在当下的国际局势下,中国市场也是Imagination很好的机会。David Harold表示Imagination没有在美国开发过任何一款IP,另外已经在上海和北京建立了研发机构。VyWednc

GPU、AI、无线连接都在发力的Imagination,能否成功破圈?VyWednc

  • 微信扫一扫
    一键转发
  • 最前沿的电子设计资讯
    请关注“电子技术设计微信公众号”
  • 商务部暂停天然砂对台湾地区出口,台积电难受了 据EDN电子技术设计了解,商务部网站8月3日早晨8点发布最新消息,表示将从即日起暂停天然砂对台湾地区出口。不少网友认为暂停天然砂对台湾地区的出口,此举将严重影响台湾的建筑业,实则影响不仅仅如此。台湾地区天然砂进口量的90%以上来自大陆,而台湾芯片占台湾2021年出口额的34.8%。网友称商务部暂停天然砂对台湾地区出口是捏到了台湾半导体制造业的七寸。
  • 美国参议院批准价值2460亿美元的芯片法案 美国参议院周三通过立法,以超过 750 亿美元支持国内半导体产业。GlobalFoundries、英特尔、三星代工厂、德州仪器、台积电和其他在美国建立半导体制造设施的公司或将受益。
  • 空调也“怕热”?空调工作临界点到底是什么? 深圳最高气温突破40℃!很多网友戏称:这条命是空调给的,不敢走出空调房。但同时,这两天明显感觉空调动力不足了,以为家里的空调坏了。与此同时,关于格力空调“怕热”遭遇“空调工作临界点”罢工的成了网友关注的热点。
  • 林志颖驾特斯拉出车祸:特斯拉回应起火原因不明,网友质疑 据EDN电子技术设计了解,7月22日上午10时50分左右,林志颖驾驶特斯拉Model X,在路口处掉头后加速向前行驶,但在前方道路分叉口处,因不明原因突然偏离车道自撞指示杆,整辆车陷入火海。此事引起网友关注热议,特斯拉客服表示,暂不清楚起火原因,但车身没有特别容易起火的材质。但有台媒指出,林志颖最爱特斯拉的自动驾驶功能,这也引起了网友对事故是否与自动驾驶有关的猜测。
  • 售价将超50万美元,乔布斯的Apple-1原型机电路板长什么 这块在 1976 年由史蒂夫-沃兹尼亚克手工焊接的 Apple Computer A 印刷电路板被史蒂夫-乔布斯用来向保罗-特雷尔演示 Apple-1 电脑,后者是加州山景城 The Byte Shop 的老板。这台原型机在“苹果车库”里保存了很多年,然后在大约 30 年前由史蒂夫-乔布斯交给了它现在的主人。当时,乔布斯已被苹果公司赶走。乔布斯当时认为这个原型不是要供奉的东西,而是要被重新利用的东西。
  • 利用反极性MOSFET帮助555振荡器忽略电源和温度变化 恒定频率振荡器是555定时器的经典应用之一。然而,由于所用二极管的特性不理想,占空比的间隔会随着温度和V+电源的变化而变化。本设计实例给出了一种解决方法:利用反极性P沟道MOSFET引导电容的充电电流而不产生任何明显压降。
  • 高通发布4nm骁龙W5+骁龙W5芯片,专为可穿戴设计 据EDN电子技术设计报道,高通7月20日正式发布了全新4nm制程的骁龙可穿戴平台W5 Gen1和骁龙W5+ Gen。与两年前的上一代产品骁龙wear 4100相比,骁龙W5与W5+采用了全新的命名方式,整体功耗降低超50%。SoC工艺从12nm提升到4nm,协处理器使用22nm制程工艺。
  • M2 Pro 和 M2 Max 或是苹果首款采用台积电3nm 工艺的 M1 Pro 和 M1 Max 最多可配置 10 核 CPU 和 32 核 GPU。借助 M2 Pro 和 M2 Max,Apple 有望突破这一门槛,为这两个领域带来更多的核心数量。目前M2 Pro相关的爆料很少,但据称M2 Max 有12 核 GPU 和 38 核 GPU。12 核 CPU 将包括 10 个性能核心和两个能效核心。
  • 华为鸿蒙3.0即将发布,首款新品是一款11英寸高端旗舰平 据EDN电子技术设计报道,终端官方微博昨天正式宣布,将于7月27日正式发布Harmony OS 3.0手机操作系统,新系统重点升级了流畅度、万物互联,以及鸿蒙车机等功能。此外,还将带来的首款新品:华为MatePad Pro 11,从宣传海报来看这是一款11英寸高端旗舰平板.
  • 中信拆了辆特斯拉Model 3,发现多个领域技术引领行业 EDN电子技术设计在6月底报道了海通国际手动拆解十万元的比亚迪“元”的详细拆解图,如今不到一个月的时间,中信证券微信公众号发表了一篇《从拆解Model 3看智能电动汽车发展趋势》的文章,文中称对特斯拉Model 3的E/E架构、三电、热管理、车身等进行了详细深入地分析,并坚定看好中国智能电动化发展趋势,引起了广泛关注。
  • 经典电子小制作项目:DS18B20制作的测温系统原程序原理 下面介绍的这款DS18B20制作的测温系统,测量的温度精度达到0.1度,测量的温度的范围在-20度到+50度之间,用4位数码管显示出来。DS18B20的外型与常用的三极管一模一样,用导线将JK—DS的DA端连到P3.1上。连接好DS18B20注意极性不要弄反,否则可能烧坏。
  • OPPO被曝测试240W快充,但实际速度不及vivo的200W 爆料称OPPO正在试产24V10A的240W充电器。对于采用双电芯三电荷泵设计的电池而言,其理论峰值功率可以达到300W,但目前的USB Type-C接口规范的最高功率为240W,OPPO这次一下子将C口快充做到了“天花板”级别。不过,OPPO和vivo不太一样,虽然前者测试的是240W快充,但充电策略偏向保守,实际速度可能不如vivo的200W。
广告
热门推荐
广告
广告
EE直播间
在线研讨会
广告
广告
面包芯语
广告
向右滑动:上一篇 向左滑动:下一篇 我知道了