广告

安谋科技:立足产业创新,构建多元化异构计算平台

2022-08-17 17:09:14 赵明灿 阅读:
异构计算平台是非常热的话题,那为什么要构建异构计算平台以及如何来构建异构计算平台呢?

异构计算平台是非常热的话题,那为什么要构建异构计算平台以及如何来构建异构计算平台呢?dwcednc

8月17日,在AspenCore旗下《EDN电子技术设计》、《EET电子工程专辑》和《ESM国际电子商情》三大媒体共同举办的“2022国际集成电路展览会暨研讨会(IIC)”南京站的“2022中国IC领袖峰会”上,安谋科技智能物联及汽车业务线负责人赵永超带来了“立足产业创新,构建多元化异构计算平台”主题演讲。dwcednc

dwcednc

赵永超表示,现在的技术发展越来越快,飞速发展的技术给我们的生活带来了非常大的便利性和高效性,同时飞速增长的技术也带来了非常大的技术成本的增加以及软件复杂度的增加。以汽车为例,如果是一辆量产的燃油车,它的技术成本大概在2000美元左右,其中软件大概占10%;混动的汽车技术成本大概在1.5万美元,其中软件成本在20%。未来,L5级别的自动驾驶汽车,它的技术成本则将达到将近4万美元,其中软件部分占50%。这样,技术成本及软件成本就将有非常大的提升,也就是说,技术的成本以及软件将会越来越重要,而且影响到了系统以及硬件的设计。dwcednc

现在在服务器市场基本都提到了软件定义硬件,其中的容器技术、虚拟化技术、微服务技术,带来了现在软件定义计算、软件定义网络、软件定义存储等,所有这些都是软件定义硬件带来的趋势。“未来软件定义不仅仅会从云,而且会发展到边缘,发展到端,其中一些关键技术,像功能安全的技术、时延技术、通信质量的技术,所有这些技术会使我们需要用软件去定义汽车、软件定义边缘、软件定义智能摄像头、软件定义IoT,所以软件带来的影响会影响到系统以及硬件设计。”赵永超谈到。dwcednc

场景化的软件提升了系统的碎片化以及复杂度。“其中交互性以及沉浸式体验让我们在硬件上不仅仅是GPU的任务。现在人工智能技术体现在各种应用中,不会一直是特殊化的技术,那么相应的安全技术和隐私管理也会带来硬件上相应技术的复杂度。对于我们来讲,要思考的就是不仅仅从IP角度来解决这样一个系统问题,更多要从场景化的角度来解决系统的性能功耗面积(PPA)的问题。”赵永超指出。dwcednc

dwcednc

但是场景化又非常的碎片化,有各种各样的场景需要我们思考,例如拍照优化的过程。这其中需要把原始图片最终进行虚化、超分,显示出我们关心的一部分高质量的图片。这其中需要用RGB图像深度抠图,做背景虚化,做超分处理。这背后的硬件上涉及到CPU和ISP协同,涉及到GPU和NPU的协同,整个过程涉及到了SOC中各个异构计算的协同和配合。dwcednc

对于越来越多复杂的碎片化的场景,怎么去满足这样一个硬件上的需求呢?“我们需要评估真实的需求。通常来讲,评估的时候考虑如何去评估性能的需求。当我们用手机打开一个游戏的时候,我们希望它能够非常快速的启动,这也就是我们对峰值性能有需求。同时,我们也希望手机不能够每时每刻或者非常频繁地去充电,这就是我们需要有持续性能的要求。现在在手机上面有各种各样多线程的应用在运行,所有这些都提升了场景化的复杂度。”赵永超介绍说。dwcednc

那么,是否能够用Benchmark去设计我们的产品和系统呢?赵永超认为:“非常通用的Benchmark是无法代表真实场景的。举个例子,我们现在在做自动驾驶场景的分析,进而设计我们的系统,优化我们的软件,但是我们能用一个赛道上简单的几辆车在运行的场景,看哪个车开得快就认为是真实的性能需求吗?显然不是这样。如果是一个真实的场景,就像城市里的交通一样,有交通指示、有人、有各种各样的物体、各种交互,真实的场景一定是非常复杂、交互更多的场景。所以,一个简单的Benchmark是无法代表真实场景进行系统设计的。”dwcednc

因此,就需要进行真实系统性能的评估。“对于安谋科技来讲,也需要思考不仅仅是从IP角度给我们的合作伙伴带来好处,更多的是怎么从真实场景上去把IP和IP的组合,把一个系统级给到客户而带来更多的好处。那么我们的IP需要通过软件,通过组合,给客户带来更好的性能,有了更好的Benchmark。那么我们开发的软件、物理库的产品就能够帮助客户产品达到最优化的面积以及最好的功耗。”赵永超指出。dwcednc

安谋科技在此提出了基于场景的分析办法,这也是基于Arm的分析方法。安谋科技认为,需要将客户关心的关键场景进行分析。“这其中有几个典型的应用,包括游戏、智能摄像头、编码、安全应用,我们根据关键的应用场景进行分类和提取,可以分化出CPU的工作量,GPU的工作量,NPU、VPU等异构核心的工作。我们有一个非常丰富的生态,可以从客户芯片中,从FPGA当中,软件栈中提取工作量的评估,进而得到性能模型和功耗模型进行进一步分析,通过对带宽、对功耗、对性能的分析达到最优化的系统设计,最终可以在RTL级别进行仿真,对前面做的评估进行优化。”赵永超介绍说。dwcednc

dwcednc

游戏,智能摄像头等典型的场景,都会用到很多复杂的异构模型。对于游戏场景,我们可能想到的是GPU场景,其实在评估游戏Benchmark的时候,还会有更多的复杂度需要我们去思考,比如在游戏里希望有更好的光照、更好的光影效果,包括最新的光线追踪技术,在后处理的时候需要有更多后处理的效果,希望游戏场景复杂度越真实越好,同时需要它有可靠的性能,比如现在游戏都能达到120fps的帧率。dwcednc

据介绍,通过Total Compute对系统级异构进行分析,用安谋科技的工具进行图像后处理分析,就可以分化出GPU和NPU工作量,包括光影效果。对于3D重构也可以计算出对CPU、GPU的工作量。还有ACL工具来评估各项,包括GPU、NPU,带宽延时的分析。dwcednc

dwcednc

“我们进行场景分析不是我们闭门造车自己做这样的系统,我们是跟客户一起,通过Total Compute来做场景分析,优化我们的系统,为我们的客户定制更好的解决方案,更能够满足复杂场景的技术方案。”赵永超指出,“在前期定义出客户关心的复杂场景,能够通过我们的软件工作对任务进行分析,包括搭建类似于IP精确模型的性能模型,可以通过全系统的性能模型去分析系统的工作量,客户的场景,通过系统分析,能够得到所需要的系统架构,得到整体的系统性能。在这个基础上可以提供SoC级别的Reference System,进一步跑系统,可以在FPGA上面重复认证刚才的真实场景,这样可以达到最优化的系统级的设计。”dwcednc

Arm平台包含开发工具,包括分析工具以及一个非常强大软件生态,可以提供各种各样相关的驱动、软件和分析工具。“我们有自己的物理库的产品,可以为CPU、GPU定制最优的PPA物理实现所需要的基础单元。我们有非常优秀的计算IP以及在行业里面引领相关的标准。所有这些,我们希望能够提供给客户最优的性能,满足客户真实的应用场景的设计。”赵永超说。dwcednc

整个异构计算有CPU和GPU,安谋科技已经完成完整异构计算IP核心矩阵。基于 Total Compute,安谋科技有CPU产品线、安全产品线、物理库产品线、NPU产品线,以及形成了星辰系列、山海系列、周易系列和玲珑系列产品。安谋科技和Arm产品形成了完整的Total Compute异构核心计算的矩阵。dwcednc

赵永超表示,Total Compute方法的提出,是能够跟客户一起真正的结合客户的应用分析出真实的需求,定义出真实有效高效的应用场景的系统设计和芯片设计。“Total Compute方案也得到了中国合作伙伴的深度参与,举个例子,就是腾讯游戏和我们一起通过Total Compute分析来提升腾讯游戏的游戏开发引擎。其中一项成果就是在内存带宽上面节省了30%。通过30%带宽的节省,其实对提升性能以及对减少功耗,以及对芯片的成本都是有非常大的提升。同时,腾讯游戏也大大增强了他们的游戏引擎的效果,”赵永超说。dwcednc

“安谋科技希望和客户一起成功。我们有一个完整的软件生态,有很多开源的软件,希望有一个完整的生态,使我们客户的产品更快的上市。Arm在做产品、做IP,都是以最高的标准来开发,能够满足市场上真正需求的特性来进行设计,能够给客户带来最大化的好处优势。同时,我们产品的成熟度以及软件应用,可以让客户更快的开发他们的产品,减少他们上市的风险。”dwcednc

Arm生态已经是世界上最大的计算生态,目前全球大概有70%的人口都在使用Arm技术,有超过530多个客户在设计Arm相关的SoC和相关产品。Arm截止到现在的出货量已经超过了2300亿,在2021财年出货量就超过了290亿。“我们希望通过Arm生态助力中国的IC产业,我们也欢迎越来越多的合作伙伴加入到Arm生态。”赵永超总结道。dwcednc

责编:Franklin
赵明灿
赵明灿是EDN China的产业分析师/技术编辑。他在电子行业拥有10多年的从业经验。在加入ASPENCORE之前,他曾在电源和智能电表等领域担任过4年的工程师。
  • 微信扫一扫
    一键转发
  • 最前沿的电子设计资讯
    请关注“电子技术设计微信公众号”
  • 为家用设备构建不间断电源 停电期间如何使用Wi-Fi和其他家用设备?可以使用汽车电池作为备用电源,设计家用不间断电源(UPS)。该电源连接至升降压转换器,产生稳定的12V/5A电源,用于为Wi-Fi路由器供电;连接至6.5V/1.5A降压转换器,则可为无线电话供电。
  • 谷歌与美国政府合作开发开源芯片 谷歌和美国商务部的国家标准与技术研究院 (NIST) 周三 签署了一项联合研发协议 ,根据该协议,谷歌将资助开源芯片的生产,这些芯片可供学术和小型企业研究人员用于构建各种的新兴应用。
  • 儿童电子学(五):生产清洁能源 宇宙充满了免费的能量。可悲的是,我们地球人却很乐意为开灯、启动汽车和使用电子设备所需的能量付费。说实话,宇宙是一个巨大的电池,可以以完全免费而又干净的方式产生不可估量的能量。应该让小朋友更加意识到这一点,因为使用清洁能源表明了人们的意识,并能为子孙后代享有更清洁的地球铺平道路。
  • 台积电2nm将于2025年量产,ASML高NA EUV芯片制造机2024 今日,台积电负责研发和技术的高级副总裁Y.J. Mii博士透露,台湾半导体制造公司(TSMC)将在2024年收购ASML的高NA EUV芯片制造机,目标是在2025年量产其2纳米(nm)半导体制造工艺。
  • 汽车创新成果促进独特驾驶体验 汽车行业是当今最令人兴奋和蓬勃发展的技术领域之一。随着众多创新技术逐渐走向成熟,未来的汽车架构和设计将会颠覆以往的经验。
  • 拆解电池供电的微型立体声功放(附原理图) 本文将对另一款神秘小设备进行拆解,那就是由四节AA电池供电的最简单的迷你立体声放大器。我之所以对它感兴趣,是因为一开始我甚至不知道这个小设备是什么,但打开外壳后,一切就豁然开朗了。
  • 苹果A16 Bionic架构优化,多核性能提高了14% 据EDN电子技术设计了解,苹果最新的A16 Bionic虽然使用与A15 Bionic相同数量的内核,但A16 Bionic在架构方面进行了优化。
  • 基于苹果A13仿生芯片,S8芯片配备与S6/S7相同CPU Apple Watch Series 6、Apple Watch Series 7、Apple Watch Series 8、Apple Watch Ultra和第二代Apple Watch SE都采用完全相同的CPU。
  • NOR闪存实现汽车和工业创新的安全性 随着人工智能技术的进步,机器设备被赋予越来越多的工作任务。特别是在汽车和工业应用中,传感器监控环境,然后系统利用算法解译传感器数据来得出结论。这些系统不仅需要正常工作以确保安全,还需要在每时每刻都做出正确的决定。现代NOR flash闪存可以帮助实现这一目标。
  • 利用可见光通信提高室内定位精度 在本文中,我们将探讨在建筑物内准确确定人员位置的好处,并讨论不同技术在室内定位系统(IPS)中的适用性。然后,我们会解释可见光通信(VLC)的概念,并展示如何用这种技术满足室内定位的精度要求。
  • 台积电:10美元的芯片可决定1.5亿美元光刻扫描仪“生死 台积电表示,商品芯片的短缺正在扰乱万亿美元的产业,如果你没有 10 美元的芯片,就无法出货 1.5 亿美元的光刻扫描仪。
  • 探究中芯7纳米芯片制造陷入困境的真相 日前,中芯国际(SMIC)掌握7纳米芯片制造技术的消息让不少人感到惊叹,该消息一度成为技术和商业媒体的头条新闻。中芯国际如何在其新开发的7纳米节点上量产芯片?中芯在美国实施的出口禁令下挺进7纳米制程,为此投入多少?
广告
热门推荐
广告
广告
EE直播间
在线研讨会
广告
广告
面包芯语
广告
向右滑动:上一篇 向左滑动:下一篇 我知道了