广告

除了世界第一、千亿参数的盘古大模型,华为开发者大会还有哪些亮点?

2021-04-26 综合报道 阅读:
第一次与全国各大高校联办,连发六大创新产品及服务,全球最大、千亿参数,逼近人类神经元的华为云盘古大模型,向“沃土计划2.0”投入2.2亿美元,这届的华为开发者大会都有那些亮点?

华为开发者大会(Cloud)如期而至,但与往年不同的是,今年大会在深圳大学城设立主会场,此外,华为联合鲲鹏生态创新中心、华为云产业云创新中心和智能基座高校同步在全国36座城市,开设超过70个分会场。分享ICT技术在行业内的深度创新和最佳实践等话题,覆盖机器学习、深度学习、鲲鹏、昇腾、量子计算等热门领域。除主题演讲外,还有“扫地僧”见面会,以及面向高校的互动展区,参会者有机会与业界专家、华为科学家、“天才少年”等深入切磋。ioTednc

会上,余承东发布了6大创新产品及服务,包括华为云CCE Turbo云容器集群、CloudIDE智能编程助手、GaussDB(for openGauss)数据库、可信智能计算服务TICS、华为云盘古系列大模型(包含全球最大规模的中文NLP大模型及CV大模型等)、多样性计算基础软件。ioTednc

同时,华为宣布2021年将向“沃土计划2.0”投入2.2亿美元,包括发布“沃土云创”计划、以及鲲鹏众智计划和昇腾众智计划等。ioTednc

华为云盘古大模型:世界第一、千亿参数,逼近人类神经元

其名盘古,开天辟地。ioTednc

据介绍,盘古大模型横揽AI领域四大热门方向:ioTednc

  • 自然语言处理(NLP)大模型
  • 计算机视觉(CV)大模型
  • 多模态大模型
  • 科学计算大模型

华为云盘古大模型包括4大系列:ioTednc

  • 华为云盘古NLP大模型:是业界首个千亿参数中文语言预训练模型,预训练阶段学习了40TB中文文本数据,是最接近人类中文理解能力的AI大模型。
  • 华为云盘古CV大模型:是目前业界最大的视觉预训练模型,包含超过30亿参数。
  • 未来将持续推出多模态和科学计算大模型。

具体而言,盘古NLP大模型在权威的中文语言理解评测基准CLUE榜单中,总成绩及分类、阅读理解单项均排名第一,刷新三项榜单世界历史纪录,总成绩得分83.046。ioTednc

而盘古CV大模型,则在ImageNet 1%、10%数据集上的小样本分类精度上,达到了业界最高水平。ioTednc

ioTednc

盘古NLP大模型的三大突破ioTednc

盘古NLP大模型是全球最大的千亿参数中文语言预训练模型,由华为云、循环智能和鹏城实验室联合开发,预训练阶段学习了40TB中文文本数据,并通过行业数据的样本调优提升模型在场景中的应用性能。ioTednc

盘古NLP大模型在三个方面实现了突破性进展:ioTednc

第一,具备领先的语言理解和模型生成能力:在权威的中文语言理解评测基准CLUE榜单中,盘古NLP大模型在总排行榜及分类、阅读理解单项均排名第一,刷新三项榜单世界历史纪录;总排行榜得分83.046,多项子任务得分业界领先, 向人类水平(85.61)迈进了一大步。ioTednc

ioTednc

盘古NLP大模型位列CLUE榜单总排行榜第一ioTednc

在NLPCC2018文本摘要任务中,盘古NLP大模型取得了Rouge平均分0.53的业界最佳成绩,超越第二名百分之六十。ioTednc

第二,盘古NLP大模型在预训练阶段沉淀了大量的通用知识,既能做理解又能做生成。除了能像GPT-3等仅基于端到端生成的方式以外,大模型还可以通过少样本学习对意图进行识别,转化为知识库和数据库查询。通过功能的模块化组合支持行业知识库和数据库的嵌入,进而对接行业经验,使能全场景的快速适配与扩展。比如在华为云和循环智能合作构建的金融客服场景中,盘古NLP大模型能更好地赋能销售环节,帮助服务人员快速提升业务水平,重塑消费者体验。ioTednc

第三,盘古NLP大模型采用大模型小样本调优的路线,实现了小样本学习任务上超越GPT系列。比如在客户需求分析场景中,使用盘古NLP大模型生产语义标签时,得到目标结果所需的样本量仅为GPT系列模型的十分之一,即AI生产效率可提升十倍。ioTednc

30亿参数,全球最大视觉预训练模型ioTednc

盘古CV大模型是目前业界最大的视觉预训练模型,包含超过30亿参数。盘古CV大模型首次兼顾了图像判别与生成能力,从而能够同时满足底层图像处理与高层语义理解需求,同时能够方便融合行业知识微调,快速适配各种下游任务。盘古CV大模型性能表现优异,在ImageNet 1%、10%数据集上的小样本分类精度上均达到目前业界最高水平(SOTA)。ioTednc

盘古CV大模型致力于解决AI工程难以泛化和复制的问题,开创AI开发工业化新模式,大大节约研发成本。此外,盘古CV大模型提供模型预训练、微调、部署和迭代的功能,形成了AI开发完整闭环,极大提升AI开发效率。目前,盘古CV大模型已经在医学影像、金融、工业质检等100余项实际任务中得到了验证,不仅大幅提升了业务测试精度,还能平均节约90%以上的研发成本。ioTednc

华为云盘古大模型,是如何炼成的?ioTednc

左手CANN算子,右手MindSpore框架,主要依托的便是这两大“基本功”。ioTednc

CANN是华为推出的异构计算架构,2018年推出1.0版本至今,已经迭代到了3.0版本。ioTednc

目前不仅使用于推理、训练场景,还能够实现“端边云协同”。这就意味着不必在不同的终端,再去开发不同的算子,大大提高了效率。ioTednc

例如基于CANN,就能让ResNet-50模型的训练时间降低到28s。ioTednc

MindSpore则是华为于2019年推出的全场景AI计算框架,其中的一大特色,就是具有全自动混合并行方案。ioTednc

而华为云盘古大模型,基于二者之外,还融合了三种并行技术:模型并行、数据并行和流水线并行。ioTednc

如此一来,开发者就只需要编写单机算法代码、添加少量并行标签,就可以实现模型训练的自动切分。ioTednc

举个实战例子,用盘古训练超大模型静态图,性能直接提升了40%之多!ioTednc

向“沃土计划2.0”投入2.2亿美元

同时,华为宣布2021年将向“沃土计划2.0”投入2.2亿美元,包括发布“沃土云创”计划、以及鲲鹏众智计划和昇腾众智计划等。ioTednc

华为Cloud BU总裁、华为消费者云服务总裁张平安表示,华为云沃土云创计划将投入1亿美元,重点赋能SaaS和ISV伙伴,提供云资源、技术赋能和商业推广支持,覆盖容器/微服务、SaaS化、大数据、AI、视频、智能边缘等6大技术领域。ioTednc

华为云最早在2015年提出了“沃土计划”,并在2019年发布了“沃土计划2.0”,华为坚持“硬件开放、软件开源、使能伙伴、发展人才”,推动产业繁荣发展。ioTednc

截至目前,围绕华为云、鲲鹏、昇腾累计发展了240万名开发人员。ioTednc

数据显示,华为云所保持的增速高达168%,而且已经连续四个季度位居中国公有云服务市场第二。4月21日,在国际知名研究机构Gartner的报告中指出:2020年,华为云全球IaaS市场排名上升至中国前二、全球前五,主流厂商增速最快,成为全球五朵云之一。ioTednc

伙伴基于鲲鹏主板的产品发货量达到2020年总量的52%。ioTednc

围绕操作系统、数据库、AI框架等技术,建设了openEuler、openGauss和MindSpore三大开源社区,如今已初具规模。ioTednc

2020年,华为在沃土计划2.0计划上,总投入已经达到了2亿美元 (约13亿人民币)的规模。ioTednc

另外,华为与中国教育部合作,共同建设“智能基座”产教融合协同育人基地,如今已经与72所高校开展合作,累计开设1000多门课程,培养了1500多名教师,计划5年培养300万高校开发者。ioTednc

第一次与全国各大高校联办

值得一提的是,今年这届的华为开发者大会有一个非常鲜明的特色:第一次与全国各大高校联办。ioTednc

不仅一改以往办会地址,将主会场放到了深圳大学城之中与此同时,还设置了超过20所中国985/211高校分会场。ioTednc

这也不难从侧面反映出华为云对开发者(尤其高校)的重视。ioTednc

而且从此次大会的议程设置方面,也能体现这一点:ioTednc

1场Keynote、10场峰会、70+场扫地僧见面会、100+场专题演讲、40+场开发者训练营……ioTednc

完完全全就是围绕“开发者”而展开。ioTednc

毕竟,华为云认为“每一个开发者都了不起”:ioTednc

在数字时代,开发者就是时代的弄潮儿,是改变世界的力量,更是企业创新的动力和产业的灵魂。ioTednc

余承东演讲全文:

各位来宾,各位开发者朋友,大家早上好,欢迎参加我们的开发者大会。借此机会也特别感谢深圳市政府、深圳大学城提供这么好的场地。希望大家这几天能够在青春、美丽的大学城,开启一段难忘的旅程。ioTednc

我们也在全球40座城市的华为云、鲲鹏、昇腾创新中心和高校,开设了超过70个分会场,线上同步直播,欢迎全球开发者一起参加这场年度盛会。ioTednc

因为有你,虽然艰难 但仍昂首向前

2020年在十分困难的情况下,华为云逆风飞翔。感谢全球超过20000家合作伙伴,超过240万开发者的支持。因为有你,虽然艰难,但我们仍昂首向前。谢谢大家!ioTednc

在市场进展上,鲲鹏/昇腾增长了六倍,存储也继续位居中国市场份额第一、全球前四。华为云继续保持全球主流云服务厂商中的最高增速(168%)。Gartner公有云全球IaaS市场报告显示,2020年,华为云全球IaaS市场排名上升至中国前二、全球前五,成为全球五朵云之一ioTednc

华为云:做智能世界的黑土地

华为云的战略是做智能世界的黑土地,致力于为开发者打造最佳应用构建平台,让应用茁壮成长。ioTednc

坚持云优先,优先选择用云方式为客户提供IT基础平台服务,具体来说就是云解决方案优先、云服务商业模式优先、云伙伴优先。ioTednc

持续聚焦系统和架构创新,强化软件,让黑土地更肥沃。ioTednc

全力支持开发者基于“黑土地”构建面向千行百业的应用。ioTednc

根植沃土 每一个开发者都能了不起

根植华为云的黑土地,每一个开发者都能了不起。ioTednc

基于华为云ModelArts平台,西安交通大学第一附属医院的开发者,用AI筛选超级抗菌药,有望解决广谱抗菌药物研发的世界难题。ioTednc

基于华为云AI技术,哈尔滨亿时代数码科技的开发者,开发了“畅听无碍”应用,让2780万听障人士沟通更容易。ioTednc

云是ICT产业的未来 企业数字化转型的底座

全面云化已不可阻挡,云一定是ICT产业的未来,是每一个企业数字化转型的底座。ioTednc

到2025年,全球企业云技术使用率将达100%;Gartner预测企业传统数据中心将关闭90%。所以,云一定是未来的趋势。ioTednc

没有云原生 就没有真正的数字化和智能化

《经济学家》杂志曾经评价说“没有集装箱,就没有全球化”。同样,没有云原生,就没有真正的数字化和智能化。ioTednc

华为流程IT全面运用云原生技术,新应用100%采用容器,研发系统部署和资源使用率提升10倍以上。预计到2023年,云原生应用占比将达80%。ioTednc

AI已成为新的生产力 全面进入企业的生产系统和作业流程

2018年,华为成立AI使能部,每年投入十亿美金,当前已在所有主业务流程和场景应用。2025年,大企业AI使用率将达97%,企业生产流程AI的使用率也将达到75%。ioTednc

举个例子,华为每年交付站点300多万,超过5000万安装项需要验收。过去需要分批上站,多次检查,费时费力。引入AI后,单站点验收效率提升8倍,年节约成本超过60亿人民币。ioTednc

千行百业加速智能升级 迈向全场景智慧

去年华为全联接大会,我们发布了政企智能升级参考架构:智能体。ioTednc

在智能升级的过程中,我们认为有三大趋势:ioTednc

应用现代化:应用的架构、开发和运营全面现代化。ioTednc

数据资产化:数据从资源变为资产,实现数据驱动。ioTednc

AI工业化:让AI可以真正普惠千行百业,成为新生产力。ioTednc

发布6大创新技术 帮助开发者抓住智能升级的黄金机会

为了帮助开发者抓住智能升级的黄金机会,今天我们带来6大创新技术发布:ioTednc

ioTednc

1.云基础设施——华为云CCE TurboioTednc

以容器为核心的云原生基础设施,不仅让资源利用率更高,还能解放运维人员,聚焦应用和业务创新。但是,容器的规模化应用,也对性能、弹性、调度能力提出了更高要求。ioTednc

没有容器化,就没有应用现代化。以容器为核心的云原生基础设施,不仅提供更高效的资源,还能把开发运维人员从资源的调配和运维中解放出来,聚焦于应用和业务创新。容器全面规模化应用的同时也对性能、弹性、调度能力提出了更高的要求。ioTednc

今天我们带来一款革命性的容器集群——华为云CCE Turbo。ioTednc

ioTednc

华为云CCE Turbo容器集群在计算、网络和调度上全方位加速,让容器真正成为企业应用创新的强劲引擎。ioTednc

计算加速:业界独家实现容器100%卸载,让VIPKID音视频服务性能提升40%,在线课堂零卡顿。ioTednc

网络加速:独创容器直通网络,两层网络变一层,实现秒级扩容千个容器,业界最高,帮助新浪平稳应对每一次热点事件。ioTednc

调度加速:感知AI、大数据、Web等不同应用特征,实现混合业务智能调度,让美图容器集群资源利用率提升40%。ioTednc

2.应用使能——华为云CloudIDEioTednc

二十几年前,我加入华为的第一份工作就是写代码,搞开发。相信每一个开发者都有一个梦想,能否有个开发工具,让程序自己写程序?今天很高兴,梦想成为现实。ioTednc

华为云CloudIDE是为开发者而生的智能编程助手,可以为开发者提供轻量、随时随地的在线智能编程体验。ioTednc

ioTednc

基于智能代码补全技术,华为云CloudIDE可以找到所有的补全结果,大幅提升代码的准确性;其次,支持复杂上下文进行补全;第三,避免推荐过期、弃用、危险的API。华为云CloudIDE,让代码更健壮、更安全。ioTednc

3.数据使能——华为云GaussDB(for openGauss)ioTednc

企业上云,实现数据驱动,核心是数据库上云。为了帮助企业开发者更好的应对几何级增长的数据规模和数据流量洪峰,让业务“始终在线”无中断,今天,我们正式发布企业核心数据上云的信赖之选——华为云GaussDB(foropenGauss)数据库。ioTednc

ioTednc

它经受了金融业务全场景的严苛考验,在性能、可用性、弹性方面全面提升:ioTednc

高性能:交易型事务处理能力比友商高出54%,复杂查询时延比友商低82%。ioTednc

高弹性:面对流量洪峰,可实现秒级扩容,业务无感。ioTednc

高可用:单点故障10秒内切换,只有友商不到三分之一的时间。举个例子,在工商银行,GaussDB已全面应用到A类到D类全场景业务,稳定服务于上亿用户。ioTednc

4. 数据使能——TICS可信智能计算服务ioTednc

数据作为关键生产要素,一定要流动才能发挥更大的价值。释放数据价值的关键是可信安全流通,但开放难、共享难、流通难是亟需解决的三大挑战。ioTednc

今天,我们发布TICS可信智能计算服务,使能数据可信流通,安全释放数据价值。ioTednc

ioTednc

它具有以下三大特性:ioTednc

基于多方数据联邦探查和建模,让隐私数据不出域,可用不可见。ioTednc

通过联邦AI算法和同态加密算法协同,实现模型批量计算,训练性能提升10倍,无须加速卡,也能大幅提升计算性能。ioTednc

支持主流大数据源,无须转换即可适配。ioTednc

5. AI使能——华为云盘古大模型ioTednc

今天的AI开发仍处于作坊式,我们认为,未来的AI开发必须告别作坊式,走向工业化、通用化。ioTednc

过去的4年,围绕华为AI战略,我们推出了华为云EI、HiAI能力开放平台、昇腾处理器、全场景AI计算框架MindSpore、Atlas 900集群等一系列全球领先的产品和服务。ioTednc

今天,华为全栈全场景AI解决方案迎来一款在AI产业界非常、非常、非常震撼的产品——华为云盘古大模型ioTednc

ioTednc

它具备极强的泛化能力,一个模型适用大量复杂行业场景,少量样本也能达到高精度;基于预训练+下游微调的工业化AI开发模式,让全球领先的AI真正进入千行百业。ioTednc

华为云盘古大模型包括4大系列:业界首个千亿级生成与理解中文NLP大模型、业界最大的CV大模型,未来我们将持续推出多模态和科学计算大模型。ioTednc

华为云盘古NLP大模型在中文语言理解测评中,在总榜、分类榜、阅读理解榜获得三项第一,大幅刷新业界纪录。总排行榜领先第二名1分,这是什么概念?就如同百米赛跑的世界纪录,每次0.01秒的突破,都是在超越极限。ioTednc

ioTednc

6.计算基础软件持续创新,使能多样性算力ioTednc

根深方能叶茂,云的创新离不开操作系统、数据库、中间件等基础软件根技术的支撑。如果说处理器是计算产业的“心”,基础软件就是计算产业的“魂”。ioTednc

ioTednc

我们会坚定不移的,在操作系统、数据库、AI计算框架等全套计算基础软件栈上持续投入,使能多样性算力,支撑华为云的产品和服务创新。ioTednc

创新无止境,让黑土地更肥沃ioTednc

与开发者一样,创新一直是华为的DNA,华为公司的成长史就是一部创新史。开放华为三十多年积累的创新能力,华为云持续投入,不断进步,为开发者提供更加肥沃的黑土地。ioTednc

今天,我们发布6大创新技术,希望能够帮助开发者抓住智能升级的黄金机会,站在华为的肩膀上创造未来。ioTednc

最强的智,是众智;最大的力,是合力。每一个开发者,都在创造一往无前的奔腾时代。世界有你,了不起!ioTednc

责编:DemiioTednc

本文为EDN电子技术设计 原创文章,禁止转载。请尊重知识产权,违者本司保留追究责任的权利。
  • 微信扫一扫
    一键转发
  • 最前沿的电子设计资讯
    请关注“电子技术设计微信公众号”
广告
热门推荐
广告
广告
EE直播间
在线研讨会
广告
广告
面包芯语
广告
向右滑动:上一篇 向左滑动:下一篇 我知道了