广告

Facebook研发新AI模型,动态人物视频也能造假

时间:2019-04-22 阅读:
Facebook提出了一个新的AI模型,这个模型可以对原始视频中的动态的角色进行定位和提取,提取后的角色可被开发者控制,并且添加上任意背景即可生成新视频。

近日Facebook发表了一篇关于从现实视频中提取角色的论文Vid2Game: Controllable Characters Extracted from Real-World Videos(Vid2Game:从真实世界视频中提取可控制的角色)。

在这篇论文中,Facebook提出了一个新的AI模型,这个模型可以对原始视频中的动态的角色进行定位和提取,提取后的角色可被开发者控制,并且添加上任意背景即可生成新视频。

一、AI如何将现实视频与游戏形象结合?

026ednc20190422

这个团队的方法依赖于两个神经网络,或者说是模仿生物神经元的数学函数层: Pose2Pose,一个将当前姿态和单一实例控制信号映射到下一个姿态的框架;Pose2Frame,将当前姿态和新姿态(以及给定的背景)一起放在输出帧上。这些操作可以由任何“低维”信号控制,比如来自操纵杆或键盘的信号。研究人员表示,该系统足够强大,可以在动态背景中定位提取图像,并将现有背景进行任意的更换,融合成新的图像后生成视频输出。

027ednc20190422

这种AI模型生成新的视频有两个具体步骤。首先,将包含一个或多个图像的输入视频输送到一个特定区域(如舞蹈)训练的Pose2Pose网络中,该网络将这些图像(加上预估的前景空间掩模)和它们的运动隔离开来,特定区域将作为它们质心的轨迹。(掩模用于确定哪些区域的背景被合成的图像信息所取代。)

然后,使用这些和组合而成数据,Pose2Frame将场景中与角色相关的变化(如阴影、被持有的物品和反射)和与角色无关的变化分开,最终可以形成任何想要的背景与动作的混合视频输出。

二、通过训练对比提取可控角色

为了训练这个AI系统,研究人员采集了三个视频,每个视频长度在5到8分钟之间。这三个视频分别为:一个网球运动员在户外、一个人在室内挥舞着剑、一个人在走路。

028028ednc20190422ednc20190422

研究人员报告说,将这三个视频与传输舞者三分钟视频的神经网络模型相比,他们的方法成功地对动态元素进行了对比,如其他人和摄像机角度的差异,以及角色服装和摄像机角度的变化。

研究人员在论文中写道:“每个网络都解决了之前未完全满足的计算问题,同时为生成具有逼真图形的视频游戏铺平了道路。此外,从类似YouTube的视频中提取的可控角色可以在虚拟世界和增强现实中找到自己的位置。”

三、利用AI系统优化游戏成为热潮

Facebook并不是唯一一家研究可能有助于游戏设计AI系统的公司。

初创AI技术公司Promethean AI利用机器学习帮助人类艺术家为视频游戏创作艺术形象,利用自动化省去重复的建模工作。

AI视觉计算公司Nvidia的研究人员最近有展示了一种可以使用视频片段创建虚拟环境的生成模型。

机器学习也被用来优化复古游戏中的旧游戏纹理,如《最终幻想VII”和“塞尔达传说:暮光公主》,以及在游戏《毁灭战士》中从零开始生成数千个关卡。

结语:AI技术成为行业新突破

AI已经被越来越广泛的应用到了各个领域,各行业都在利用AI技术寻找新的突破口。

在图像处理领域,AI图像技术正在帮助游戏行业优化或者开发更有趣的产品,并逐渐成为游戏行业竞争的又一个重要因素。

(原文来自:VentureBeat,智东西编译)

本文为EDN电子技术设计 原创文章,禁止转载。请尊重知识产权,违者本司保留追究责任的权利。
  • 微信扫一扫
    一键转发
  • 最前沿的电子设计资讯
    请关注“电子技术设计微信公众号”
您可能感兴趣的文章
  • 详解语音识别的技术原理:语音如何变为文字? 简要给大家介绍一下语音怎么变文字的吧。需要说明的是,这篇文章为了易读性而牺牲了严谨性,因此文中的很多表述实际上是不准确的。对于有兴趣深入了解的同学,本文的末尾推荐了几份进阶阅读材料。
  • AI、5G与自动驾驶等应用崛起,GDDR格局将如何变? GDDR长久以来主要用于为高阶PC提供显卡;如今,随着AI、5G与自动驾驶等应用崛起,GDDR开始袭卷更多讲究速度与效能的新用例…
  • 俄罗斯AI“变老”APP爆火,却被美国发布安全警告 年纪正好的时候你会想象自己老去的样子吗?最近陈伟霆就在微博上晒出了自己老去的样子,满脸皱纹。随后,李易峰、周杰伦也发布了自己老年照片。有很多娱乐媒体和粉丝认为他们是化了特效妆,但细心的EDN电子技术设计小编却发现,这两位的“老年照片”或许来自于一款正在西方社交媒体流行的AI“换脸”App。
  • 华为的“拍月亮专利”到底是不是P图? 华为P30 Pro拍摄的月球图片曾引起一大波,如今华为将拍月亮方法已经申请成了发明专利。这意味着,今后其它手机厂商用同样的方法和设备结构实现拍月亮,就要向华为支付专利费,否则就涉嫌侵权。
  • 英特尔发布AI芯片系统,比传统CPU快1000倍 英特尔发布了“ Pohoiki Beach ”神经拟态系统,该系统主要由64 颗 Loihi 神经拟态芯片构成,集成了 1320 亿个晶体管,总面积 3840 平方毫米,可处理深度学习任务,速度比CPU快1000倍,效率高10000倍,耗电量小100倍。
  • 占据5G技术创新的关键领域,ADI提前布局无线电子系统加 由于5G技术的大部分创新都发生在无线电子系统中,作为面向5G基础设施的射频和微波技术及系统设计的行业领导者,ADI将5G作为其多元化核心战略之一,与汽车无人驾驶、智慧医疗、能源、工业自动化一起列为ADI的五大核心战略。
相关推荐
    广告
    近期热点
    广告
    广告
    广告
    可能感兴趣的话题
    广告