广告

5G时代都在说自由交互视频,这项技术难在哪里?

2020-08-06 16:42:56 李冰 阅读:
交互式视频技术,是随着网络传输速度的提升以及多媒体技术的成熟,经由各种技术手段融入产生的一种新型体验视频。而当5G时代来临,交互式视频是否会成为下一代黑科技,令业界关注。

交互式视频技术,是随着网络传输速度的提升以及多媒体技术的成熟,经由各种技术手段融入产生的一种新型体验视频。而当5G时代来临,交互式视频是否会成为下一代黑科技,令业界关注。pS7ednc

北京大学深圳研究生院教授王荣刚在今日举行的“第二届(2020)国际电子产业链资源对接大会”AI技术分论坛上,以“自由交互视频技术及其商业前景”为主题进行了解析。pS7ednc

pS7ednc

技术不断演进,沉浸视频时代来临

回顾视频技术的发展,从标清、高清、超高清,到如今的虚拟现实,视频需求从以前的看得见,到现在的看得清、看得真。尤其是现下5G非常火,带动了超高清视频的发展。我们把超高清视频和虚拟现实视频通称为沉浸式视频。pS7ednc

沉浸视频带给用户更好“临场感”的视频,这其中的要素有:分辨率、帧率、动态范围、视野范围,和一个提及较少的交互性。直到现在为止,大家看到的视频是被动接收的,导演给什么视角观众看到的就是什么视角,观众无法切换,这就是缺乏交互性的直接体现。pS7ednc

按照交互性,可以将现在的主流视频形式分为三种不同的形态:pS7ednc

1.  零自由度沉浸视频:超高清视频。无论是4K还是8K,它依旧是完全被动的,只是清晰度提高了而已,这是零自由度,没有交互性。pS7ednc

2.  三自由度沉浸视频:全景视频。典型的是大家熟知的VR视频,用户戴上VR头盔,随着头部的转动有相应的内容呈现,让人感觉身临其境,但这个自由度只是在三个方向上的转动,如果用户走动/移动,视频是不会发生改变的,这个时候自由度受限,所以叫三自由度。pS7ednc

3.  六自由度沉浸视频:自由交互视频。与三自由度相比添加了移动时视频的改变,这就是更高级的交互,真正的使人有身临其境的感觉。pS7ednc

视频技术发展的两大挑战

1. 网络传输带宽不足

目前家庭网络或是4G网络,稳定的传输带宽大概20兆左右,待到5G用到家庭,稳定的传输量在100兆左右,即使这样,传输自由沉浸视频还是非常有难度的。pS7ednc

2. 实时处理困难

另外一个困难是实时处理的困难,巨大的数据量要在一秒钟处理上百帧,这个难度是非常大的,现在的算力完全不匹配。pS7ednc

编码复杂度:编码算法复杂度 x 数据通量

计算挑战是由两个维度共同叠加造成的。一方面,数据通量爆炸了,比以前增加了十倍、上百倍;另一方面,编码算法的复杂度也增加了十倍,这样一叠加就不得了了,就是上万倍了,这个挑战是非常大的。pS7ednc

(1)编码标准演进:目前进入第4代标准制定周期

每次标准迭代编码算法的复杂度都上升一个数量级:视频编码标准的演进,目前差不多演进了四代,第一代是以MPEG-2为代表的标清时代,再后来是H.264为代表的高清,现在是H. 265和AVS2为代表的4K时代,以及H.266和AVS3为代表的8K时代。每个时代都有不同的压缩标准,每一代压缩标准比前一代差不多提升了一倍,压缩效率提升一倍的代价是计算效率增加十倍。pS7ednc

(2)数据通量爆炸,我们的数据量增加了十倍、上百倍

4K视频:pS7ednc

3840 x 2160 x 50 x 15 = 6.2 GbpspS7ednc

8K视频:pS7ednc

7680 x 4320 x 120 x 18 = 71.6 GbpspS7ednc

全景视频上限:pS7ednc

360 x 60 x 180 x 60 x 120  x  18 = 500 Gbps!pS7ednc

自由视点视频:pS7ednc

?…pS7ednc

从高清到超高清,最核心的挑战来自于数据通量的爆炸。以4K为例,他的数据量差不多是高清的十倍。除了水平垂直分辨率各增加两倍以外,实际上在帧率也增加了两倍,动态范围也增加了,原始的数据量6G/秒,8K视频不是比4K视频增长4倍而是10倍。VR视频上限是500G,很多人体验过VR视频,都感觉颗粒感很强,为什么呢?因为那个分辨率远远不够,要是VR视频的上限,到22K的分辨率才行,22K的分辨率对应到一秒的数据量有500G。自由视点视频比VR视频更高级,这个数据量就更加庞大了,这个数据通量是不得了的,即使5G也无法传输原始数据量,一定要经过压缩。pS7ednc

视频技术不断演进,很重要的驱动力是不断的提升清晰度,让大家有临场感。但人眼视网膜分辨率的上线是有固定的指标,所以对于清晰度瓶颈,王荣刚先生认为,单视点清晰度已饱和,8K其实是个伪命题,分辨率已经饱和了,下一步视频技术的演进一定不是在分辨率上,而是往其他的纬度演进,目前往交互性上转VR已经是一种转变。pS7ednc

如何实现自由交互视频?

VR全景视频是以用户为中心的360度视觉范围内的视频信息。自由交互视频技术,是在VR视频的基础上再往前走一步,允许用户移动,VR只是转动(头部),而自由交互是六自由度,也就是从3DoF交互到6DoF交互。pS7ednc

要实现这个技术有很多路线:pS7ednc

光场技术,可以看成以三维空间任意点为中心的无数全景视频。理解为无数的球面视频,每个球面视频有一个中心,那个中心可以认为是空间任何一个坐标,这样可以做到往哪儿移动都可以看到不同的画面,很显然这个数据量不得了,目前来说不太现实,距离应用还比较遥远。pS7ednc

点云,将现实场景每个三维点视觉和空间信息全部创建出来。即将三维空间每个点的视频信息呈现出来,用点云表现出来,生成点云的过程就是一个挑战,即使有点云,点也是离散的点,弄在一起再渲染就不太自然,这种路线也不是很靠谱。pS7ednc

多视点方案,这是相对比较实际的。方案基于多视⻆信息估计场景三维信息,基于场景三维信息合成任意虚拟视点。通过特殊布局的摄像机阵列,三维场景拍摄下来,把空间里的三维信息勾勒出基本的结构,有了这个结构,用户可以移动到任何的视角,移动到某一个视角再基于重建的三维信息对这个进行渲染。这个方案优势在于数据量没那么大,同时他渲染出的画面通过DR、UR渲染出的画面还是比较逼真的,这种路线相对比较可行。pS7ednc

关键技术:AI深度估计

多个摄像机,最难的一点是如何用摄像机组建出来,这就运用到了AI深度估计技术,传统用图像处理的方法做点看点是否匹配,也存在计算速度和计算精度不够的问题,基于深度学习的技术可以把精度和细度做到非常快,可以做到实时。多视点的信息和场景的深度信息拼接到一起,构成人个视点的信息。pS7ednc

结语

有了自由交互视频技术,我们看传统视频,不再是被动的看单一的视角,如果我们对某一个时刻精彩瞬间非常感兴趣,可以把它停下来,用屏交互看任意视点的信息,可以做缩放,也可以做移动,也可以做转动。pS7ednc

未来,自由交互将会有更多应用场景,例如体育比赛和演出、医疗手术直播、工业互联网、设备监测等等,并有希望成为5G时代的杀手级应用之一。pS7ednc

本文为电子技术设计原创文章,未经授权禁止转载。请尊重知识产权,违者本司保留追究责任的权利。
  • 微信扫一扫
    一键转发
  • 最前沿的电子设计资讯
    请关注“电子技术设计微信公众号”
  • 苹果将终止自研5G基带芯片,仍要继续依赖高通 据报道,苹果将停止内部 5G 调制解调器的开发,并可能继续依赖高通。根据一份新报告,苹果似乎远未实现其目标,因为它已决定停止开发内部 5G 调制解调器。这些报道现阶段尚未得到证实,但多个消息来源报道了类似的情况。
  • 爱立信推出基于“Intel 4”工艺的处理器,甚至领先于英 爱立信在其新闻稿中指出,与上一代相比,新的 RAN 处理器 6672 和无线电处理器 6372 的容量增加了四倍,效率提高了一倍。他们声称,Intel 4上的新处理器的功耗比行业基准低30%到60%。
  • 5G和天线模块的演变 新的5G用例和功能改变了5G天线模块的格局,使其从智能手机和平板电脑中使用的专用、通常是定制设计和开发的便携式移动设备硬件,转变为集成到传感器平台、自主移动机器人(AMR)、工业控制设备、增强现实/虚拟现实(AR/VR)头戴设备/系统以及汽车平台中的物联网模块···
  • Diodes公司的低功耗1.8V、2.5Gbps、双数据通道ReDrive Diodes推出一款低功耗、高性能且符合MIPI D-PHY 1.2协议的信号ReDriver。
  • 苹果Vision Pro即将量产,华为也将推出麒麟芯竞品? 华为其实很早也开始了在XR领域的布局,华为的AR Engine早在汽车、手机等设备上进行了广泛的应用,截至今年十月,AR Engine的安装量已经达到了21亿次,接入的应用数量超过了4100款···
  • 苹果仍未修复该漏洞,利用蓝牙弹窗能将iPhone“爆破” 黑客可以将Flipper Zero编程为苹果官方蓝牙配件,比如伪装成AirPods,然后利用Flipper Zero中的代码强制设备重复发送配对信号,让附近所有的苹果设备不停地显示设备连接弹窗,完全无法使用,最终死机重启···
  • 一文带您揭秘边缘安全 本文将探讨边缘计算如何加固物联网设备,防止安全漏洞,介绍边缘安全的机制,同时阐明现代技术、行业的最佳实践和实际应用···
  • 苹果自研5G调制解调器再次推迟发布时间 据EDN电子技术设计报道,苹果自研5G调制解调器再次受阻,发布时间表已推迟到 2025 年底或 2026 年初。一名苹果员工告诉Mark Gurman:“为什么我们认为我们可以从英特尔那里继承一个失败的项目并以某种方式取得成功,这是一个谜。” 
  • QSPICE:交流分析(第6部分) 交流分析仿真是一种用于在频域中分析电路行为的技术···
  • 韩国制定了针对6G候选频段的电磁波测量标准 6G 使用的频率范围尚未确定。然而,高频范围被认为适合大容量数据的快速传输,因为频率范围越高,通常通信带宽越宽。这类似于16车道道路比两车道道路能够处理更多交通的情况。D频段频率对应于高频段中的亚太赫兹范围,作为6G的候选频率而受到关注。
  • 5G明明比4G更耗电,为什么一定要取消5G信号切换开关? 目前如vivo、OPPO、小米等国产手机厂商均已取消5G开关。有厂商相关负责人表示,为确保用户更方便体验5G网络,应运营商统一要求,部分机型的5G开关确实被取消(隐藏)···
  • 拆解华为Mate 60 Pro:47%是中国产零部件 Mate 60 Pro 零部件的总成本为 422 美元。就国家份额而言,中国领先,占 47%。这家中国智能手机制造商的国产零部件比例比 2020 年秋季推出的同价位 Mate 40 Pro 上升了 18 个百分点,当时美国制裁的影响仍然有限。
广告
热门推荐
广告
广告
EE直播间
在线研讨会
广告
广告
面包芯语
广告
向右滑动:上一篇 向左滑动:下一篇 我知道了