5G时代都在说自由交互视频，这项技术难在哪里？-EDN 电子技术设计

 交互式视频技术，是随着网络传输速度的提升以及多媒体技术的成熟，经由各种技术手段融入产生的一种新型体验视频。而当5G时代来临，交互式视频是否会成为下一代黑科技，令业界关注。

交互式视频技术，是随着网络传输速度的提升以及多媒体技术的成熟，经由各种技术手段融入产生的一种新型体验视频。而当5G时代来临，交互式视频是否会成为下一代黑科技，令业界关注。rVzednc

北京大学深圳研究生院教授王荣刚在今日举行的“第二届(2020)国际电子产业链资源对接大会”AI技术分论坛上，以“自由交互视频技术及其商业前景”为主题进行了解析。rVzednc

rVzednc

技术不断演进，沉浸视频时代来临

回顾视频技术的发展，从标清、高清、超高清，到如今的虚拟现实，视频需求从以前的看得见，到现在的看得清、看得真。尤其是现下5G非常火，带动了超高清视频的发展。我们把超高清视频和虚拟现实视频通称为沉浸式视频。rVzednc

沉浸视频带给用户更好“临场感”的视频，这其中的要素有：分辨率、帧率、动态范围、视野范围，和一个提及较少的交互性。直到现在为止，大家看到的视频是被动接收的，导演给什么视角观众看到的就是什么视角，观众无法切换，这就是缺乏交互性的直接体现。rVzednc

按照交互性，可以将现在的主流视频形式分为三种不同的形态：rVzednc

1. 零自由度沉浸视频：超高清视频。无论是4K还是8K，它依旧是完全被动的，只是清晰度提高了而已，这是零自由度，没有交互性。rVzednc

2. 三自由度沉浸视频：全景视频。典型的是大家熟知的VR视频，用户戴上VR头盔，随着头部的转动有相应的内容呈现，让人感觉身临其境，但这个自由度只是在三个方向上的转动，如果用户走动/移动，视频是不会发生改变的，这个时候自由度受限，所以叫三自由度。rVzednc

3. 六自由度沉浸视频：自由交互视频。与三自由度相比添加了移动时视频的改变，这就是更高级的交互，真正的使人有身临其境的感觉。rVzednc

视频技术发展的两大挑战

1. 网络传输带宽不足

目前家庭网络或是4G网络，稳定的传输带宽大概20兆左右，待到5G用到家庭，稳定的传输量在100兆左右，即使这样，传输自由沉浸视频还是非常有难度的。rVzednc

2. 实时处理困难

另外一个困难是实时处理的困难，巨大的数据量要在一秒钟处理上百帧，这个难度是非常大的，现在的算力完全不匹配。rVzednc

编码复杂度：编码算法复杂度 x 数据通量

计算挑战是由两个维度共同叠加造成的。一方面，数据通量爆炸了，比以前增加了十倍、上百倍；另一方面，编码算法的复杂度也增加了十倍，这样一叠加就不得了了，就是上万倍了，这个挑战是非常大的。rVzednc

（1）编码标准演进：目前进入第4代标准制定周期

每次标准迭代编码算法的复杂度都上升一个数量级：视频编码标准的演进，目前差不多演进了四代，第一代是以MPEG-2为代表的标清时代，再后来是H.264为代表的高清，现在是H. 265和AVS2为代表的4K时代，以及H.266和AVS3为代表的8K时代。每个时代都有不同的压缩标准，每一代压缩标准比前一代差不多提升了一倍，压缩效率提升一倍的代价是计算效率增加十倍。rVzednc

（2）数据通量爆炸，我们的数据量增加了十倍、上百倍

4K视频：rVzednc

3840 x 2160 x 50 x 15 = 6.2 GbpsrVzednc

8K视频：rVzednc

7680 x 4320 x 120 x 18 = 71.6 GbpsrVzednc

全景视频上限：rVzednc

360 x 60 x 180 x 60 x 120 x 18 = 500 Gbps！rVzednc

自由视点视频：rVzednc

？…rVzednc

从高清到超高清，最核心的挑战来自于数据通量的爆炸。以4K为例，他的数据量差不多是高清的十倍。除了水平垂直分辨率各增加两倍以外，实际上在帧率也增加了两倍，动态范围也增加了，原始的数据量6G/秒，8K视频不是比4K视频增长4倍而是10倍。VR视频上限是500G，很多人体验过VR视频，都感觉颗粒感很强，为什么呢？因为那个分辨率远远不够，要是VR视频的上限，到22K的分辨率才行，22K的分辨率对应到一秒的数据量有500G。自由视点视频比VR视频更高级，这个数据量就更加庞大了，这个数据通量是不得了的，即使5G也无法传输原始数据量，一定要经过压缩。rVzednc

视频技术不断演进，很重要的驱动力是不断的提升清晰度，让大家有临场感。但人眼视网膜分辨率的上线是有固定的指标，所以对于清晰度瓶颈，王荣刚先生认为，单视点清晰度已饱和，8K其实是个伪命题，分辨率已经饱和了，下一步视频技术的演进一定不是在分辨率上，而是往其他的纬度演进，目前往交互性上转VR已经是一种转变。rVzednc

如何实现自由交互视频？

VR全景视频是以用户为中心的360度视觉范围内的视频信息。自由交互视频技术，是在VR视频的基础上再往前走一步，允许用户移动，VR只是转动（头部），而自由交互是六自由度，也就是从3DoF交互到6DoF交互。rVzednc

要实现这个技术有很多路线：rVzednc

光场技术，可以看成以三维空间任意点为中心的无数全景视频。理解为无数的球面视频，每个球面视频有一个中心，那个中心可以认为是空间任何一个坐标，这样可以做到往哪儿移动都可以看到不同的画面，很显然这个数据量不得了，目前来说不太现实，距离应用还比较遥远。rVzednc

点云，将现实场景每个三维点视觉和空间信息全部创建出来。即将三维空间每个点的视频信息呈现出来，用点云表现出来，生成点云的过程就是一个挑战，即使有点云，点也是离散的点，弄在一起再渲染就不太自然，这种路线也不是很靠谱。rVzednc

多视点方案，这是相对比较实际的。方案基于多视⻆信息估计场景三维信息，基于场景三维信息合成任意虚拟视点。通过特殊布局的摄像机阵列，三维场景拍摄下来，把空间里的三维信息勾勒出基本的结构，有了这个结构，用户可以移动到任何的视角，移动到某一个视角再基于重建的三维信息对这个进行渲染。这个方案优势在于数据量没那么大，同时他渲染出的画面通过DR、UR渲染出的画面还是比较逼真的，这种路线相对比较可行。rVzednc

关键技术：AI深度估计

多个摄像机，最难的一点是如何用摄像机组建出来，这就运用到了AI深度估计技术，传统用图像处理的方法做点看点是否匹配，也存在计算速度和计算精度不够的问题，基于深度学习的技术可以把精度和细度做到非常快，可以做到实时。多视点的信息和场景的深度信息拼接到一起，构成人个视点的信息。rVzednc

结语

有了自由交互视频技术，我们看传统视频，不再是被动的看单一的视角，如果我们对某一个时刻精彩瞬间非常感兴趣，可以把它停下来，用屏交互看任意视点的信息，可以做缩放，也可以做移动，也可以做转动。rVzednc

未来，自由交互将会有更多应用场景，例如体育比赛和演出、医疗手术直播、工业互联网、设备监测等等，并有希望成为5G时代的杀手级应用之一。rVzednc

本文为电子技术设计原创文章，未经授权禁止转载。请尊重知识产权，违者本司保留追究责任的权利。

阅读全文，请先

通信无线技术人机交互光电及显示产业前沿 EDN原创

上一篇： IIC协议分析 下一篇： 物信融合：物理世界和信息世界对话

微信扫一扫
一键转发
最前沿的电子设计资讯
请关注“电子技术设计微信公众号”

2025松山湖中国IC创新高峰论坛：继续聊聊机器人去年的主题是智慧机器人，今年的主题仍然聚焦于机器人身上，不过变为了具身智慧机器人……
鹏瞰TS-PON Gen2芯片，用光协议重塑机器人“神经网络” TS-PON Gen2芯片是一款灵活的软件定义 SoC，适用于多种场景。它基于无源光网（PON）技术，具备高带宽（目前10G，未来可拓展至25G、50G）、低时延（微秒级）、高确定性等特性···
让人形机器人“耳聪目明”，昆泰芯KTM5900磁性编码器解编码器芯片作为机器人的核心传感器之一，对于提升机器人的感知能力、安全性和生产效率具有重要意义···
如何让具身机器人“看”得清？思特威给出了这个答案相比于滚动快门传感器，全局快门传感器能够同时曝光整个画面，有效避免了运动过程中产生的图像形变，为机器视觉提供高精度、无畸变的图像···
匠芯创M7000系列远超传统微秒级芯片，响应速度不到300纳 M7000 系列芯片已在人形机器人、机器人关节、高功率伺服驱动器等多个领域实现落地应用，与众多头部企业展开紧密合作···
极海推出全球首款双核Cortex-M52实时控制MCU/DSP 随着机器人技术的不断发展，其应用领域从传统的工业制造逐步拓展至医疗、农业等多个新兴领域，这对机器人的控制系统提出了更高的要求，当前机器人控制系统当前主要面临高爆发、高动态、高精度和高安全这四方面的挑战···
比人类更灵活？先楫HPM6E8Y机器人关节控制解决方案 HPM6E8Y通过硬件加速器将电机控制算法执行时间缩短至2.8μs，以全链路高实时通信与多轴协同能力，开启机器人关节“芯”时代。
为旌科技感算控一体化芯片落地，带来6倍效率提升？具身智能的本质是‘大脑（认知）+小脑（控制）+感官（感知）’的协同进化，需要芯片层面实现三者深度融合。
爱芯元智发布AX8850：让AI算力更便宜，让智能更可及爱芯元智希望把算力做得更加便宜具智价比，普惠AI，让我们的边缘智能更加触手可及···
万有引力EB100芯片亮相，空间计算走向低功耗新时代？ EB100芯片将为XR和机器人行业带来更好、更低功耗的空间计算和显示能力，开启空间计算时代的无限可能···
芯驰D9 Max：为具身智能而生的高性能SoC，一颗芯片顶五颗我们希望以1个芯片完成5个芯片完成的事情。当应用发生爆炸性的变化，融合一定是一个非常大的趋势，而且融合的过程会使软件的开发更简单，系统的开发更简单，成本控制得更好···
情境感知AI：利用FPGA技术增强边缘智能现场可编程门阵列（FPGA）的灵活性、现场升级能力和互操作性，结合其低功耗、低延迟和并行处理能力，使其成为开发者克服挑战并优化情境边缘AI应用的关键工具。

25年第19周新能源周销量：不同价格带的车型走势解析本周插混与增程车型市场呈现出“两极化”趋势：一方面，10-15万元级的主流家用轿车与SUV销量强劲；另一方面，20万元
拆解报告：甲骨文3060W碳化硅服务器电源模块甲骨文服务器电源模块输入输出均为专用接口，采用热拔插设计。电源模块支持200-277V交流和240-380V直流输入，输
评测：森海塞尔ACCENTUM Open真无线耳机半入耳机森海塞尔ACCENTUM Open 真无线耳机采用半入耳式设计，搭配约4.4克的重量，佩戴舒适。耳机充电盒轻盈小巧，携带外
人形机器人如何做到“手眼”协同+“大小脑”协同？人形机器人正站在“走出实验室”的临界点。从本体制造、控制系统、核心零部件到应用场景拓展，技术与产业生态
南非2025年4月：奇瑞和长城汽车快速上升 2025年4月的南非车市增长，马恒达和现代的强劲回归是一个信号，而中国品牌的集体崛起，则预示着未来竞争将更加多
4月新能源车领跑汽车出口增长，中国汽车走向全球的新引擎 2025年开年以来的出口数据呈现出清晰的结构升级路径。新能源产品在出口中扮演的角色日益重要，不再只是锦上添
拆解报告：vivo手机原装90W氮化镓闪充充电器 vivo 90W氮化镓闪充充电器采用经典直板造型设计，同时附带一条专门量身定制的8.5A大电流数据线，配合信号屏蔽层
拆解报告：HONOR荣耀手环10 荣耀手环10在外观方面，延续了上代的轻薄双曲面设计，同时采用全新的双色NCVM镀膜工艺，使之更加的时尚精致。标配
2025年4月中国车企加速渗透土耳其市场：比亚迪Seal U打响突围战 2025年4月，土耳其市场的爆发式增长为全球车企提供了重要信号：新兴市场正在进入电动化转型的加速期，而土耳其作
2025年第19周新能源周销量：问界起势 2025年第19周，中国乘用车市场的周度销量达到44.4万辆，其中新能源车占比突破50%，达22.3万辆，占比50.2%。比亚迪体
2024年4月汽车市场终端数据：自主崛起、新势力分化、合资承压从整体销量数据来看，4 月汽车终端销量达 169.7 万，同比增长 9.3% ，在目前的价格力度下，这个销售数字差强人意。2
拆解报告：华为750W钛金牌服务器电源华为这款服务器电源型号为PAC750S12-TE，支持220V交流或240V直流输入，输出电压为12V，输出电流为62.5A，输出端设有

史密斯英特康推出新一代“ DaVinci Gen V”测试插座史密斯英特康推出新一代“ DaVinci Gen V”测试插座，为人工智能、6G通信及先进计算应用领域的芯片提供超
意法半导体高集成度低边电流测量放大器简化高准确度电流检测意法半导体的 TSC1801低边电流测量放大器集成了设定增益所需的匹配电阻，从而简化了电路设计，节省了物料清单
意法半导体推出创新的、带有可改变存储配置存储器的车规微控制器新推出的Stellar微控制器内置了xMemory技术，它为正在发展的软件定义汽车以及不断进化的电动汽车架构提供了一
新系列串口EEPROM内置唯一ID码，适合设备识别、溯源和可持续性应用意法半导体 (ST) 推出了一系列内置128位唯一只读ID码 (UID) 的串口EEPROM芯片，以满足市场对产品识别、溯
Vishay新添增强短瞬态脉冲防护性能的经AEC-Q200认证的厚膜功率电这些器件采用夹片式TO-247 封装形式，可直接安装在散热器上，具有高达 75 J/0.1 s的高脉冲吸收能力和 150
凉棚集成Nordic 技术实现Matter over Thread连接为家庭和企业 StruXure+ 凉棚和小屋系列集成 Nordic 的 nRF5340 SoC以提供无缝的 Matter over Thread 连接
智能楼宇技术全球领导者与Nordic Semiconductor携手合作确保楼业界连手推动NR+成为智能楼宇的全球连接标准···
Cadence 率先推出 eUSB2V2 IP 解决方案，助力打造高速连接新范 Cadence 在业内率先推出 eUSB2V2 IP，此 IP 基于先进的台积公司 N3P 工艺，符合最新的嵌入式 USB2 版
纳芯微发布双通道电流检测放大器NSCSA285，赋能工业与能源管理近日，上海 —— 纳芯微电子（简称“纳芯微”）发布全新高精度双通道电流检测放大器NSCSA285系列···
攻克PWM高频瞬态干扰难题！纳芯微发布车规级电流检测放大器NSCSA24 近日，纳芯微发布全新车规级双向电流检测放大器NSCSA240-Q1系列，专为汽车高压PWM系统打造解决方案···
TE Connectivity 推出INMORO系列：致力于满足中国市场需求而打造的连接和传感解决方案提供商泰科电子（TE Connectivity，以下简称 TE）工业事业部隆重推出INMORO 系列，致力于满足中
破解汽车与工业等应用新挑战，TDK展示多传感器融合与AI+发展趋势在新能源汽车应用中，热管理系统既要能高效地冷却和加热电池、电机与OBC等车辆核心部件，确保其处于最佳运行温

热门评论
最新评论

换一换

杂志声明

5G时代都在说自由交互视频，这项技术难在哪里？