3D视觉为机器人增加“眼睛”-EDN 电子技术设计

 人类之所以能够驾驭这个世界，是因为具有三维（3D）感知能力。而这个能力也可以赋予给我们的机器人。但人类感知三维的方式也许并不适用于机器。要引导机器人运用深度传感视觉，需要考虑三个关键方法：立体视觉、结构光和飞行时间（ToF）。

人类之所以能够驾驭这个世界，是因为具有三维（3D）感知能力。而这个能力也可以赋予给我们的机器人。但人类感知三维的方式也许并不适用于机器。要引导机器人运用深度传感视觉，需要考虑三个关键方法：立体视觉、结构光和飞行时间（ToF）。auqednc

机器人系统已经存在了几十年，但直到最近它们大多都是盲目工作。只需为机器人配备接触传感器、接近传感器和位置传感器，它们就可以优雅地进行精心编排的、无休止的重复动作，可以操纵重型材料，执行精密装配，或焊接复杂的结构。但是，它们工作的成功与否，取决于其环境的精确性、必用材料的精确放置，以及对其运动轨迹的仔细绘制和编程。auqednc

然而，这种情况正在发生变化。机器视觉和视觉智能方面的研究、半导体制造的进步，以及图像传感器在手机市场上的应用，简化了视觉系统的开发并降低了其成本，使其成为了一种扩展机器人功能的越来越具成本效益的选择。借助视觉（特别是3D视觉）的引导，机器人将变得更能够与自由世界交互，工作起来更灵活，也更容易适应新的任务。auqednc

然而，特定的机器人所需的视觉特性高度取决于应用。例如，对于那些必须通过视觉引导在杂乱的仓库里移动的机器人来说，它们需要对动态环境进行远程感知，但只需要提供适当的精度。固定机器人的需求则可能完全不同，例如有些机器人用来将箱子里所混合的零件取出，并按相同类型进行堆放，这可能只需要在有限的范围内提供高精度的视觉。执行精密装配的机器人则又有另一套需求。因此，要确定采用哪一种3D视觉方法，首先要对机器“观看”的工作方式有所理解。auqednc

立体机器视觉

由于和人类观看的方式相似，最容易理解的3D方法是立体视觉。这是一种三角测量法，即用相隔一定距离的摄像头去捕获两个（或多个）图像（或用一个摄像头在图像之间移动），然后通过比较来确定摄像头视场中物体的距离。将摄像头分离会产生视差，这样，较近物体相对远处背景的对齐就会不同——物体越接近摄像头，视差越大。auqednc

图1给出了一个简单的示例。图中的两个摄像头沿平行轴指向相同方向，其传感器对齐并相隔基线距离B，每个摄像头都会捕获一个3D空间（X，Y，Z）的点（P）图像。捕获的图像中，该点在其2D图像平面上的位置将会不同（u_L和u_R）。几何上，该位置相当于从P点向摄像头引一条射线，穿过一个垂直于摄像头光轴（Z_A）、距离等于摄像头镜头焦距（f）的平面所得的交点。auqednc

3dvision-1 auqednc

图1：简单的立体视觉几何图。auqednc

如果取每个摄像头的Z_A与该平面相交的点作为每个图像2D坐标系的原点，那么计算两个成像点之间的距离，就可以获得该点的视差（d）。然后，就可以很容易地计算出该点到图像平面的距离（深度）：auqednc

深度 = f * B/dauqednc

但是通常现实世界中的系统不是那么容易对齐的。图2给出了一种更通用的设置，其中，每个摄像头都有自己的坐标系，它们以其光轴方向和图像传感器像素栅格的旋转方向来界定。确定图像点视差要比简单的距离计算更复杂，这涉及到坐标变换和几何校正，但三角测量原理是相同的。auqednc

3dvision-2 auqednc

图2：现实世界中的立体视觉几何图。auqednc

幸运的是，有大量的商用和开源软件可以处理这些计算。还有一些软件可使用摄像头栅格图像来确定所有必要的坐标变换，这样开发人员就不需要精确地确定摄像头方向。因此，计算空间中单个点的深度信息就变成了机器视觉系统中相对简单的一项运算。auqednc

但是，这当中仍然存在许多其他的计算挑战。其中最重要的一个是让系统确定不同摄像头图像中是哪个点对应于空间中的相同物理点。这个确定过程可能涉及极为复杂的相关过程，需要将来自一幅图像的一小组像素与构成另一幅图像的所有组像素进行比较来确定哪些组匹配，然后对构成第一幅图像的所有小像素组重复该过程。auqednc

结构光深度测定

第二种3D视觉方法——结构光——可简化上面这个相关过程，设计人员应当留意这个优势。这种方法在三角测量工作中用投光机取代了其中一个摄像头。投光机生成一个已知的光斑，然后系统将摄像头图像与这个已知光斑进行比较。所捕获图像中的结构光光斑会因为被测对象上的每个点深度不同而产生失真（图3）。在这个例子中，可以使用基线和两条射线之间夹角计算出P点的深度（R）：auqednc

R = B (sin α)/sin (α + θ)auqednc

3dvision-3 auqednc

图3：结构光系统根据已知光斑产生的反射光失真来计算深度。auqednc

目前业界已针对场景的深度信息提取开发出各种各样的结构光方案（图4），但其中有许多针对的是物体扫描而不是机器人运动控制。其中一些结构光方案产生图像序列所使用的光斑包含若干条纹，其宽度从一个图像到下一个图像依次减半（二进制编码）。还有类似采用格雷码或相移条纹的连续光斑也有使用。要利用单个图像捕获深度信息，可以利用连续变化的颜色编码图案，或对条纹图案编制索引，即每个条纹都与其他条纹不同。使用激光器或微镜光控制器可以很容易地创建这样的图案，而ams、Finisar和TI等公司也都专门针对结构光光源制造器件和控制器。auqednc

最近越来越流行的一种结构光方法是以伪随机图案来排列编码形状或二进制点所组成的栅格。系统使用人眼看不见的红外（IR）光来投射这种栅格图案，并且因为栅格是静止的，所以可以使用简单的全息光栅来创建图案。使用这种方法的商用深度传感摄像头系统现已上市。（请参见EDN姊妹刊物Electronic Products上发表的《Designer's guide to 3D cameras》一文）。auqednc

红外光的使用在视觉引导机器人应用中具有两个明显优势。首先，它可以使视觉系统与人类一起工作，而不会因结构光投射而为人类带来的视觉混乱。其次，使用红外光还可简化将结构光与环境光分离的工作。auqednc

3dvision-4 auqednc

图4：3D结构光的种类。（来源：OSA，《Structured-light 3D surface imaging: A tutorial》）auqednc

飞行时间深度测量

第三种3D视觉方法——飞行时间（ToF）——完全没有使用三角测量法。ToF 3D成像是直接测量深度，也就是确定光从光源到达环境中的物体然后返回所用的时间。在这方面，ToF类似于激光雷达（LIDAR）。然而，ToF方法不是用窄激光束扫描环境来构建深度图像，而是针对整个视场同时确定距离。半导体技术在不断进步，如今的传感器设计已经可以实现每个像素都可以向控制电子逻辑提供自己的信号，进而提取出计时信息。auqednc

ToF的一个挑战在于能够在有意义的范围内实现精确计时，从而获得精确的深度信息。光在空气中的传播速度约为1ft/ns（c），因此光脉冲必须使用数GHz时钟，才能分辨小于1ft的尺寸。类似地，传感器信号必须以亚纳秒精度进行测量。但是，这么短的脉冲所含光子数量有限，也即传感器接收到的光子数太少，从而导致信噪比（SNR）不佳。auqednc

尽管如此，仍有传感器使用直接时间测量法。Teledyne e2v的1.3MP BORA CMOS图像传感器提供距离选通成像，其全局快门开关可使传感器仅在很短的一段时间内针对特定深度平面收集光子。通过结合多次光照的结果，该传感器可以建立更强的信号用于处理。若在整个系统范围内扫描快门计时，该系统就可以在其深度范围内构建完整的深度图。auqednc

然而，更常见的一种方法是检测发射信号与反射信号之间的相位差来获取深度信息。图5给出了这种方法，反映了反射信号与方波发射脉冲（也可以是其他调制波）之间的关系。物距越大，关联信号越短，并且信号在多个周期内的积分值越低。由于对信号强度进行积分测量起来会比瞬时计时更加精确，因此这种方法的深度测量精度会比简单计算信号返回时间更高。目前，Infineon、pmd和TI等公司都提供这类ToF传感器，其中一些更具有可执行所有深度计算的内置电路。auqednc

3dvision-5 auqednc

图5：ToF通过比较反射信号与发射信号的时序来直接测量距离。auqednc

不幸的是，这两种方法均存在深度混叠的问题。ToF方案中，光源的调制频率（f）决定了最大不模糊距离，为R = c/2f。假如光脉冲速率是100MHz，则传感器可以清楚分辨的最大范围是5ft（10ns往返）。如果一个物体在6ft以外，其相关信号与1ft外的物体别无二致。也就是说，6ft远的物体对脉冲N的反射光线，其到达传感器的时间与1ft远的物体对脉冲N+1的反射相同。auqednc

降低调制频率可增大不模糊距离，但也有不利后果。释放的光子数较少，会使信噪比变差，或需要增加积分时间。这两种结果都不可取。auqednc

有一种解决方案是通过在光源中混合两种调制频率，来实现信号的去混叠。然后，传感器信号处理可以在对信号进行积分之前分离频率。其总返回信号较高，可提供良好的信噪比；不同的频率所混叠的距离不同，有助于解决距离模糊问题。该方案的最大模糊距离为光速除以两个频率最大公分母的两倍。auqednc

R = c/2*GCD(f1, f2)auqednc

根据需求匹配优势

上述3D视觉方法各有优劣，开发人员应根据其应用需求进行评估和选择；了解各种3D视觉技术的含义对于选择正确的方法也至关重要。例如，立体视觉系统可以使用传统的摄像头，并且无需使用集成式光源，所以这种方法成本低廉并且更容易集成到设计中。但是立体视觉系统的深度精度取决于其在多幅图像中找到对应点所需的计算性能，而且物体距离越远，深度分辨率越差。立体视觉系统在应对光滑表面和重复图案上也存在问题，这两者都使找到对应点的任务变得更复杂。auqednc

另一方面，结构光方法也使用传统摄像头，但只需要一个。其不需要有很强的计算性能，因此有助于降低成本。但其需要使用集成式光源，其强度会影响工作距离。在环境光可控或被滤除的情况下，其效果最佳，例如在封闭空间中。auqednc

ToF系统的计算强度最低，由于摄像头通常直接向系统主机提供深度信息，因此大大降低了计算需求。然而，与结构光一样，系统需要使用集成式光源，其功率会影响系统的距离，环境光不受控也会导致问题。此外，光源的调制频率也会影响距离。auqednc

无论哪种方法最适合您的应用，为机器人配备视觉引导正变得越来越容易。现货摄像头系统和视觉软件（商用和开源）也使事情变得更简单。此外，为下一代智能手机提供3D视觉功能的研发，有望进一步降低3D视觉的成本和复杂性。auqednc

本文为《电子技术设计》2019年5月刊杂志文章。auqednc

auqednc

本文为电子技术设计原创文章，未经授权禁止转载。请尊重知识产权，违者本司保留追究责任的权利。

阅读全文，请先

工业电子无人机/机器人传感器/MEMS EDN原创

上一篇： 如何看待英特尔14nm“挤牙膏”？ 下一篇： 物联网标准：游戏终结者

微信扫一扫
一键转发
最前沿的电子设计资讯
请关注“电子技术设计微信公众号”

10BASE-T1S：利用下一代以太网引领智能工厂革新在本文中，我们将探讨为什么10BASE-T1S，作为一种单对以太网标准，成为了替代传统以太网和硬连线解决方案用于工业自动化的首选通信协议。
AI时代的氮化镓：市场与技术将走向何方？ AI时代，氮化镓、碳化硅这样类新兴技术也正与AI挂钩，因为AI基础设施的算力、电源需求都不同于往常。为此，我们采访了英飞凌高级副总裁、氮化镓业务负责人Johannes Schoiswohl，谈了谈氮化镓市场与技术的未来…
纳芯微发布双通道电流检测放大器NSCSA285，赋能工业与能近日，上海 —— 纳芯微电子（简称“纳芯微”）发布全新高精度双通道电流检测放大器NSCSA285系列···
破解汽车与工业等应用新挑战，TDK展示多传感器融合与AI+ 在新能源汽车应用中，热管理系统既要能高效地冷却和加热电池、电机与OBC等车辆核心部件，确保其处于最佳运行温度，又会与空调系统的加热器和加热泵协通工作维持舒适的车内温度···
中国“破晓(PoX)”皮秒闪存器件问世，问鼎全球最快近日，复旦大学的研究团队研制出一款名为“破晓(PoX)”的皮秒闪存器件，打破了现有存储速度的理论极限···
SiC MOSFET 如何提高 AI 数据中心的电源转换能效随着数据中心耗电量急剧增加，行业更迫切地需要能够高效转换电力的功率半导体···
意法半导体推出完整的低压高功率电机控制参考设计包括FOC矢量控制、六步换向控制、高级转子位置检测、转矩控制方法，适用于工业设备和家电···
Cadence 利用 NVIDIA Grace Blackwell 加速 AI 融合设计专业知识与加速计算，推动科技创新、实现能效和工程生产力方面的突破性进展，引领全球生活新范式···
6G时代又近一步，首个太赫兹调制器问世近日，瑞士苏黎世联邦理工学院的研究团队在此方面取得了重大突破，成功开发出全球首个能够实现太赫兹频率数据传输的调制器···
“无声惊雷”：中国电磁枪如何实现科幻想象？近日，央视军事频道发布视频，展示了中国兵器装备建设工业自主研制的最新一代电磁枪···
意法半导体推出创新型卫星导航接收器，推动汽车及工业应业界首个片集成厘米级高精度GNSS多星座四频接收器，创新设计，提升高精度定位的性价比，满足道路用户和新工业应用的需求，扩大自动驾驶汽车的适用区域···
中国量子计算新突破："祖冲之三号"当前全球最强？中国科学技术大学宣布，中国自主超导量子计算原型机"祖冲之三号"成功问世。据介绍，该设备在此前66量子比特的祖冲之二号的基础上进行了重大升级，《物理评论快报》审稿人认为这一工作“构建了目前最高水准的超导量子计算机”···

25年第19周新能源周销量：不同价格带的车型走势解析本周插混与增程车型市场呈现出“两极化”趋势：一方面，10-15万元级的主流家用轿车与SUV销量强劲；另一方面，20万元
拆解报告：甲骨文3060W碳化硅服务器电源模块甲骨文服务器电源模块输入输出均为专用接口，采用热拔插设计。电源模块支持200-277V交流和240-380V直流输入，输
评测：森海塞尔ACCENTUM Open真无线耳机半入耳机森海塞尔ACCENTUM Open 真无线耳机采用半入耳式设计，搭配约4.4克的重量，佩戴舒适。耳机充电盒轻盈小巧，携带外
人形机器人如何做到“手眼”协同+“大小脑”协同？人形机器人正站在“走出实验室”的临界点。从本体制造、控制系统、核心零部件到应用场景拓展，技术与产业生态
南非2025年4月：奇瑞和长城汽车快速上升 2025年4月的南非车市增长，马恒达和现代的强劲回归是一个信号，而中国品牌的集体崛起，则预示着未来竞争将更加多
4月新能源车领跑汽车出口增长，中国汽车走向全球的新引擎 2025年开年以来的出口数据呈现出清晰的结构升级路径。新能源产品在出口中扮演的角色日益重要，不再只是锦上添
拆解报告：vivo手机原装90W氮化镓闪充充电器 vivo 90W氮化镓闪充充电器采用经典直板造型设计，同时附带一条专门量身定制的8.5A大电流数据线，配合信号屏蔽层
拆解报告：HONOR荣耀手环10 荣耀手环10在外观方面，延续了上代的轻薄双曲面设计，同时采用全新的双色NCVM镀膜工艺，使之更加的时尚精致。标配
2025年4月中国车企加速渗透土耳其市场：比亚迪Seal U打响突围战 2025年4月，土耳其市场的爆发式增长为全球车企提供了重要信号：新兴市场正在进入电动化转型的加速期，而土耳其作
2025年第19周新能源周销量：问界起势 2025年第19周，中国乘用车市场的周度销量达到44.4万辆，其中新能源车占比突破50%，达22.3万辆，占比50.2%。比亚迪体
2024年4月汽车市场终端数据：自主崛起、新势力分化、合资承压从整体销量数据来看，4 月汽车终端销量达 169.7 万，同比增长 9.3% ，在目前的价格力度下，这个销售数字差强人意。2
拆解报告：华为750W钛金牌服务器电源华为这款服务器电源型号为PAC750S12-TE，支持220V交流或240V直流输入，输出电压为12V，输出电流为62.5A，输出端设有

史密斯英特康推出新一代“ DaVinci Gen V”测试插座史密斯英特康推出新一代“ DaVinci Gen V”测试插座，为人工智能、6G通信及先进计算应用领域的芯片提供超
意法半导体高集成度低边电流测量放大器简化高准确度电流检测意法半导体的 TSC1801低边电流测量放大器集成了设定增益所需的匹配电阻，从而简化了电路设计，节省了物料清单
意法半导体推出创新的、带有可改变存储配置存储器的车规微控制器新推出的Stellar微控制器内置了xMemory技术，它为正在发展的软件定义汽车以及不断进化的电动汽车架构提供了一
新系列串口EEPROM内置唯一ID码，适合设备识别、溯源和可持续性应用意法半导体 (ST) 推出了一系列内置128位唯一只读ID码 (UID) 的串口EEPROM芯片，以满足市场对产品识别、溯
Vishay新添增强短瞬态脉冲防护性能的经AEC-Q200认证的厚膜功率电这些器件采用夹片式TO-247 封装形式，可直接安装在散热器上，具有高达 75 J/0.1 s的高脉冲吸收能力和 150
凉棚集成Nordic 技术实现Matter over Thread连接为家庭和企业 StruXure+ 凉棚和小屋系列集成 Nordic 的 nRF5340 SoC以提供无缝的 Matter over Thread 连接
智能楼宇技术全球领导者与Nordic Semiconductor携手合作确保楼业界连手推动NR+成为智能楼宇的全球连接标准···
Cadence 率先推出 eUSB2V2 IP 解决方案，助力打造高速连接新范 Cadence 在业内率先推出 eUSB2V2 IP，此 IP 基于先进的台积公司 N3P 工艺，符合最新的嵌入式 USB2 版
纳芯微发布双通道电流检测放大器NSCSA285，赋能工业与能源管理近日，上海 —— 纳芯微电子（简称“纳芯微”）发布全新高精度双通道电流检测放大器NSCSA285系列···
攻克PWM高频瞬态干扰难题！纳芯微发布车规级电流检测放大器NSCSA24 近日，纳芯微发布全新车规级双向电流检测放大器NSCSA240-Q1系列，专为汽车高压PWM系统打造解决方案···
TE Connectivity 推出INMORO系列：致力于满足中国市场需求而打造的连接和传感解决方案提供商泰科电子（TE Connectivity，以下简称 TE）工业事业部隆重推出INMORO 系列，致力于满足中
破解汽车与工业等应用新挑战，TDK展示多传感器融合与AI+发展趋势在新能源汽车应用中，热管理系统既要能高效地冷却和加热电池、电机与OBC等车辆核心部件，确保其处于最佳运行温

热门评论
最新评论

换一换

杂志声明

3D视觉为机器人增加“眼睛”

立体机器视觉

结构光深度测定

飞行时间深度测量

根据需求匹配优势