智能助手推动语音革命-EDN 电子技术设计

 150多年前，电话的发明掀起了一场通信革命。如今，随着各种新型智能设备利用人工智能（AI）从语音中提取含义，人们能够通过更加直观的新途径与身边的设备进行交互，一场新的语音通信革命正在到来。本文探讨了技术发展的现状，并预测了哪些技术将最终使无处不在的语音助手成为我们日常生活的一部分。

语音通信技术面临又一次革命。 06Sednc

150多年前，电话的发明掀起了一场通信革命。如今，随着各种新型智能设备利用人工智能（AI）从语音中提取含义，人们能够通过更加直观的新途径与身边的设备进行交互，一场新的语音通信革命正在到来。本文探讨了技术发展的现状，并预测了哪些技术将最终使无处不在的语音助手成为我们日常生活的一部分。06Sednc

“沃森先生，请过来……”06Sednc

1876年亚历山大·格拉汉姆·贝尔说出的这句举世闻名的话，标志着声音首次成功地通过电话传输。从那以后，人们的工作、生活和娱乐方式发生了翻天覆地的变化，而这项改变世界的创新始终是这些变化的核心。现在，人们与世界交互的方式也取得了新的突破，语音通信仍是其中不可分割的组成部分。06Sednc

在电话诞生后的第一个世纪里，有线电话网络遍及全球，将人们连接在一起。而过去50年间发生的电子革命，促进了便携式无线语音和视频通话的发展。最近10年，通信技术已经从人与人之间的免提通话，发展到人与机器对话。尽管只是初具雏形，但这种新型人机交互正在推动新一轮创新。06Sednc

目前，计算机、智能手机和智能音箱等都采用内置语音助手，使用基于云的深度学习系统来支持用户提问和设定操作。人们日常使用的其他设备很快也将实现这样的功能。根据市场研究机构Statistica的数据，预计到2021年，将有多达18亿人在随身携带的设备上，以及在家中甚或商业环境中其他类型的平台上，使用语音助手（图1）。06Sednc

然而，由于当今技术的局限，语音助手系统在迈向成功的道路上还面临挑战。人工智能、专用处理器和更灵敏的麦克风等技术的进步，将提升语音助手的性能，促进市场普及。06Sednc

06Sednc

图1：未来几年中，虚拟数字助理(VDA)的使用将急剧增加。据Tractica统计，到2021年，使用数字助理的人数将增加到18亿。06Sednc

富于人性的人机对话

人类对话极其丰富，同时又具有交互性，这是语音助手系统面临的一大挑战。有时候，人们的话音还未落地，朋友就能心领神会。从技术上讲，人们相互交谈时的响应时间仅为数十毫秒。在与朋友聊天时，偶尔略加思索再缓缓回答是很自然的事，但如果正常对话中的停顿每次长达数秒，或者经常需要复述问题或命令，日常交流将变得多么令人难堪。06Sednc

语音助手“对话”反应迟钝与其底层技术的诸多方面有关。语音识别和响应所采用的算法要占用大量处理能力，因此，如今的智能手机和智能音箱系统是将录音发送至云端计算资源。为了尽可能缩短传输时延，系统通常传输低质量音频文件，这会导致较高的错误率。而互联网本身是一种变速媒介，所以传输速度是变化不定的。这两个因素合起来，必然会影响依靠云来完成语音识别重任的语音助手的质量。06Sednc

尽管有这些缺点，这项技术仍然令消费者振奋不已。智能音箱系统是继智能手机之后第一款提供语音助手的全新产品，其销量增速之迅猛，是智能手机问世以来未曾见过的。voicebot.ai发布的数据表明，2018年智能音箱在美国的销量增幅高达40%，算上新卖出的6640万台，智能音箱数量已达到1.33亿台，占美国成年人口数量的26%多一点（图2）。06Sednc

此外，语音助手一定会不断提升性能，更好地模拟人类对话。除了缩短对话时延，算法也在不断优化，人与设备的交互会更人性化。这样的改善在很大程度上是源于让处理功能更靠近用户。06Sednc

06Sednc

图2：Voicebot的统计显示，2018年全美智能音箱数量的年增长率接近40%，总计达到6,640万台。06Sednc

将人机对话移到边缘设备

随着实现云端处理语音助手的技术日新月异，这些设备将变得更加个性化。当前的语音助手是向云发送信息并接收从云传回的信息。实现这一功能的人工智能技术未来将应用于边缘设备，从而改善系统的私密性、功耗和响应速度。简而言之，边缘计算可以将人工智能从云端转移到人们的家中、工作场所或身边的其他设备中，使语音助手更加高效。英飞凌不久前展示的世界上功耗最低的关键词识别边缘解决方案，使我们朝着这个目标迈进了一步。06Sednc

医疗和个人健康监测，将是更智能的语音助手大有可为的领域。譬如，高灵敏度麦克风可以监测睡眠时的呼吸声，预测睡眠呼吸暂停等睡眠障碍的发生。将这类个人健康信息传输到云端进行处理，可能令许多人感到不安。边缘处理则在本地捕获音频、进行计算并存储分析数据，完成对健康信息的监测和分析。这样一来，用户就能管理数据共享的方式和时间，能够确保更高私密性的语音助手，使人们对监测心脏和呼吸健康、睡眠状态以及整体健康状况感到更加安心。06Sednc

当前人工智能发展迅速，其动力来自深度学习研究和构建专业深度学习系统的新型硬件。该领域的先驱、英飞凌合作伙伴Syntiant正研制可以为边缘设备带来深度学习能力的新型芯片。短短几年内，语音助手技术支持的人机交互将成为数十亿人日常生活中司空见惯的事。针对智能语音助手而开发的技术所具备的用电特性，使得采用小型电池供电的智能音频识别也能在许多其他应用中大展拳脚。想想你听到的声音如何影响你与世界的互动，就能预见到这项技术还在哪些领域发挥价值。除了日常生活中的应用，语音助手技术也将成为物联网（IoT）和工业4.0智能机器传感器系统的组成部分。06Sednc

自动驾驶车辆还将利用音频输入和其他传感器来检测并响应周围环境。诸如自行车、火车、其他交通工具和大喊大叫的孩子等发出的声音，都是人工智能网络的音频输入，使汽车能够“看到”拐角处的目标。在工厂中，智能控制网络可以根据机器运行发出的声音进行诊断，排查故障，防患于未然。智慧城市系统会“听到”诸如玻璃破碎或交通事故等异常事件，并向有关部门发出警报。未来的机器人将把音频系统纳入传感器网络，以支持智能操作及交互。实际上，潜在应用数不胜数。06Sednc

MEMS麦克风超越人类听觉

人类的听觉和认知处理是极其丰富的感觉系统的一部分。然而，有朝一日，基于人工智能的语音助手将在某些方面超越人类的能力。语音助手目前利用微型麦克风阵列和智能芯片来准确检测并理解传入的声音。其中一项关键技术是远场识别，这项技术通过高灵敏度MEMS麦克风和语音处理器芯片，使用高级音频处理算法来听到可能是房间另一头传出的窃窃私语。其他算法则有助于麦克风阵列从一个房间内的多个声源（包括其他人、电视和收音机）中，辨别出发布命令的具体声音。英飞凌研发出一个演示系统，将麦克风和语音处理器与微型雷达芯片合为一体，进一步改善存在检测和焦点（图3）。06Sednc

06Sednc

图3：英飞凌的雷达和MEMS麦克风与XMOS音频处理器的传感器融合，为语音助手平台提供了一种新的构建模块。（图片来源：英飞凌科技）06Sednc

Emile Berliner发明的麦克风让电话变得实用，如果他今天还活着，一定会对袖珍如斯的麦克风感到惊奇，但他仍然看得出来声音捕捉和回放的工作原理。当前市场上MEMS麦克风的工作原理与Berliner研发的第一款实用麦克风完全相同：由一片薄膜检测到声波产生的空气压力并将其转换为电信号。从低声耳语的0dB SPL（声压级），到摇滚音乐会现场的120dB SPL，MEMS麦克风能够检测到的可闻声范围很大。dB刻度是对数形式，这意味着120dB SPL的能量比0dB SPL声音高12个数量级（1万亿倍）。06Sednc

在许多应用中，最尖端的MEMS麦克风的灵敏度超过了人耳通常能听到的声音范围。相比同样尺寸的类似麦克风，英飞凌提供的最新一代器件具备更加优异的性能，可使信噪比（SNR）改善达10dB（图4）。它可以在新一代系统中为音频处理提供高质量音频信号，从而提升总体灵敏度并降低误差率。06Sednc

06Sednc

图4：英飞凌的双背板MEMS技术在两块背板之间嵌入一层振膜，从而产生真正的差分信号。SNR提高了6dB，达到70dB，相当于将MEMS麦克风捕获用户语音命令的有效距离增大了一倍。（图片来源：英飞凌科技）06Sednc

智能的发展无止境

如今使用的音频处理技术通常采用诸如回声消除和有源滤波等概念来抑制有害噪音，并隔离目标音频信号以进行语音识别。事实上，这种类型的音频识别是将噪音信息视为背景音。新一代神经网络人工智能处理器则将采取不同的方法，学习区分噪音与有用信号之间的差异。目前英飞凌正与合作伙伴共同开发能够实现这一任务的麦克风和硬件组合。合作的另一个目的是提供一些必要的开发工具，用来为工业、商业和消费类产品设计人工智能音频检测和语音识别系统。06Sednc

不久的将来，利用语音助手技术，人们能够与所使用的机器进行有意义的对话，哪怕并未连接到云，人机对话亦不受影响。用于监测人们健康和安全的传感器系统也将采用这种智能音频技术。这是一场持续的语音通信革命，人们将以新的方式与机器交互，同时机器也能够检测所处的环境并作出响应。06Sednc

（原文刊登于ASPENCORE旗下EETimes网站，参考链接： Smart Assistants Extend the Voice Revolution。）06Sednc

阅读全文，请先

人工智能人机交互产业前沿 EDN原创

上一篇： 韩厂开发不易燃液态电解质催生更安全锂电池 下一篇： 适合高精度测量应用的完全集成式4线RTD温度测量系统的简单实现

微信扫一扫
一键转发
最前沿的电子设计资讯
请关注“电子技术设计微信公众号”

2025松山湖中国IC创新高峰论坛：继续聊聊机器人去年的主题是智慧机器人，今年的主题仍然聚焦于机器人身上，不过变为了具身智慧机器人……
鹏瞰TS-PON Gen2芯片，用光协议重塑机器人“神经网络” TS-PON Gen2芯片是一款灵活的软件定义 SoC，适用于多种场景。它基于无源光网（PON）技术，具备高带宽（目前10G，未来可拓展至25G、50G）、低时延（微秒级）、高确定性等特性···
让人形机器人“耳聪目明”，昆泰芯KTM5900磁性编码器解编码器芯片作为机器人的核心传感器之一，对于提升机器人的感知能力、安全性和生产效率具有重要意义···
如何让具身机器人“看”得清？思特威给出了这个答案相比于滚动快门传感器，全局快门传感器能够同时曝光整个画面，有效避免了运动过程中产生的图像形变，为机器视觉提供高精度、无畸变的图像···
极海推出全球首款双核Cortex-M52实时控制MCU/DSP 随着机器人技术的不断发展，其应用领域从传统的工业制造逐步拓展至医疗、农业等多个新兴领域，这对机器人的控制系统提出了更高的要求，当前机器人控制系统当前主要面临高爆发、高动态、高精度和高安全这四方面的挑战···
比人类更灵活？先楫HPM6E8Y机器人关节控制解决方案 HPM6E8Y通过硬件加速器将电机控制算法执行时间缩短至2.8μs，以全链路高实时通信与多轴协同能力，开启机器人关节“芯”时代。
为旌科技感算控一体化芯片落地，带来6倍效率提升？具身智能的本质是‘大脑（认知）+小脑（控制）+感官（感知）’的协同进化，需要芯片层面实现三者深度融合。
爱芯元智发布AX8850：让AI算力更便宜，让智能更可及爱芯元智希望把算力做得更加便宜具智价比，普惠AI，让我们的边缘智能更加触手可及···
万有引力EB100芯片亮相，空间计算走向低功耗新时代？ EB100芯片将为XR和机器人行业带来更好、更低功耗的空间计算和显示能力，开启空间计算时代的无限可能···
芯驰D9 Max：为具身智能而生的高性能SoC，一颗芯片顶五颗我们希望以1个芯片完成5个芯片完成的事情。当应用发生爆炸性的变化，融合一定是一个非常大的趋势，而且融合的过程会使软件的开发更简单，系统的开发更简单，成本控制得更好···
情境感知AI：利用FPGA技术增强边缘智能现场可编程门阵列（FPGA）的灵活性、现场升级能力和互操作性，结合其低功耗、低延迟和并行处理能力，使其成为开发者克服挑战并优化情境边缘AI应用的关键工具。
ADAS 系统中的传感器创新如何在道路交通中挽救生命在本文中，我们将探讨 ADAS 在提高道路安全方面的作用，以及各种对实现这一目标至关重要的传感器技术。

25年第19周新能源周销量：不同价格带的车型走势解析本周插混与增程车型市场呈现出“两极化”趋势：一方面，10-15万元级的主流家用轿车与SUV销量强劲；另一方面，20万元
拆解报告：甲骨文3060W碳化硅服务器电源模块甲骨文服务器电源模块输入输出均为专用接口，采用热拔插设计。电源模块支持200-277V交流和240-380V直流输入，输
评测：森海塞尔ACCENTUM Open真无线耳机半入耳机森海塞尔ACCENTUM Open 真无线耳机采用半入耳式设计，搭配约4.4克的重量，佩戴舒适。耳机充电盒轻盈小巧，携带外
人形机器人如何做到“手眼”协同+“大小脑”协同？人形机器人正站在“走出实验室”的临界点。从本体制造、控制系统、核心零部件到应用场景拓展，技术与产业生态
南非2025年4月：奇瑞和长城汽车快速上升 2025年4月的南非车市增长，马恒达和现代的强劲回归是一个信号，而中国品牌的集体崛起，则预示着未来竞争将更加多
4月新能源车领跑汽车出口增长，中国汽车走向全球的新引擎 2025年开年以来的出口数据呈现出清晰的结构升级路径。新能源产品在出口中扮演的角色日益重要，不再只是锦上添
拆解报告：vivo手机原装90W氮化镓闪充充电器 vivo 90W氮化镓闪充充电器采用经典直板造型设计，同时附带一条专门量身定制的8.5A大电流数据线，配合信号屏蔽层
拆解报告：HONOR荣耀手环10 荣耀手环10在外观方面，延续了上代的轻薄双曲面设计，同时采用全新的双色NCVM镀膜工艺，使之更加的时尚精致。标配
2025年4月中国车企加速渗透土耳其市场：比亚迪Seal U打响突围战 2025年4月，土耳其市场的爆发式增长为全球车企提供了重要信号：新兴市场正在进入电动化转型的加速期，而土耳其作
2025年第19周新能源周销量：问界起势 2025年第19周，中国乘用车市场的周度销量达到44.4万辆，其中新能源车占比突破50%，达22.3万辆，占比50.2%。比亚迪体
2024年4月汽车市场终端数据：自主崛起、新势力分化、合资承压从整体销量数据来看，4 月汽车终端销量达 169.7 万，同比增长 9.3% ，在目前的价格力度下，这个销售数字差强人意。2
拆解报告：华为750W钛金牌服务器电源华为这款服务器电源型号为PAC750S12-TE，支持220V交流或240V直流输入，输出电压为12V，输出电流为62.5A，输出端设有

史密斯英特康推出新一代“ DaVinci Gen V”测试插座史密斯英特康推出新一代“ DaVinci Gen V”测试插座，为人工智能、6G通信及先进计算应用领域的芯片提供超
意法半导体高集成度低边电流测量放大器简化高准确度电流检测意法半导体的 TSC1801低边电流测量放大器集成了设定增益所需的匹配电阻，从而简化了电路设计，节省了物料清单
意法半导体推出创新的、带有可改变存储配置存储器的车规微控制器新推出的Stellar微控制器内置了xMemory技术，它为正在发展的软件定义汽车以及不断进化的电动汽车架构提供了一
新系列串口EEPROM内置唯一ID码，适合设备识别、溯源和可持续性应用意法半导体 (ST) 推出了一系列内置128位唯一只读ID码 (UID) 的串口EEPROM芯片，以满足市场对产品识别、溯
Vishay新添增强短瞬态脉冲防护性能的经AEC-Q200认证的厚膜功率电这些器件采用夹片式TO-247 封装形式，可直接安装在散热器上，具有高达 75 J/0.1 s的高脉冲吸收能力和 150
凉棚集成Nordic 技术实现Matter over Thread连接为家庭和企业 StruXure+ 凉棚和小屋系列集成 Nordic 的 nRF5340 SoC以提供无缝的 Matter over Thread 连接
智能楼宇技术全球领导者与Nordic Semiconductor携手合作确保楼业界连手推动NR+成为智能楼宇的全球连接标准···
Cadence 率先推出 eUSB2V2 IP 解决方案，助力打造高速连接新范 Cadence 在业内率先推出 eUSB2V2 IP，此 IP 基于先进的台积公司 N3P 工艺，符合最新的嵌入式 USB2 版
纳芯微发布双通道电流检测放大器NSCSA285，赋能工业与能源管理近日，上海 —— 纳芯微电子（简称“纳芯微”）发布全新高精度双通道电流检测放大器NSCSA285系列···
攻克PWM高频瞬态干扰难题！纳芯微发布车规级电流检测放大器NSCSA24 近日，纳芯微发布全新车规级双向电流检测放大器NSCSA240-Q1系列，专为汽车高压PWM系统打造解决方案···
TE Connectivity 推出INMORO系列：致力于满足中国市场需求而打造的连接和传感解决方案提供商泰科电子（TE Connectivity，以下简称 TE）工业事业部隆重推出INMORO 系列，致力于满足中
破解汽车与工业等应用新挑战，TDK展示多传感器融合与AI+发展趋势在新能源汽车应用中，热管理系统既要能高效地冷却和加热电池、电机与OBC等车辆核心部件，确保其处于最佳运行温

热门评论
最新评论

换一换

杂志声明

智能助手推动语音革命

富于人性的人机对话

将人机对话移到边缘设备

MEMS麦克风超越人类听觉

智能的发展无止境