如何避免音频信号处理中的常见错误-EDN 电子技术设计

 音频信号处理产品的设计和编码软件有其独特的挑战。那么，开发人员最常犯的错误是什么？如何避免这些错误呢？

无论最终产品是什么，无论他们使用什么语言编写代码，世界各地的软件开发人员都面临着同样的挑战——不断变化的客户需求、紧迫的交期、整合和客户支持，以上只是几个例子。rFOednc

但是有一种类型的软件开发涉及了解和解决非常具体的问题。音频信号处理产品的设计和编码软件有其独特的挑战。那么，开发人员最常犯的错误是什么？如何避免这些错误呢？rFOednc

了解信号处理对于在音频领域工作的软件工程师很有帮助，但这不是必需的。然而，有些领域对音频有一些了解确实有所帮助。rFOednc

首先，是增益结构，了解音量控制可以为我们的系统增加增益。这适用于我们软件的内部结构，并将影响我们插入原型的所有小工具。结果可能是声音输出令人不满意。开发人员以为这是由于代码中的错误造成的，而实际上这是增益结构的问题。知道这一点可以在不必要的调试中节省大量时间。rFOednc

其次，软件开发人员有时会忘记音频滤波会增加群延迟。如果我们忘记了这个基本事实，我们可能会过分承诺我们的算法的性能，我们会认为它会比实际行动得更快。rFOednc

第三，一个虽然很小但很重要的点是实际数据和理论数据之间的差异。数学有零，但音频没有。在数学中，算法的设计使用理论数据。当使用实际数据测试我们的系统时，我们可能会发现一个信号似乎是无声的。在那种情况下，放大它总是值得的——它可能有点嘶嘶声，也可能全是零。rFOednc

最后，我们不可能只采用一种算法并将其部署在所有设备上。我们需要在开发过程中尽早考虑我们的算法将要有的部署约束条件。一些DSP非常高效且功耗低，但它们的内存可能有限。其他的可能非常适合用于AI处理，但它们会引入更高的延迟。如果你能设计一个权衡空间和时间的算法，那就太好了。但实际上，大多数算法无法做到这一点，因此我们可能会发现自己无法获得功耗最低的嵌入式设备。rFOednc

在任何开发中，在开发开始之前了解客户需求是必不可少的。但在处理音频时，这一点更为重要。为什么呢？因为对于音频，客户不仅需要一个运行良好的系统，他们还需要一个可以输出出色音频的系统。问题是每个人听到的声音都不一样(例如，年龄会影响听力敏锐度)，而且我们对听起来“好”的声音都有个人偏好。我们可能会发现我们花了很长时间开发的一种产品，最终客户根本不喜欢。rFOednc

对于大多数音频开发人员来说，这是一个持续存在的问题。音频的评估比视觉算法的评估更难。这是为什么？因为视觉结果可以并排放置并同时将它们相互进行比较。但你不能同时比较音频：你不能同时听两件事。因此，音频结果的A/B测试只能是顺序的，不能同时进行。所以，测试音频需要更长的时间，我们可能需要听两个小时的测试录音仅仅是为了评估对算法的小调整。我们要确保项目的计划包含有比我们认为需要的更长的测试时间。rFOednc

我们可以通过商定使用一种普遍被接受的音频测试指标(例如MOS分数)来避免这种主观性。这些输入的音频和预期所需的观众对结果的评价。确实有助于评估质量，但不会给我们提供改进的原因。许多常见的测试和指标是为有线电话等传统的现有应用开发的，并且偏向于这些应用。因此，使用指标会有所帮助，但这不是绝对的答案。在我们开始工作之前，要确保我们的客户把他们的愿景告诉我们，因为他们希望音频听起来像什么，这一点至关重要。rFOednc

了解客户的愿景对于下一个要注意的问题整合也很重要。我们的音频是系统的一部分。所有部分都必须协同工作，但系统的其余部分受处理音频的消耗限制，而我们的音频也受系统其余部分消耗的限制。如果音频在实际的系统上断断续续，那么在空的系统上开发运行良好的东西是没有意义的，而且会浪费很多资源。所以，早点整合吧。但是，正如开发人员都知道的，整合的成本很高。为了防止将时间浪费在整合不合适的内容上，我们首先需要与客户交谈。并且，在开始开发之前，获取所选用例中的一些录音样本，同时预览它们或离线工作来估计我们将能够实现的目标并确保它符合客户的愿景。rFOednc

开发人员会犯的一个常见错误是在开发过程中没有尽早获得软件流。这很重要，因为如果我们不尽早进行流式传输，我们可能会要处理导致结果过分承诺的文件。如果我们正在编写一种算法，它每访问一位音频就向数据结构添加一个成分，则数据结构的大小与我们正在处理的文件的大小成正比。然而，一旦文件被音频流替换，数据结构可能会在设备运行时无限增大。通过尽早流式传输，可以降低开发风险，并且可以进一步确保我们的算法已准备好进行大规模生产。rFOednc

另外，从一开始就考虑测试过程。仅通过音频输出进行测试很困难，因为它是实数信号。要确保尽可能多地进行单元测试，而不是依赖于不同处理器和平台之间可能不同的音频输出。rFOednc

查看编码过程本身，我们需要在定点和浮点之间做出决定。定点曾经是表示用于存储和计算的音频样本的“go to”方法。定点计算将使用与整数计算相同的ALU部件，一个简单的数学技巧是大致估计连续变化的数量，在精度和数量大小之间进行权衡。rFOednc

浮点在ALU中实现起来更复杂，但在现代CPU中(例如在移动设备中)使用它几乎没有或完全没有损失。存在的损失被工程时间要求的减少和用于优化算法的时间量的增加所抵消。音频算法通常庞大而复杂，而浮点可以用更少的工程资源实现它们，因为它简化了运算。使用浮点数的开发人员无需担心整数上溢或下溢。rFOednc

关于手机，值得记住的是，手机中通常使用的CPU不仅会处理浮点运算，还会将其矢量化。因此，如果这是我们的用例，请确保我们设计的代码能够进行矢量化。rFOednc

另一个技巧是在试验系统行为时将音频大量写入文件。根据我们写入的介质，我们可能需要一个工作线程，例如一张SD卡。这个工作线程就像一个软件管家，我们可以将音频数据提供给它；它耐心等待，然后将其交给设备。这意味着我们的核心算法不必等待和阻止运行时的行为。如果要写入多个文件，请检查它们是否都从同一位置开始。例如，如果我们停止其中一个文件的开头40ms，我们会发现系统中会出现无法解释的40ms延迟。rFOednc

在音频信号处理方面，粗心的人会遇到很多陷阱。但是，通过正确的准备，我们可以通往成功的产品开发。rFOednc

(原文刊登于EDN姊妹网站Embedded，参考链接：Common mistakes in audio signal processing – and how to avoid them，由Ricardo Xie编译。)rFOednc

责编：Ricardo

阅读全文，请先

模拟/混合信号/RF 通信人机交互放大/调整/转换测试与测量无线技术汽车电子智能硬件消费电子无人机/机器人工业电子技术实例产业前沿工程师职业发展 EDN原创

上一篇： 虚拟化如何成为数字化变电站部署的推动者 下一篇： 2023：制造业自动化进行时

微信扫一扫
一键转发
最前沿的电子设计资讯
请关注“电子技术设计微信公众号”

Microchip推出多功能MPLAB® PICkit™ Basic调试器这款开发工具以更实惠的价格为专业工程师、学生和爱好者提供强大调试功能···
意法半导体推出STSPIN32G0新列电机驱动器，满足工业自动意法半导体STSPIN32系列集成化电机驱动器新增八款产品，满足电动工具、家用电器、工业自动化等应用的低成本、高性能要求···
Ceva 推出具有下一代蓝牙高数据吞吐量和 IEEE 802. 交钥匙集成式硬件和软件平台 IP 结合了功能齐全的蓝牙双模和下一代高数据吞吐量，以及适用于 Thread/Zigbee/Matter 的 IEEE 802.15.4标准，并包含了Ceva采用台积电 12nm 技术实现的最先进无线电···
简化隔离驱动电源设计，纳芯微推出集成晶振的NSIP3266全 NSIP3266专为高压系统中隔离驱动供电的半分布式架构而设计，采用全桥拓扑，支持宽压输入，集成晶振释放MCU资源···
第三次被雷劈，拆解报废的热水浴缸控制面板 2014年也发生过一次，一年后，它再次发生。经过九年的休养生息，又发生了第三次。我在说什么呢？近距离的闪电再次击中了我家的一些电子设备···
Microchip推出集成式紧凑型CAN FD系统基础芯片解决方 ATA650x CAN FD SBC集成高速CAN收发器和5V LDO···
STM32 MPU是什么产品？了解嵌入式系统中微处理器的新变微控制器 (MCU)和微处理器(MPU)有哪些不同之处？
安森美与伍尔特电子携手升级高精度电力电子应用虚拟设功率损耗模型生成工具现已包含无源元件，可更精准地进行设计建模，帮助客户加快产品上市
安森美推出业界领先的模拟和混合信号平台 Treo 平台基于 65 纳米节点的 BCD 工艺技术，支持同行业领先的 1- 90V 宽电压范围和高达 175°C 的工作温度；Treo 平台将帮助客户简化设计流程，降低系统成本，并加快在汽车、医疗、工业、AI数据中心等领域解决方案的上市速度；安森美现可提供基于 Treo 平台构建的多个产品系列样品，包括电压转换器、超低功耗模拟前端（AFE）、LDO、超声波传感器、多相控制器和单对以太网控制器。基于该平台构建的产品将在安森美（onsemi）位于纽约州 East Fishkill 的世界级 300mm 工厂制造···
意法半导体推出集成化高压功率级和节省空间的评估板，栅极驱动器、功率 MOSFET、自举二极管和快速启动的保护功能一体化封装，节省电路板空间70%，紧凑的圆形评估板，加快电扇和电泵开发···
Melexis推出MLX92253，重塑直流电机应用基准：精度、尺寸全球微电子工程公司Melexis宣布，其霍尔效应双锁存器产品系列迎来新成员MLX92253。这款霍尔传感器芯片提供两条完全独立的信号通道，以最大限度地减小抖动并始终保持90°相移，且不受磁极距离影响···
Microchip推出TimeProvider® XT扩展系统，实现向现代 TimeProvider 4100主时钟的附件，可扩展至200 个完全冗余的T1、E1 或CC同步输出端

25年第19周新能源周销量：不同价格带的车型走势解析本周插混与增程车型市场呈现出“两极化”趋势：一方面，10-15万元级的主流家用轿车与SUV销量强劲；另一方面，20万元
拆解报告：甲骨文3060W碳化硅服务器电源模块甲骨文服务器电源模块输入输出均为专用接口，采用热拔插设计。电源模块支持200-277V交流和240-380V直流输入，输
评测：森海塞尔ACCENTUM Open真无线耳机半入耳机森海塞尔ACCENTUM Open 真无线耳机采用半入耳式设计，搭配约4.4克的重量，佩戴舒适。耳机充电盒轻盈小巧，携带外
人形机器人如何做到“手眼”协同+“大小脑”协同？人形机器人正站在“走出实验室”的临界点。从本体制造、控制系统、核心零部件到应用场景拓展，技术与产业生态
南非2025年4月：奇瑞和长城汽车快速上升 2025年4月的南非车市增长，马恒达和现代的强劲回归是一个信号，而中国品牌的集体崛起，则预示着未来竞争将更加多
4月新能源车领跑汽车出口增长，中国汽车走向全球的新引擎 2025年开年以来的出口数据呈现出清晰的结构升级路径。新能源产品在出口中扮演的角色日益重要，不再只是锦上添
拆解报告：vivo手机原装90W氮化镓闪充充电器 vivo 90W氮化镓闪充充电器采用经典直板造型设计，同时附带一条专门量身定制的8.5A大电流数据线，配合信号屏蔽层
拆解报告：HONOR荣耀手环10 荣耀手环10在外观方面，延续了上代的轻薄双曲面设计，同时采用全新的双色NCVM镀膜工艺，使之更加的时尚精致。标配
2025年4月中国车企加速渗透土耳其市场：比亚迪Seal U打响突围战 2025年4月，土耳其市场的爆发式增长为全球车企提供了重要信号：新兴市场正在进入电动化转型的加速期，而土耳其作
2025年第19周新能源周销量：问界起势 2025年第19周，中国乘用车市场的周度销量达到44.4万辆，其中新能源车占比突破50%，达22.3万辆，占比50.2%。比亚迪体
2024年4月汽车市场终端数据：自主崛起、新势力分化、合资承压从整体销量数据来看，4 月汽车终端销量达 169.7 万，同比增长 9.3% ，在目前的价格力度下，这个销售数字差强人意。2
拆解报告：华为750W钛金牌服务器电源华为这款服务器电源型号为PAC750S12-TE，支持220V交流或240V直流输入，输出电压为12V，输出电流为62.5A，输出端设有

史密斯英特康推出新一代“ DaVinci Gen V”测试插座史密斯英特康推出新一代“ DaVinci Gen V”测试插座，为人工智能、6G通信及先进计算应用领域的芯片提供超
意法半导体高集成度低边电流测量放大器简化高准确度电流检测意法半导体的 TSC1801低边电流测量放大器集成了设定增益所需的匹配电阻，从而简化了电路设计，节省了物料清单
意法半导体推出创新的、带有可改变存储配置存储器的车规微控制器新推出的Stellar微控制器内置了xMemory技术，它为正在发展的软件定义汽车以及不断进化的电动汽车架构提供了一
新系列串口EEPROM内置唯一ID码，适合设备识别、溯源和可持续性应用意法半导体 (ST) 推出了一系列内置128位唯一只读ID码 (UID) 的串口EEPROM芯片，以满足市场对产品识别、溯
Vishay新添增强短瞬态脉冲防护性能的经AEC-Q200认证的厚膜功率电这些器件采用夹片式TO-247 封装形式，可直接安装在散热器上，具有高达 75 J/0.1 s的高脉冲吸收能力和 150
凉棚集成Nordic 技术实现Matter over Thread连接为家庭和企业 StruXure+ 凉棚和小屋系列集成 Nordic 的 nRF5340 SoC以提供无缝的 Matter over Thread 连接
智能楼宇技术全球领导者与Nordic Semiconductor携手合作确保楼业界连手推动NR+成为智能楼宇的全球连接标准···
Cadence 率先推出 eUSB2V2 IP 解决方案，助力打造高速连接新范 Cadence 在业内率先推出 eUSB2V2 IP，此 IP 基于先进的台积公司 N3P 工艺，符合最新的嵌入式 USB2 版
纳芯微发布双通道电流检测放大器NSCSA285，赋能工业与能源管理近日，上海 —— 纳芯微电子（简称“纳芯微”）发布全新高精度双通道电流检测放大器NSCSA285系列···
攻克PWM高频瞬态干扰难题！纳芯微发布车规级电流检测放大器NSCSA24 近日，纳芯微发布全新车规级双向电流检测放大器NSCSA240-Q1系列，专为汽车高压PWM系统打造解决方案···
TE Connectivity 推出INMORO系列：致力于满足中国市场需求而打造的连接和传感解决方案提供商泰科电子（TE Connectivity，以下简称 TE）工业事业部隆重推出INMORO 系列，致力于满足中
破解汽车与工业等应用新挑战，TDK展示多传感器融合与AI+发展趋势在新能源汽车应用中，热管理系统既要能高效地冷却和加热电池、电机与OBC等车辆核心部件，确保其处于最佳运行温

热门评论
最新评论

换一换

杂志声明

如何避免音频信号处理中的常见错误