基于嵌入式Linux的语音识别系统硬软件设计-EDN 电子技术设计

 该设计运用三星公司的S3C2440，结合ICRoute公司的高性能语音识别芯片LD3320，进行了语音识别系统的硬件和软件设计。在嵌入式Linux操作系统下，运用多进程机制完成了对语音识别芯片、超声波测距和云台的控制，并将语音识别技术应用于多角度超声波测距系统中。

该设计运用三星公司的S3C2440，结合ICRoute公司的高性能语音识别芯片LD3320，进行了语音识别系统的硬件和软件设计。在嵌入式Linux操作系统下，运用多进程机制完成了对语音识别芯片、超声波测距和云台的控制，并将语音识别技术应用于多角度超声波测距系统中。通过测试，系统可以通过识别语音指令控制测量方向，无需手动干预，最后将测量结果通过语音播放出来。 1．引言 语言是人类传播信息的重要手段，语音识别则是实现语音控制的关键技术。采用嵌入式语音识别技术使得设备具有功耗低、使用简便、灵活等优点，摆脱了复杂按键和按钮的困扰，在服务机器人、智能家居及消费电子等领域发挥着重要作用。 2．系统构成与原理 语音识别主要包括两个阶段：训练阶段和识别阶段。在训练或识别过程中，都必须对输入语音进行预处理和特征提取。训练阶段通过用户输入的若干次训练语音，经过预处理和特征提取后得到特征参数，最后通过特征参数建模，进而建立训练语音的参考模型库。而识别阶段是将输入语音的特征矢量参数和参考模型库中的参考模型进行相似性度量，然后把相似度最高的输入特征矢量作为识别结果输出，从而达到语音识别目的，如图1 所示。

图1 语音识别原理框图
4g6ednc

语音识别技术可分为：特定人识别和非特定人识别两种。特定人识别是指需要对待识别人的语音进行采集训练，识别对象为专门的人；非特定人识别是指识别对象为大多数用户，一般要采集多个人的语音进行录音、训练和学习，从而达到较高的识别率。在实际应用中，现代技术开发嵌入式语音识别有两种实现方式：调入嵌入式语音开发包和外扩语音识别芯片。本文的语音识别系统方案是以嵌入式处理器S3C2440 为核心，外扩非特定人语音识别芯片LD3320，并将超声波测距模块和云台相结合作为系统的机械执行机构。系统测量过程如下：首先根据语音指令控制两自由度云台的位姿，使超声波探测器指向特定方向，然后开启超声波探测器，测量出前方障碍物距离，最后将测量结果转化为可以播放的二进制数据流，通过LD3320的播放功能完成数据的播放。 3．硬件电路设计方案 硬件电路主要包括语音识别部分、主控部分、超声波测距部分和舵机控制部分，如图2 所示。处理器为三星公司的S3C2440，系统主频最高可达533 MHz，支持SPI、I2C、UART等接口，能够满足控制系统的需求。主控芯片S3C2440 通过SPI 总线完成对语音识别模块的读写操作，超声波测距部分和舵机控制部分由处理器的GPIO进行统一控制。

图2 硬件电路设计方案
4g6ednc

【分页导航】

{pagination} 3．1 语音识别电路设计 为了使系统能够识别操作人员发出的语音指令，设计中采用了由ICRoute 公司设计生产的非特定人语音识别芯片LD3320，它集成了语音识别处理电路和一些外部电路，包括AD、DA转换器、麦克风接口、声音输出接口等，不需要外接任何的辅助芯片如Flash、RAM。在主控制器的控制下，可以识别出预先添加到识别列表中的内容。设计中参考了ICRoute 发布的LD3320 数据手册，图中LD3320 的P0、P1、P2引脚通过SPI 接口与嵌入式处理器相接，控制信号WRB、CSB、RSTB以及中断返回信号引脚INTB与处理器S3C2440直接相连，如图3 所示。

图3 语音模块和核心板连接关系
4g6ednc

3．2 超声波测距和舵机控制电路设计 超声波测距原理相对比较成熟，系统中采用超声波测距模块HC-SR04。该模块有两个TTL电平通信引脚，兼容3.3V电平。其中，控制端口Trig 发一个10us 以上的高电平，接收端口Echo 将输出与距离成正比的高电平信号。当Echo 有高电平输出时就开启处理器定时器，当端口电平跳变为低电平时关闭定时器，根据定时器的值可计算得到障碍物的距离。其中，控制端口Trig 和接收端口Echo 分别接至处理器的GPG9、GPG6引脚。超声波测距模块的感应角度小于15°，为了扩大测距的感应角度范围，将超声波测距模块安装在两自由度云台上，其中，舵机为SG90(9G)，旋转角度为180°。处理器通过GPB0和GPB1分别控制两个舵机以实现云台的旋转，以测量不同方向的障碍物，如图4 所示。

图4 超声波测距和舵机控制电路
4g6ednc

【分页导航】

{pagination} 4．软件设计方案 系统软件基于嵌入式Linux 操作系统，实现了语音识别、语音播放、超声波测距和舵机控制等任务，使用fock 机制为每项任务分配独立的进程，使系统可以进行多任务处理。针对不同功能模块编写了相应的底层驱动程序，为上层应用程序提供了调用接口。系统工作流程如下：处理器通过SPI 总线对语音识别芯片LD3320 进行通用初始化，使语音识别芯片进入循环识别模式，系统处理器反复启动语音识别过程。如果有识别结果，则根据识别作相应处理后（比如播放某个声音作为应答）再启动下一个识别过程。处理器通过SPI 总线读取C5 寄存器的识别结果并分析，将语音命令转换为超声波测距和舵机的控制信号，完成多方位测距任务，如图5 所示。

图5 软件流程图
4g6ednc

4．1 语音识别功能程序设计 语音识别芯片LD3320 的特色是兼有语音识别和MP3播放的两项功能，在功能切换的时候，必须进行通用初始化，对芯片进行一系列的设置。语音识别功能的驱动程序工作流程为通用初始化à语音识别用初始化→写入识别列表→开始识别→响应识别中断。为了提高识别成功率，在识别列表中增加了“垃圾关键词”以吸收错误的识别。上层应用程序为语音识别功能分配了单独的进程，通过ioctl()函数控制LD3320 的工作状态，read()函数可以读取识别结果。程序中使用select 机制实现read()函数的非阻塞访问。同时，设定select 监控超时时间，在超时后，重新初始化语音识别芯片LD3320，为下一次语音识别做准备，如图6 所示。

图6 语音识别功能程序流程图
4g6ednc

4．2 语音播放功能程序设计 LD3320支持MP3数据播放，程序中操作顺序为：通用初始化à播放模式初始化à音量调节à开始播放，并准备好中断响应函数，打开中断允许位。在程序中，首先将数字0~9、“十”、“百”、“点”的语音MP3数据分别转换为标准C语言数组格式文件，将该文件添加到工程中进行统一编译。然后把需要播放的距离数据进行拆分，并对每一位进行查表操作，得到相应的语音数据。例如，将距离数据12.5 拆分为：“1”、“十”、“2”、“点”、“5”。最后将查表得到的语音数据按从左到右的顺序组合，并存储到LD3320的播放数据存储器，在即将播放完毕时，芯片会发出中断请求，在中断响应函数中连续写入播放数据，直到声音数据播放完毕。 4．3 超声波测距和云台控制程序设计 超声波测距功能的驱动程序属于Linux 字符型驱动，利用ioctl()函数对相应GPIO进行时序控制，完成超声波的发射和接收。在接收端口输出高电平脉冲信号时，触发系统中断并使用定时器计算得到高电平持续时间△T，根据公式（1）完成距离S 的测量。式中V为超声波的传播速度，常温下超声波在空气中的传播速度是340 米/秒。在应用程序中，可以通过read()函数读取到所测量的距离值。 S =V X ΔT/ 2 （1）两自由度云台由两个舵机组成，分别控制云台水平和垂直方向的旋转角度。在驱动程序中，首先打开定时器PWM功能并设置定时周期，然后映射定时器中断函数，最后使能定时器，使定时器开始运行。程序中根据实验者发出的语音指令，利用ioctl()函数控制定时器输出两路PWM信号，分别控制两个舵机的旋转角度，最后将运动合成为云台的位姿。 5．结语 本文介绍了嵌入式语音识别技术在超声波测距系统中的一种应用以及实现方式，实验人员可以通过预先定义好的语音指令（例如：“开始测量”、“左上方”、“前方”）实现对系统的控制，并利用超声波进行距离测量。测量完成后，系统通过语音播放的方式将测量结果反馈给实验人员，完成人机交互，提高了用户体验度。本系统具有易扩展的优点，可以将其应用到其它嵌入式控制系统中。【分页导航】

阅读全文，请先

嵌入式系统

上一篇： 软件定义的分组传送网（SPTN）架构及技术演进 下一篇： 专为“压力”而生，简化传感器设计——就靠它了！

微信扫一扫
一键转发
最前沿的电子设计资讯
请关注“电子技术设计微信公众号”

2025松山湖中国IC创新高峰论坛：继续聊聊机器人去年的主题是智慧机器人，今年的主题仍然聚焦于机器人身上，不过变为了具身智慧机器人……
鹏瞰TS-PON Gen2芯片，用光协议重塑机器人“神经网络” TS-PON Gen2芯片是一款灵活的软件定义 SoC，适用于多种场景。它基于无源光网（PON）技术，具备高带宽（目前10G，未来可拓展至25G、50G）、低时延（微秒级）、高确定性等特性···
让人形机器人“耳聪目明”，昆泰芯KTM5900磁性编码器解编码器芯片作为机器人的核心传感器之一，对于提升机器人的感知能力、安全性和生产效率具有重要意义···
如何让具身机器人“看”得清？思特威给出了这个答案相比于滚动快门传感器，全局快门传感器能够同时曝光整个画面，有效避免了运动过程中产生的图像形变，为机器视觉提供高精度、无畸变的图像···
匠芯创M7000系列远超传统微秒级芯片，响应速度不到300纳 M7000 系列芯片已在人形机器人、机器人关节、高功率伺服驱动器等多个领域实现落地应用，与众多头部企业展开紧密合作···
极海推出全球首款双核Cortex-M52实时控制MCU/DSP 随着机器人技术的不断发展，其应用领域从传统的工业制造逐步拓展至医疗、农业等多个新兴领域，这对机器人的控制系统提出了更高的要求，当前机器人控制系统当前主要面临高爆发、高动态、高精度和高安全这四方面的挑战···
比人类更灵活？先楫HPM6E8Y机器人关节控制解决方案 HPM6E8Y通过硬件加速器将电机控制算法执行时间缩短至2.8μs，以全链路高实时通信与多轴协同能力，开启机器人关节“芯”时代。
为旌科技感算控一体化芯片落地，带来6倍效率提升？具身智能的本质是‘大脑（认知）+小脑（控制）+感官（感知）’的协同进化，需要芯片层面实现三者深度融合。
爱芯元智发布AX8850：让AI算力更便宜，让智能更可及爱芯元智希望把算力做得更加便宜具智价比，普惠AI，让我们的边缘智能更加触手可及···
万有引力EB100芯片亮相，空间计算走向低功耗新时代？ EB100芯片将为XR和机器人行业带来更好、更低功耗的空间计算和显示能力，开启空间计算时代的无限可能···
芯驰D9 Max：为具身智能而生的高性能SoC，一颗芯片顶五颗我们希望以1个芯片完成5个芯片完成的事情。当应用发生爆炸性的变化，融合一定是一个非常大的趋势，而且融合的过程会使软件的开发更简单，系统的开发更简单，成本控制得更好···
ST移动安全解决方案：构建全场景安全连接生态随着移动设备的普及与应用场景的复杂化，移动安全体系正经历关键变革——从早期依赖手机SIM卡的单一安全架构，逐步向融合NFC近场通信、嵌入式安全元件（eSE）及嵌入式SIM卡（eSIM）的多元技术体系演进。

25年第19周新能源周销量：不同价格带的车型走势解析本周插混与增程车型市场呈现出“两极化”趋势：一方面，10-15万元级的主流家用轿车与SUV销量强劲；另一方面，20万元
拆解报告：甲骨文3060W碳化硅服务器电源模块甲骨文服务器电源模块输入输出均为专用接口，采用热拔插设计。电源模块支持200-277V交流和240-380V直流输入，输
评测：森海塞尔ACCENTUM Open真无线耳机半入耳机森海塞尔ACCENTUM Open 真无线耳机采用半入耳式设计，搭配约4.4克的重量，佩戴舒适。耳机充电盒轻盈小巧，携带外
人形机器人如何做到“手眼”协同+“大小脑”协同？人形机器人正站在“走出实验室”的临界点。从本体制造、控制系统、核心零部件到应用场景拓展，技术与产业生态
南非2025年4月：奇瑞和长城汽车快速上升 2025年4月的南非车市增长，马恒达和现代的强劲回归是一个信号，而中国品牌的集体崛起，则预示着未来竞争将更加多
4月新能源车领跑汽车出口增长，中国汽车走向全球的新引擎 2025年开年以来的出口数据呈现出清晰的结构升级路径。新能源产品在出口中扮演的角色日益重要，不再只是锦上添
拆解报告：vivo手机原装90W氮化镓闪充充电器 vivo 90W氮化镓闪充充电器采用经典直板造型设计，同时附带一条专门量身定制的8.5A大电流数据线，配合信号屏蔽层
拆解报告：HONOR荣耀手环10 荣耀手环10在外观方面，延续了上代的轻薄双曲面设计，同时采用全新的双色NCVM镀膜工艺，使之更加的时尚精致。标配
2025年4月中国车企加速渗透土耳其市场：比亚迪Seal U打响突围战 2025年4月，土耳其市场的爆发式增长为全球车企提供了重要信号：新兴市场正在进入电动化转型的加速期，而土耳其作
2025年第19周新能源周销量：问界起势 2025年第19周，中国乘用车市场的周度销量达到44.4万辆，其中新能源车占比突破50%，达22.3万辆，占比50.2%。比亚迪体
2024年4月汽车市场终端数据：自主崛起、新势力分化、合资承压从整体销量数据来看，4 月汽车终端销量达 169.7 万，同比增长 9.3% ，在目前的价格力度下，这个销售数字差强人意。2
拆解报告：华为750W钛金牌服务器电源华为这款服务器电源型号为PAC750S12-TE，支持220V交流或240V直流输入，输出电压为12V，输出电流为62.5A，输出端设有

史密斯英特康推出新一代“ DaVinci Gen V”测试插座史密斯英特康推出新一代“ DaVinci Gen V”测试插座，为人工智能、6G通信及先进计算应用领域的芯片提供超
意法半导体高集成度低边电流测量放大器简化高准确度电流检测意法半导体的 TSC1801低边电流测量放大器集成了设定增益所需的匹配电阻，从而简化了电路设计，节省了物料清单
意法半导体推出创新的、带有可改变存储配置存储器的车规微控制器新推出的Stellar微控制器内置了xMemory技术，它为正在发展的软件定义汽车以及不断进化的电动汽车架构提供了一
新系列串口EEPROM内置唯一ID码，适合设备识别、溯源和可持续性应用意法半导体 (ST) 推出了一系列内置128位唯一只读ID码 (UID) 的串口EEPROM芯片，以满足市场对产品识别、溯
Vishay新添增强短瞬态脉冲防护性能的经AEC-Q200认证的厚膜功率电这些器件采用夹片式TO-247 封装形式，可直接安装在散热器上，具有高达 75 J/0.1 s的高脉冲吸收能力和 150
凉棚集成Nordic 技术实现Matter over Thread连接为家庭和企业 StruXure+ 凉棚和小屋系列集成 Nordic 的 nRF5340 SoC以提供无缝的 Matter over Thread 连接
智能楼宇技术全球领导者与Nordic Semiconductor携手合作确保楼业界连手推动NR+成为智能楼宇的全球连接标准···
Cadence 率先推出 eUSB2V2 IP 解决方案，助力打造高速连接新范 Cadence 在业内率先推出 eUSB2V2 IP，此 IP 基于先进的台积公司 N3P 工艺，符合最新的嵌入式 USB2 版
纳芯微发布双通道电流检测放大器NSCSA285，赋能工业与能源管理近日，上海 —— 纳芯微电子（简称“纳芯微”）发布全新高精度双通道电流检测放大器NSCSA285系列···
攻克PWM高频瞬态干扰难题！纳芯微发布车规级电流检测放大器NSCSA24 近日，纳芯微发布全新车规级双向电流检测放大器NSCSA240-Q1系列，专为汽车高压PWM系统打造解决方案···
TE Connectivity 推出INMORO系列：致力于满足中国市场需求而打造的连接和传感解决方案提供商泰科电子（TE Connectivity，以下简称 TE）工业事业部隆重推出INMORO 系列，致力于满足中
破解汽车与工业等应用新挑战，TDK展示多传感器融合与AI+发展趋势在新能源汽车应用中，热管理系统既要能高效地冷却和加热电池、电机与OBC等车辆核心部件，确保其处于最佳运行温

热门评论
最新评论

换一换

杂志声明

基于嵌入式Linux的语音识别系统硬软件设计