广告

安静!我要跟车子讲话...

2019-11-06 Junko Yoshida 阅读:
安静!我要跟车子讲话...
随着CarPlay、Android Auto以及Echo Auto等平台渗透乘用车市场,车内语音识别技术预期将成为主流;但仍有一个答案未知的问题是:市场上有任何语音启动技术已经准备好随机应对车内的关键任务了吗?

在今年1月举行的国际消费性电子展(CES)上,当媒体看到高通(Qualcomm)展示了在其车内Smart Audio平台上的Amazon Alexa语音识别功能,就对未来发展有了一些想象。高通的展示预示,车内虚拟助理将会使得语音成为驾驶人与车辆之间的自然沟通接口。T2fednc

高通的展示中最令人印象深刻的一幕,是Alexa在高通的某个高层说话时打断他,说:“不对!这不是真的。”欧喔…在展示中发生这种小“突槌”事件在所难免;而且另一方面,目前的商用语音处理系统也会发生这种语音处理失误。T2fednc

语音识别系统通常辨识度不佳,特别是在吵杂的环境中;车内就是一个非常吵杂的环境。来自以色列的新创公司Hi Auto执行长暨共同创办人Roy Baharav在接受EE Times访问时就指出:“你可以想象坐后座的小孩们在吵闹、救护车从旁边呼啸而过,还有大雨打在车顶上…”T2fednc

为了消除噪音以及改善车内语音识别的可靠度,Hi Auto开发了一种视觉语音(audio-visual)解决方案,利用了面对驾驶人的摄影机以及单个麦克风,以深度学习算法追踪嘴唇运动,这种整合式的“视觉语音”解决方案会锁定驾驶人,同时清除其他麦克风与噪音。T2fednc

而预期的输出则是“干净的音讯”,Hi Auto声称如此能实现更准确的语音识别以及清晰的对话;该公司的计划是提供“只有软件”、不搭配特定硬件的系统。T2fednc

车内语音识别

语音输入可望成为终极语音接口,但也只是“可望”;今日的语音输入技术相对较新,对很多人来说,跟一个没有生命的物体交谈还是感觉很怪。所以如何养成人们在车内使用语音控制接口的习惯?毕竟Hi Auto的成功取决于语音控制普及性,特别是在汽车产业。T2fednc

对此Baharav表示:“在很多高阶车款中,语音控制已经被广泛采用,而且这种技术也渐渐渗透到大众车款;”这种趋势得益于支持语音控制接口的车用资通讯娱乐系统越来越受欢迎。而且他认为,车内资通讯娱乐系统的语音助理不只有娱乐功能,“将负责关键任务。”T2fednc

Baharav进一步解释,首先透过可视接口控制的各种车内装置功能,已经变成驾驶人分心的原因之一;其次,汽车产业正面临越来越严格的安全法规;第三,已经习惯在家里使用Amazon Echo或是Google Home等语音助理的消费者,也在寻求车用的类似方案。T2fednc

015ednc20191105.jpgT2fednc

根据市场分析机构voicebot.ai的2019年最新调查,美国有60%消费者在购车时会将语音助理系统做为考虑条件之一。(来源:Voicebot.ai)T2fednc

而且Hi Auto也不是唯一看好“会说话的车子”的公司;Baharav估计,目前该市场上约有5亿美元规模,成长也非常快速。他举例指出,已经在该市场上经营一段时间的、从语音识别业者Nuance独立而出的Cerence,就被认为一年的营收达到3亿美元;还有一家公司SoundHound在市场上的版图也持续扩张。T2fednc

分析师预期,透过语音助理衍生的商业与广告收入将在2025年达到200亿美元,而且车用将会是主要的贡献者之一。而根据Baharav观察,对汽车产业来说更重要的是,车厂将车用资通讯娱乐系统的差异化视为打品牌的关键,因此这是一个可利用的好机会。T2fednc

Baharav解释:“随着语音控制变得越来越重要(Google预期2020年有五成的在线搜寻是透过语音),车厂也觉得他们必须要支持这种接口;”如果有人忽略了快速成长的语音搜寻市场发展趋势,会有被淘汰的危险。T2fednc

语音控制能用在关键任务?

语音控制最立即性的应用是车用资通讯装置接口,驾驶人能以语音指令完成打电话、发简讯、播放多媒体,或是导航等等功能。还有什么其他需要跟车子说话的理由吗?T2fednc

Baharav表示:“想象一下共乘车还有家庭用车;”当车内有不只一个的资通讯娱乐系统需要控制,而且要一次处理好几个语音指令,高质量的车内语音技术会变得非常重要。此外随着先进驾驶辅助系统(ADAS)功能越来越多样化,他预见未来驾驶人可以出声指挥车子变换车道、超车,或者是停进某个停车格,而且其可靠度以及抗噪音的能力会让人惊艳。T2fednc

推动创新的基本力量,来自于车厂对于牢牢掌握数字体验方案的渴望;但并非让驾驶人习惯CarPlay、Android Auto,而是希望消费者使用车厂自家的车用资通讯娱乐系统(IVI)。Baharav指出,在这种情况下,车厂们将会提供原厂内建、使用者友善的IVI,而且支持热门的音乐串流、数字广播或实时通讯应用程序。T2fednc

他补充指出,对车厂来说,更重要的是“将IVI与自家开发的地图软件、广播、通话/简讯支持、车身控制、ADAS互动,还有涉及其他车身硬件的软件程序结合;”随着这些车内应用程序不断增生,车厂必须要具备至少能与Google Assistant与Siri媲美的语音控制技术。T2fednc

很遗憾的是,“目前个别解决方案在语音助理质量方面仍嫌不足,特别是在吵杂的环境中;”Hi Auto期望能藉由针对车内环境永恒存在的瞬间吵杂问题、还有人们习惯在车内交谈的情况提出解决方案来让自己与众不同:“我们必须确保车子听清楚驾驶人说什么。”T2fednc

若是车内语音控制指令失效…

Hi Auto的明确目标是,藉由改善语音分离(speaker separation)以及强化语音识别,在车用语音控制市场占据一席之地。我们询问了Baharav目前的智能型手机或智慧扬声器在噪音消除能力上不足的几个应用场景。T2fednc

例如一个爸爸驾驶休旅车载女儿们还有她们的朋友们一起去练足球,他注意到汽油快没了,不过他们在高速公路上,需要改变导航的方向。他不想花太多时间滑触控屏幕去找加油站,但是车子里的噪音太大了(很多小孩在叽叽喳喳),车子听不清楚爸爸的指令。T2fednc

Baharav表示:“这种情况无法以最先进的指向性麦克风来解决,因为孩子们坐在爸爸后面;而噪音消除也无法解决这个噪音,因为并非静态的,无法学习并消除。”T2fednc

另一个例子是,一位女性驾驶在大雷雨中开车上高速公路要去上班;在雷鸣闪电中,车子的报器响了,暖气的风扇已经开到最大。她想告诉同事她上班会迟到,但发简讯太危险,所以她对着车内系统用讲的,但系统的反应却一直是:“抱歉,请说大声点…”T2fednc

Baharav表示,这个情况也无法用最先进的指向麦克风来解决,因为噪音来自四面八方。噪音消除也无法解决噪音,因为这同样非静态,无法学习并消除(瞬间噪音)。T2fednc

Hi Auto近日解除了隐身模式,完成450万美元的种子轮募资,由一家以色列汽车进口商Delek Motors以及其现任董事长Zohar Zisapel主导。其他投资人还包括运输业者Allied Holdings、Goldbell Group与Plug & Play。T2fednc

这家新创公司预计用种子资金完成第一款产品的开发,并展开销售与扩充团队;Hi Auto表示,已经汽车业界领导厂商安排在2020年初测试其技术。在2020年的CES展之后,Hi Auto打算以软件开发工具包(SDK)的形式推出车内语音解决方案,透过简单的授权方式,或是以软件即服务(SaaS)的模式提供云端API。T2fednc

(原文发表于ASPENCORE旗下EDN姐妹媒体EETimes,参考链接:'Be quiet for a sec? I'm trying to talk to the car.',编译:Judith Cheng)T2fednc

 T2fednc

本文为EDN电子技术设计 原创文章,禁止转载。请尊重知识产权,违者本司保留追究责任的权利。
Junko Yoshida
ASPENCORE全球联席总编辑,首席国际特派记者。曾任把口记者(beat reporter)和EE Times主编的Junko Yoshida现在把更多时间用来报道全球电子行业,尤其关注中国。 她的关注重点一直是新兴技术和商业模式,新一代消费电子产品往往诞生于此。 她现在正在增加对中国半导体制造商的报道,撰写关于晶圆厂和无晶圆厂制造商的规划。 此外,她还为EE Times的Designlines栏目提供汽车、物联网和无线/网络服务相关内容。 自1990年以来,她一直在为EE Times提供内容。
  • 微信扫一扫
    一键转发
  • 最前沿的电子设计资讯
    请关注“电子技术设计微信公众号”
  • 实现超低功耗、高性价比语音交互应用的音频方案 音频/语音用户接口(VUI)是未来人机交互的一个重要的新兴趋势,将越来越多地用于智能家居控制、楼宇自动化、智能零售、联接的汽车、医疗等物联网垂直领域,这涉及语音触发、识别、处理技术,同时设计人员还面临如何提高能效的挑战。
  • 再获新能源汽车大厂订单,富士通原厂+代理身份完美布局 过去十年,随着新能源汽车与自动驾驶的兴起,汽车产业70%的创新来源于汽车电子技术及其产品的开发应用。IC Insights数据显示,预计2018年汽车电子的销售额将增长7.0%,2019年将增长6.3%,成为六大半导体目标市场中两年来的最高增长率。
  • Alexa,能听见我吗?探讨不断发展的低功耗语音接口技术 语音识别并不像你想象的那样新。业界已对其进行了约60年的研究,有成功也有失败。现在云处理和大数据已能实现好得多的语音识别和控制。本文最后还将介绍一些关于汽车GPS导航系统双向音频的有趣的新概念。
  • 在近边缘设备中部署HMI功能以实现IIoT连接 随着近边缘设备智能化的提高,并非在所有情况下都需要用集中控制器和HMI来连接上层计算系统和IIoT。这些近边缘设备已经在其嵌入式平台操作系统(如Linux或VxWorks)中处理了所需的实时控制和监视功能。许多这些设备所没有的是:绕过集中控制器和HMI,将信息直接传递到上层计算平台和IIoT的途径。为实现这种高级连接,数据收集和相关功能通常可以直接嵌入到近边缘设备中。
  • VR及智能手机如何用MEMS技术实现眼动追踪? 2016年被广泛认为是VR元年,眼动追踪等相关技术开始进入高速发展阶段。本文介绍两种MEMS技术在眼动追踪中的应用。
  • 为何物联网设备都需要地理定位功能? 本文将探究应用于追踪高价值资产的定位功能有何显著优势。
广告
热门推荐
广告
广告
EE直播间
在线研讨会
广告
广告
面包芯语
广告
向右滑动:上一篇 向左滑动:下一篇 我知道了