近年来,全球的互联网巨头都在抢占语音交互市场。谷歌在2016年推出自己的Google Home,亚马逊的Echo被认为是抢占家庭智能终端的秘密武器;而苹果也在2017年的开发者大会上发布智能音箱Homepod。

阿里与人工智能的火花早在两年前就已经擦起,2015年8月,阿里巴巴便联合飞利浦推出了阿里小飞WiFi音箱,尽管当时采用的是按键语音,但也向家庭交互终端迈进了一部。2016年8月阿里入股软银,做起了机器人的生意。不过在一年后做机器人业务的公司被解散了,转而成立的便是对人工智能——智能音箱的研究。

就在7月5日下午,阿里巴巴发布了智能音箱天猫精灵X1,高128mm,直径83mm,售价499元。有意思的是,在众多的智能音箱产品中,阿里人工智能实验室的负责人陈丽娟特意选取了亚马逊Echo和苹果HomePod与天猫精灵放在一起做了对比。

天猫精灵X1技术细节:如何实现声纹购物

相比亚马逊的 Echo 和苹果的 HomePod,X1 的体积控制的比较好,高度 126mm,直径 82mm,而亚马逊 Echo 的尺寸为 235 mm x 84 mm 。

这款音箱应用了思必驰环形6麦阵列技术方案,可实现360度全角度拾音,支持5米远场交互,同时应用了语音识别,语音合成,回声消噪,语音增强等技术,此外还采用了专业音效调节的独立功放芯片,使得X1也具有优秀的外放效果。

天猫精灵的语音识别技术,不同于其他智能音箱所使用的科大讯飞、出门问问之类的语音识别技术,而是阿里单独研发的语音识别,它的优势就在于采用了声纹技术,它会根据声音条件识别出不同的使用者,以此保证使用的安全性和私密性。这也为语音购物中的支付环节提供了安全保障。

浅雪介绍,声纹识别技术是生物识别的重要识别手段之一,结合服务链多重安全机制,已达到商用的级别。这也是阿里在语音深度学习领域的核心技术之一。据悉,天猫精灵目前最多可以识别 6 个人的身份。

用户先将自己的声音注册后生成声音密码,与机器绑定后,确认开启声纹购功能。随后,当用火狐说出 “帮我买一箱牛奶” 这样的需求时,天猫精灵会要求用户跟着念一串随机数字进行声纹校验,如果确认为用户本人,天猫精灵会从用户绑定的支付宝中进行扣款完成交易。

在多轮对话技术方面,阿里技术团队则在自然语言理解的基础上,加入了「决策引擎」的机制,使得机器能更好理解上下文语境,并判断响应的模块进行决策。

通过深度机器学习,天猫精灵 X1 已兼容 20 个领域的自然语义理解。阿里人工智能实验室研发的中文语义理解引擎针对常用的定时,提醒,天气,娱乐内容,家居控制,助手,以及购物等领域进行了特别优化,仅天气预报就能够理解 786 种中文问法。

作为对比,亚马逊的 Echo 目前还不支持声纹识别。

021ednc20170706

软件方面,天猫精灵则采用的是阿里自家团队研发的 AliGenie 语音交互系统,目前阿里人工智能实验室正在对声纹识别、声纹购、NLP 中文对话引擎等核心技术申请专利,就在不久前,阿里的 NLP 技术团队还发表过一篇自然语言处理相关的论文。

既然是要实现语音购物,基于安全性的考虑,声纹识别功能就显得十分重要。阿里推出的声纹购是业内首个实现商用的声纹购物系统,当用户发起购物、充值等行为时,只需要说出声纹密码,识别系统将会自动进行身份校验,确认是本人后才会完成交易,否则将拒绝请求。

在硬件方面,天猫精灵搭载的正是联发科在今年的谷歌 I/O 2017 开发者大会期间发布的 MT8516。这款芯片主要面向智能语音助手设备(Voice Assistant Devices)和智能音响的系统设备。

据了解,MT8516 支持四核心 64 位 ARM Cortex-A35,主频为 1.3GHz。该芯片还内建 WiFi 802.11 b/g/n 和支持蓝牙 4.0。此外,MT8516 还支持多达 8 个 TDM 通道和 2 个 PDM 输入,以支持来自多个源的音频输入,适用于远场(Far-field)麦克风语音控制和智能音响设备。

相比此前市面上的主流芯片,X1采用的这枚SmartAudio专业处理芯片,在解码、降噪、声音处理、多声道的协同等方面做了专门的优化处理,处理效率提升25%,功耗降低32%。

值得一提的是,联发科曾表示,预计第一款使用MT8516的谷歌智能语音助手设备将在2017年第四季度出现。如今阿里抢先采用,联发科估计已经在偷笑了。

背靠电商,瞄准的依然是你的钱包

业内首款可购物智能音箱应该是亚马逊 Echo ,只是可惜,Echo 还不会讲中文,国人也不习惯上亚马逊购物。

而国内最有望率先实现这个功能的,便是京东与阿里。京东旗下的灵隆科技,已经于两年前布局了智能音箱。如今阿里率先实现了语音购物,对于同是电商的京东来说,实现语音购物功能也不过是个时间问题。

022ednc20170706 白色版天猫精灵 X1

发布会现场直播测试了天猫精灵的购物功能。根据现场演示,仅需一句唤醒词,再加上告诉它商品名称,天猫精灵就能够自动根据销量、售价等参数推荐排名靠前的商品;然后经过声纹识别身份验证,就可实现支付宝自动扣款,而后续的物流信息也可通过语音查询。

天猫精灵产品经理释空介绍说:「由于淘宝商品品类丰富,名词繁杂,因此技术团队对所有商品信息进行了标签化整理,使得天猫精灵在向用户介绍商品信息时更加口语化。精准的声纹识别则保证了支付环节的安全性,也方便对商品售后服务的跟踪查询。」

当然,作为一款定位于家居环境使用的智能音箱,天猫精灵也集成了生活信息查询、健身助手、儿童陪伴等智能音箱的标配功能。不过,其中也有两项便捷功能让人颇为印象深刻。

一是家用电器控制。根据释空的介绍,这款音箱能同时实现终端设备一对一、一对多的家用电器控制,还支持多种场景模式的选择。例如下班回家,唤醒天猫精灵后会自动切入回家模式,则设置好的必用电器,如点灯、排风扇、电视、空调等会同步打开,此谓一对多;而如果觉得空调温度太低,或者灯光太暗,则可语音告诉音箱单独提升温度、灯光,此谓一对一。根据王自如现场的演示,利用天猫精灵来点播音频,或是操控电视点播视频节目,电器的反应速度也十分快速。

二则是寻找手机功能。大家或许都曾有过在上班时却发现手机不见了的窘迫时刻,而这时告诉天猫精灵寻找手机,它就会自动拨打手机号码,使用者再根据铃声或是亮光寻找手机。有人会想将来这款音箱会不会替代手机进行家人间的多方通信呢,这就得问其背后的阿里通信了。

还有哪些主流智能音箱?

根据CIR的报告,自2014年11月发布到2017年1月,亚马逊Echo系列(包括Echo、EchoDot和Tap)用户已达到820万,公司2017年的销量目标是1000万。另外,无论是国外的苹果HomePod、谷歌的Google Home,还是科大讯飞联手京东联手推出的叮咚智能音箱,以及喜马拉雅小雅音箱,都在抢占智能音箱这片新的蓝海。

**亚马逊Echo **

价格:180美元

亚马逊是第一个打开家庭智能音箱市场,有先发优势,目前也是销量最好的一款产品。据统计,Echo在2016年卖出了超过650万台,2015年则是170万台,预计2017年超过1000万台。

从市场占比来看,亚马逊也有绝对领先。根据市场咨询公司eMarketer发布的报告,美国语音智能音箱用户约70.6%使用的是亚马逊产品,谷歌只占了23.8%,其它企业合计占有5.6%的市场,这些企业包括联想、LG、哈曼-卡顿、Mattel。

值得一提的是,亚马逊Alexa是跨平台语音操作工具,把物联网标准连接起来,这才是Echo的最大野心。

苹果Homepod

价格:349美元

HomePod是一个互联互动的音箱,不同的音箱之间可以实现实时互联互通。将多个HomePod放在同一个房间,或者在不同房间放上多个HomePod,它们之间会自动检测并相互平衡。

主打音乐也是HomePod的核心优势。其实苹果早已是音乐领域的巨头,根据市场分析公司Verto的最新数据显示,2017年2月Apple Music在美国市场的独立活跃用户数达4070万,排在流媒体音乐服务榜首,与其相比,第二名和第三名的Pandora与Spotify活跃用户数则只有3260万和3040万。苹果选择从音乐切入,依赖天然优势可以很快打通消费市场。

**Google Home **

价格:129美元

对于已经追赶一年Echo的GoogleHome,其整体销售业绩并不理想。在亚马逊预计今年仍将将控制约70%的语音音箱市场情形下,谷歌的销售数字仍然会徘徊在这个数量的三分之一左右。

当然,Google Home与亚马逊Echo的对比也有其优势,首先Google Home支持多房间音频功能,包括与Chromecast等设备联动,这是亚马逊Echo所不具备的。

其次,Google Home集成谷歌最新的助手功能,类似于苹果Siri,不仅能够听懂用户在说什么,还能够实现互动式的交谈。而亚马逊的Alexa只会在一定的设定值内实现对话,不能算是真正的交互。最后是可定制外观,Google Home更加个性化。(6)销售定价129美元,与Echo明显差异化,主打低端消费者。

**叮咚音箱 **

价格399元

叮咚音箱是有科大讯飞和京东联合发布的,其搭载了科大讯飞的智能语音系统,这款音箱内置8个收音麦克风,在5米范围内均可准确识别语音。

内容方面,基于百度音乐、百度搜索/百科、喜马拉雅FM等音乐服务、有声读物,以及大数据支持,叮咚音箱涵盖了中英文语音识别、热点新闻播报、百科知识大全等等,除了听歌、听书、听小说以外,在生活学习等方面也可以给用户提供帮助。

此外,叮咚智能音箱还可以对京东微联生活馆里的上百种智能家居产品--电视、洗衣机、空调、净化器等进行语音操控。用户只需要通过手机APP设置相应场景模式,即可进行轻松操控。

借助京东强大的电商能力和渠道营销支持,叮咚成为国内销量最高的智能音箱产品。数据显示,在国内智能音箱品类里,叮咚市场占有率已达到70%,叮咚与用户超过1亿次的持续交互。

**喜马拉雅“小雅”音箱 **

价格:999元

6月21日,喜马拉雅FM在京举办发布会,推出全内容AI音箱“小雅”,并在现场与彩虹室内合唱团完成了“人机合唱”的演出。

喜马拉雅FM联席CEO余建军表示,“小雅”是围绕目前用户的真实收听需求打造的一款“内容型音箱”。在此之前,几乎所有的智能音箱都是“交互型音箱”,音频或音乐平台仅是作为接入方授权提供一定的内容。目前“小雅”获得喜马拉雅FM、百度音乐、虾米音乐以及豆瓣音乐等各平台内容的授权。

据喜马拉雅FM公布的数据显示,截至6月20日的发布会当天,“小雅”已售出超过50000台。据透露,目前销量约七成以上由喜马拉雅FM用户包揽,主要原因便在于其基于现有用户的真实收听需求而打造。

**联想智能音箱 **

价格:899元

在今年1月的美国·拉斯维加斯CES上,联想发布了一款智能音箱。

联想智能音箱在机身顶部,采用了8颗麦克风阵列,可以对声音进行360°定位,并采用噪声抑制与回声消除技术,使其能够接收高达5米远的用户语音命令。内容服务方面,联想与喜马拉雅FM、考拉FM、酷我音乐、滴滴出行、百度地图、中国天气网深度合作,为用户提供音乐、有声读物、叫车、天气查询、语音留言、闹钟、记事、提醒等多重服务。

**酷狗智能音箱 **

价格:1990元

今年6月,国内知名音乐平台“酷狗”正式发布了旗下新款音频产品——酷狗智能音响。酷狗智能音响凭借其铝合金的全金属外壳,高清流畅的触控屏幕及可旋转的人性化操作方式,获得2016年德国红点产品设计奖。

在线音乐资源,酷狗智能音响获取了酷狗海量正版音乐库,1700万在线曲库,实时与200+家音乐公司对接,即时更新,随时推送给喜欢音乐的用户。

20160630000123