苹果推出Siri已经7年,杰夫·贝索斯(Jeff Bezos)受到《星际迷航》的启发推出Alexa也已经3年。

其实,以人工智能为基础的互动界面早在数十年前就已经出现。1966年,麻省理工学院教授Joseph Weizenbaum推出了ELIZA——这被普遍是做当今对话型人工智能的原型。

几十年后,在《连线》的一篇报道中,Andrew Leonard声称“机器人将会大热”,而且认为这种几乎技术很快就能“帮我找到最划算的CD,给我母亲选花,让我能报道莫桑比克的最新进展。”由于该文发表于1996年,所以举例时使用了早已过时的CD。

如今,Slack、星巴克、Mastercard和梅西百货等公司都已经通过改变,在客户服务、联网家居和网上订花等诸多领域使用对话型界面。

如果你怀疑这项技术的价值或前景,可以看看Gartner对2019年之前的预测,这家市场研究公司认为,虚拟个人助手“将改变用户与设备互动的方式,成为生活中普遍接受的一部分。”

012ednc20170822

并非所有的对话型人工智能都是平等创造的,也不应如此。对话型人工智能包括虚拟个人助手(Alexa、Siri、Cortana和Google Home)和专业助手(X.ai和Skipflag)两类。它们可以基于一套规则引擎开发,也可以使用机器学习技术。用例范围既包括具体而琐碎的任务(塔可钟的TacoBot),也涵盖通用而广泛的服务(Alex、Siri、Cortana、Google Home)。

很多组织也考虑在个人或职业领域部署对话界面,通常都依靠合作伙伴提供的技术。但除了技术之外,仍有很多需要考虑的问题。虽然现在称之为“实战指南”还有些为时尚早,但各大组织在考虑尝试或部署对话型人工智能时还是参考以下几点:

1、从一个有明确答案的小领域切入

“重点是产品或品牌。”Slack开发者关系总监Amir Shevat说,“不应该想‘我在开发一款机器人’,而应该这么想:‘我要提供什么样的服务?’”

Shevat和其他人认为,除此之外,最好的启动点是寻找那些可以用大量数据数据缓和或解决的棘手问题。这并不是说所有成功的机器人都应该做同一件事情,但关键要从一个有明确答案的小领域切入,然后设计一番用户通常不知道自己可以享受的体验。

2、目标决定互动模式

有的对话很适合语音互动。例如,开车的时候或者要开启家中暖气的时候。但在询问银行余额这样的情况下,或许就需要通过文本输入精确的隐私信息。但还有其他方式可以帮助用户与机器人互动。下图显示了两种成功的互动例子。

013ednc20170822

“很多人仍对机器人有一种误解,认为只能说话或打字。”微软的Chris Mullins说。事实上,机器人可以通过许多方式(或形态)与人互动或传递信息:

语音(Alexa、Siri、Google Home)

打字(聊天应用中的机器人)

通过键盘支持来提供线索,从而缩小输入选项的范围

展示视觉化信息的卡片

“在最成功的情况下,”Mullins说,“我们会看到一种混合的形态胜出。在合适的时候,语音很完美。但在其他时候,打字又很完美。有的时候,你也想使用卡片或键盘支持。确定对话模式是一种及其难以解决的问题,还没有人能够完全搞定。”

3、认真规划和明确选择多重背景

如果一个顾客向零售商询问这样的问题:“在我附近的店里,哪里能找到电钻?”开发者就必须根据客户所在的位置考虑问题。她现在是否身处店内?她在使用手机还是家里的电脑?开发者必须针对多重场景和体验进行设计。

这一过程很有挑战,因为需要在确定范围的过程中设想不同的互动模式。“与人类互动非常复杂,确定对话模式很困难。”Mullins说。要实现最好的效果,项目团队就必须从一开始就做出选择。

4、持续的互动需要持续理解背景信息

要理解“播放碧昂斯的《Lemonade》”和“查查我的银行余额”这种单一命令是一回事,而要针对人类与聊天机器人之间的互动编写程序则是另外一回事。正因如此,人类与机器人展开的多重交流(“回合”)才如此复杂和难于开发,这需要充分理解背景信息。

下图是一个来自Kasisto的例子,表明了简单的支付互动过程中蕴含的复杂性。

014ednc20170822

第一回合:

用户让Kai(聊天机器人)向Emily支付5美元。

Kai在用户联系人列表里面找到两个名叫Emily的人,询问究竟是哪个Emily。

第二回合:

——用户转换话题,询问自己的账户还有多少钱。

——Kai回答后,接着说,“我们现在说到哪儿了?”然后继续最初给Emily支付5美元的话题。

起初看来,这像是一个非常简单的互动,但从工程角度来看,却需要深入理解背景和语言:

首先,Kai必须认识并追踪用户的目标,具体到这个案例,付钱给某人。

第二,Kai必须确定支付对象。在发现用户有两个叫Emily的朋友时,就需要通过询问来确定具体的支付对象。

第三,Kai必须明白“Neubig”这个独立出现的单词是在指代前面对话中的内容,意思是付钱给Emily Neubig。

第四,Kai必须解读“我账号里有多少钱?”这句话的意思,明白这是一个全新的请求,与之前的两个互动并不相同。

最后,它还必须回答这个新的请求,然后继续刚才的对话,完成最初的请求:向Emily支付5美元。

这段对话证明,为什么明确的目的、缩小回答范围和深入的专业知识都对聊天机器人的开发至关重要——因为要在用户通过自然的方式表达时理解其意图是一件非常复杂的事情,但如果想要提供有效的体验,这一点却至关重要。

5、EQ跟IQ同样重要

高超的智能和明确的用户意图并非机器人取得成功的唯一要素,探测情绪、选择合适的文字和语调同样是确保舒适的对话体验的关键。因此,很多实验室和创业公司都在开发一些软件,通过图片、语音、文本或视频来探测情绪状态。。

SRI International的语音技术和研究实验室就开发了SenSay Analytics平台,号称可以通过语音信号感知说话者的情绪。这样才能知道用户何时感到困惑,并为其提供人类互动对象,也可以判断用户是否善于接受,从而为其提供相关的内容。

6、品牌化机会很小,但很有效

品牌化是机器人取得成功的关键因素。效果不佳的机器人会破坏声誉,而强大的品牌触角也可以帮助机器人取得成功。“我认为,对话型界面中的品牌化机会相对较小。”Adobe的Lars Trieloff说,“所以,应该在日常互动中利用品牌。确保它能把一件事情做得很好,完全符合客户诉求。”

目前还处在利用对话型界面的初期,还有很长的路要走。但对话型人工智能——那些能够更好地模仿人类的方式与机器互动的程序——将会扎根于此。现在可能有些原始,但数据科学、自然语言技术、机器学习和其他科技的进步,最终会为更加流畅的人机互动创造必要的环境。

对话型互动是否会等同或好于人类之间的互动?有些类型的互动可能永远都不容易通过机器展开。但对某些用途而言,或许可以实现这一愿景:我们已经看到了很多创新,但现在只是冰山一角。

有一件事情是确定的,正如未来学家和创意策略师Monika Bielskkyte所说:“我们正在进入一个没有屏幕的未来。”她预计,“未来,整个世界就是我们的桌面。”

(来源:量子位;李杉编译)

20160630000123