054:Chatbot 崛起、失败以及未来的进化路径

大概从 2015 年下半年开始,Chatbot 迅速成为硅谷投资人和科技媒体的「宠儿」,比如 Evernote 创始人、现投资人的 Phil Libin 就将自己对 Chatbot 的惊喜形容为 2007 年排队 4 小时买下 iPhone 时的心情

There’s an interesting leading indicator of when a new industry is about to go mainstream: the limiting factor shifts from technology to design. Developing mobile apps before the iPhone was all about fitting into cramped resources and figuring out clever ways to cheat the limitations. After 2007, it was about the design. That’s not to say that the tech stopped being important or stopped improving; just compare the massive improvements under the hood over the past few years; but the real difference between successful apps and also-rans usually came down to design. I think bots are going to be entering that phase now.

但这个理由并不充分,早在差不多两年前,a16z 的Benedict Evans 在推演移动互联网下一个变革机遇时就认为,由于基于移动平台的消息类应用将成为移动端进化的主要变量,因此由消息应用衍生出的「应用里的应用」将成为用户注意力消费的新中心。

这个推断逻辑也是过去几年全球范围内用户消费变化的写照。微信、Facebook Messenger都已成为不同地区消息类应用的绝对垄断者,两者现在也越来越多迈入一个「战区」——连接一切。

于是,基于自身庞大的用户群体,FB 与微信在自身应用内构建了又一层应用体系——也就是所谓的 Bot。Facebook 倾注大量心血的 M,已经是可以实现聊天、搜索、预定鲜花或咖啡的任务,并鼓励第三方开发者在 Messenger 里开发 Bot;微信则在原有公众号、服务号的基础上, 2017 年重磅推出的小程序,也一度让人们看到微信在重构浏览器、Web 上的野心,尽管目前声音不大,但考虑到其如此大的用户体量,未来的走向还是令人关注。

某种意义上说,正是这些社交应用或准确地说消息类应用才推动了 Chatbot 的火热,另一个大背景则是,全球范围内的移动互联网基本都到了一个尴尬的境地:巨头垄断了头部的重点应用和流量;用户对于新应用的兴趣越来越小。

在中国,从传统 BAT 到新贵 TMD (今日头条、美团、滴滴),掌控了当下中国主流社会在移动互联网上的所有注意力。

下图是一份来自 Business Insider 对于苹果 Apple Store 、Google Play 商店的调查数据,你会看到尽管应用商店的应用越来越多,用户也会热衷下载应用,但真正打开率却非常非常低:

2e721cf2c8975f7f2d5a561ab2eff0d0.png

正是这样的现实背景,所谓 Chatbot 将替代 App 的言论一直甚嚣尘上,但这的确是个伪命题。

Chatbot 本质上是一种基于自动化的交互方式——可以是文字(文字居多)、语音或图片。这种交互方式快速崛起的技术背景就是机器学习的进步,由此带来了自然语言处理、语音识别、图像识别的重大突破,也让程序初步具备了「理解」能力。

但这种「理解」能力却是非常初级的,有些「理解」能力是建立在对某些特定词语的回复中,类似于下面这个案例:

IF user's input contains 'shop' or 'buy';
THEN send message with product list

一旦用户用一些不常用的词汇时,Chatbot 就懵逼了:
f61a01d1ef226aa9818ceacd9aa1acdc.jpg

2017 年 2 月份,根据科技媒体 The Information 的报道,Facebook 的M 和 Messenger bot 面临巨大挑战,其中 M 能够正确回应的请求只有 30%:

the technology “could fulfil only about 30 per cent of requests without human agents.” And that wasn’t the only problem. “The bots built by outside developers had issues: the technology to understand human requests wasn’t developed enough. Usage was disappointing,” we’re told. Now it’s simply trying to make sense of the conversation.

其二,缺乏必要的用户场景与系统整合。如果 Chatbot 的终极目的是「终结」App,那么势必在用户体验和使用场景上具有一定优势,但现实则是,用户打开某个基于某社交应用里 Bot 的效率并不比打开原生 App 高多少。更重要的是,这些「应用里的应用」,在用户体验、功能选项上也做出不少让步。

另一方面,站在企业的角度,开发一款 Chatbot 的目的不是仅仅是 Branding(市场营销),而是一个服务。换句话说,倘若开发一个与 Spa 有关的 Chatbot,如果没有整合预定 Spa 的功能,这个 Chatbot 就是个废物。

其三,以用户心理的角度来理解,当下 Chatbot 并未走出第一代 Chatbot 伊莉莎某个「发现」。作为伊莉莎的「创造者」约瑟夫·魏泽鲍姆(Joseph Weizenbaum)惊讶地发现,很多人沉迷与伊莉莎的聊天,甚至会透露一些私密的个人信息。

53b84c92b23ccad5740aef585cdc83a6.png

伊莉莎「出生」在1966年的 MIT,用于在临床治疗中模仿心理医生。尽管伊莉莎的实现技术仅为关键词匹配及人工编写的回复规则,导致对话是单向的而且也会产生一些很奇怪的回复,比如,当用户提到自己的妈妈时,伊莉莎会以「你说你妈妈?」这样的句子来回复。

对此,硅谷记者约翰· 马尔科夫在《与机器人共舞》里这样评价:「这一发现对机器的本质来说或许用处不大,但对人类的本质来说则是了不起的,这证明人类习惯在与自己互动的对象中寻找人性存在的迹象,从没有生命的物体到提供虚拟人工智能的软件程序,无一不是如此。

Chatbot 在中文里一般被译为「聊天机器人」,如今除了微信,手机百度里的度秘、手机淘宝中的小蜜、手机京东的 JIMI 等等,无数个聊天机器人等着你去「召唤」,但这些连同上文所言的聊天机器人几乎都有一个共性:基于文字的「聊天」。

至于原因,从技术上并不难理解。语音的口音、语义问题始终是个门槛,大公司各自有各自的解决方案,小公司很难短时间内突破。但令我更感兴趣的则是,这种文字聊天背后,折射出了哪些技术之外的命题?

麻省理工学院社会学教授雪莉·特克尔在《群体性孤独》提出一个很有意思的观点:「声音给人情感,文本给人安全。」而这几年逐步被大众熟知的「图灵测试」,其中一个重要环节设计就是让测试者通过「打印机打印的文本」交流,也就是让测试者用文字对话以发现谁是机器、谁是人。

8cdefc2d56541a45b0f5a82f708d990f.gif

纵然,「图灵测试」强调文字部分原因是因为当时语音技术还没有大的发展,另一方面则展现了图灵对于人在整个测试过程中的情感表达渴望——如特克尔所言的「声音给人情感」——想象一下,如果「图灵测试」是通过声音来测试,那么整个人工智能领域的从业者们都会陷入绝望的境地。

约翰·彼得斯在《交流的无奈》一书里,从社会学的角度系统「批判」了「图灵测试」的局限性:

……图灵的测试还想剔除物体的吸引力和我们对物体的了解……他的雄心是让人的智能的复制品无法区别。然而,不可能复制完全相等的副本的这个道理,同样适用于人。爱欲是一个人体对另一个人体的关系;图灵想剔除的因素正是建立在触摸隐蔽物之上的鉴赏力……

从这个角度出发,以文本(文字)作为交流的媒介,既是一种压制人性也是一种技术妥协。同时也为 Chatbot 的进化指明了方向,比如基于语音,比如基于虚拟现实。

相对于虚拟现实的前瞻性,基于语音的 Chatbot 已经成为主流,无论是亚马逊 Echo 还是 Google Home,其以声音带来的情感交互短时间内赢得市场认可,尤其在 2017 年 CES 上,亚马逊语音交互系统 Alexa 大放异彩,也让我们对于未来更多语音交互产品充满了期待。

当然,就像我在第 49 期会员通讯里所言,语音交互当下最大的问题就是交互命令不统一且过于繁琐,投资人 Ben Evans 也这样写道:

…..does the user know what they can ask? I suspect that the ideal number of functions for a voice UI actually follows a U-shaped curve: one command is great and is ten probably OK, but 50 or 100 is terrible, because you still can’t ask anything but can’t remember what you can ask…..

但毫无疑问,你我都在期待 Chatbot 的未来或升级版,毕竟,你我都需要一个随时可控、没有复杂性的亲密关系