057:手机语音助手已死

当苹果在 2010 年收购 Siri 后,外界对于苹果是否会进军搜索市场,进而与 Google 正面对抗感到好奇,当时乔布斯给出的答案是:Siri 不是搜索产品,而是人工智能。

这是一个颇具前瞻性的答案,尽管「人工智能」这个词早已半个世纪,但在 2010 年的时候,将语音作为人工智能在智能手机上新的突破口,乔布斯的眼光非常独到,他看到了当时人机交互背后的那套违背人性的逻辑——尽管 iPhone 早已脱离了键盘,但手指触摸与声音说话之间的差别依然是做有一个设备是否具有人性化的重要分割线。

Siri 的确引发了全球性的狂欢。2011 年最后几个月里,人们迫不及待地想知道这个被乔布斯「钦定」的应用到底有多大威力,「调戏 Siri」一度成为全球性的话题:

但很快,Siri 就被「玩坏」了,越来越多的用户发现,Siri 实在是太「傻」了,不仅功能单一,而且还无法真正理解人类复杂的语言体系,更重要的是,其几乎只局限在设备层面或者准确地说是围绕 iOS 内部应用的做法令用户非常不爽,这也意味着你每次「Hi、Siri」之后只能调取 iOS 的应用或功能[1]

2012 年 6 月,Google Now 正式亮相在 Google I/O 大会,作为当时那款 Android 4.1 里最重要特性,Google Now 寄托着 Google 对抗 iOS Siri 的重要功能。

事实上,对于包括 Larry Page 在内的 Google 高层来说,他们当然清楚一年前苹果发布 Siri 带来的震撼,尽管乔布斯曾表示 Siri 不是像 Google 那样搜索产品,但潜台词或许是,Siri 是下一代的搜索产品。且不说其产品是否完善,但至少在设计层面,Siri 就开始鼓励用户用语音搜索本地服务,如地图、餐厅等等,这是 Google 所不能容忍的,这也是 Google Now 的诞生背景。

相较于苹果,Google 毕竟是一家互联网公司,而且基于 Google 杀手级产品如 Gmail、Google 地图和 Google 搜索数据的整合,的确在当时给人一种耳目一新的感觉——它看起来就像一个更懂你的助手,正如这个助手的这个「Now」所言,Google 希望你每次打开它的时候,都看到当下的事务:你的邮件、天气、日历以及感兴趣的新闻,这样主动的展示与 Siri 傻傻地等待唤醒的设定形成鲜明的对比:

而且,与 Siri 只支持语音交互相比, Google Now 提供了更多的交互方式,你可以语音,也可以文字输入,比如输入「天气」,就能出现你所在地的天气状况。

但 Google Now 的局限性也不小,首先,缺乏系统层面的整合,Google Now 更多的基于用户的 Google 账号活动情况,反而没有太多关注用户在 Android 手机上的操作习惯,甚至一度也无法检索你在 Android 上安装的应用;其次,缺乏 Google 业务层面的整合,即便是以用户的 Google 账号为基准,但也局限在几个特定领域,如上文所言的 Gmail、地图等,而像 Youtube、Google Drive 等应用则被隔离出来,所以在一阵新鲜感之后,用户体验也开始下降。

时间到了 2016 年,苹果在 iOS 10 里开发了更多 Siri 的接口,让开发者可以方便地将。Siri 集成到第三方应用里。而 Google 则进一步升级了 Google Now,并以 Google Assitant 的名字全新亮相,这两大手机系统的产品继续横行天下,但世界在过去几年已经完全变了。

其一,语音交互迎来大爆发。这当然包括技术层面,如深度学习给语音识别带来的超高精准度以及自然语言交互对于语音交互的巨大推动作用,另一方面则是智能手机上多个巨头应用,如国内的微信、百度搜索等对用户的普及教育,使得整个智能手机行业走向了「无语音不手机」的新常态,此时,无论是苹果的 Siri 还是 Google 的 Assitant,都日益沦为同质化的产品。

其二,随着 Echo 的火热,智能手机的语音助手面临失业风险。严格意义上说,亚马逊 Echo 上的 Alexa 并没有比 Siri 智能太多,但颇具戏剧性的一幕则是:用户对于 Echo 「弱智」的容忍度要远远超过 Siri 或 Google Assitant。

这是一个很有意思的现象。从产品形态上说,Echo 所扮演的,不过是将手机上的麦克风取下来放在一个固定的音响上,但用户的体验却有了完全不同的感受,其背后深刻反映了智能手机在语音交互领域几乎完败的大趋势,这个趋势还随着 2017 年 Echo 持续大卖与 Alexa 成为众多智能硬件交互入口的大背景下展露无遗。

其三,则是苹果与 Google 的救赎行动已经开始。2016 年,苹果发布的 AirPods 和Google 的 Google Home 颇具意义。对用户来说,AirPods 是一款无线蓝牙耳机、是一个外观很酷的可穿戴产品——它可以听歌,也可以接打电话,但更重要的一个功能则是唤醒 Siri。此时的 Siri,已经不仅局限在 iPhone 上,而是遍布苹果几乎所有的产品里,iPad、Apple Watch、Apple TV、MacBook 以及苹果的物联网解决方案 Homekit 里,换句话说,苹果用 AirPods 试图让 Siri 摆脱所谓手机助手的定义,从而成长为物联网层面的语音助理。

Google 也有这样的野心,Google Home 作为一款针对亚马逊 Echo 的竞品,你似乎看不出其有多大差别,但 Google Assitant 正在通过这样的方式迅速成为 Google 多个家用互联网产品的入口。

类似的状况也出现最新发布的三星 S8 手机上,虽然其鼓吹的人工智能助手 Bixby 背后有豪华产品团队[2],但就其演示的基本功能来说,并没有太多超越 6 年前 Siri 问世时的模样,依然是基于自身系统应用的简单调取和呈现,即便三星未来可以争取到更多的第三方应用,但呈现出的效果又能比 Google Assitant 好多少呢?相对而言,我更看重 Bixby 在三星家用电器里的应用,或许会成为新的杀手级产品。

这看起来是一件令人十分沮丧的事情,却又十分贴切地表达所谓手机语音助手尴尬的现实,它在手机上「出生」,却无法真正长大,过去几年,智能手机的变革依然围绕硬件参数与用户初级体验的平衡,之所以说是用户初级体验,其原因就在于包括声音、图像等交互模式的并未真正触及到用户体验,反而催生了Echo、Snapchat(也包括Spectacles,Snap 公司的智能眼镜)以及 GoPro 的流行。

在 2017 年这个智能手机历史颇具意义的年份,手机语音助手已死的事实并没有惊醒太多人,从三星 S8 主打语音功能到去年一众国产手机拥抱科大讯飞语音助手以及华为秘密研发语音助手产品的状况来看,新一波的智能手机交互革命还是要看苹果,还记得苹果低调发布的 Clips 么?


  1. Siri 的开放一直非常慢,直到 2016 WWDC 才真正意义上对第三方开发者开放。  ↩
  2. 2016 年三星收购一家名叫 ViV 的创业公司,该公司的核心团队曾一手创造了 Siri  ↩