智能音箱的「智商」

智能音箱的「智商」|Dailyio Issue#226

圣诞节前,美国 VC Loup Ventures 发布了一份年度智能音箱 IQ 测试报告。测试中,Loup Ventures 选取了美国四个主流智能音箱,包括 Google Home、苹果 HomePod、亚马逊 Echo 以及搭载微软 Cortana 的的音箱 Invoke。

Loup Ventures 设计了 800 个测试问题,主要分为以下五个方面:

  • 本地服务:比如「最近的咖啡馆在哪里?」
  • 购物:比如「订购一包纸巾」
  • 导航:比如「如何坐地铁去 XX 大楼」
  • 资讯:比如「这周有哪些英超比赛?」
  • 语音命令:比如「提醒我下午 4 点打电话给XX」

Loup Venture 利用两个维度来测量这些音箱回答质量:其一,是否真正理解了问题;其二,是否做出了精准的回答。

由此得到了下图的测试结果,在「理解问题」的测量里,四个产品并没有特别大的差距,真正的差距出现在回答精准度上。最终,Google Home 无论是回答准确率还是理解问题上都领先其他几个产品,也成为「智商」最高的智能音箱。

img

这个测试以一种客观数据的形态展现了目前各家巨头智能音箱的实力,但过于客观的数据却显得太冰冷,如果仅仅将智能音箱理解、回答问题作为衡量智能音箱的标准,尤其是,强调所谓智能音箱的「智商」,更是充满了数字(数据)至上的偏见。

首先,从计算设备形态上看,智能音箱都是一个典型的家庭设备,这也意味着它和作为个人计算设备的智能手机有着明显的不同。比如相比于智能手机,智能音箱几乎是不可移动的,它常年位于家庭中某一个固定的地方;再比如,智能音箱允许家庭里的所有人来唤醒它、使用它,这也让智能音箱成为电视之后又一个更具「客厅意义」的计算设备。

其次,智能音箱的交互远不是语音交互这么简单。2017 年,亚马逊发布了带屏幕的 Echo Show,不仅增加了屏幕的交互方式,还进一步强化了智能音箱作为家庭计算设备的属性。我曾在当时的会员通讯里写道:

为此,Echo Show 还提供了一个名叫「Drop in」的功能……你可以将其理解为一个类似对讲机的功能,再开启该功能后,你可以随时查看其他家庭成员家里或房间里 Echo Show 相机拍摄的画面,比如广告里年轻夫妻要查看婴儿房里两个啼哭孩子的时候,就使用了这个功能。

这是一个颇具野心也很具「侵略性」的功能,它大大强化了 Echo Show 的家庭定位,你不大可能将「Drop in」用在普通朋友之间甚至情侣之间,但在家庭成员之间,这个功能却大有用途。广告里至少有两个「Drop in」功能的演示,其场景设计都是围绕家庭成员内部的沟通。

去年 3 月,阿里巴巴和百度相继在国内发布了带有屏幕的智能音箱。彼时,中国智能音箱市场刚刚由阿里巴巴天猫精灵带动起来,而两家公司也在 3 月下旬带来了两个「屏幕音箱」,不过阿里巴巴的解决方案略显简陋n 基于 AliGinie 2.0 的精灵火眼功能,该功能内置在天猫精灵的手机 App 中,用户只需要同时购买一个类似手机支架的 Xholder,就能让 2017 年发布的天猫精灵 X1 变身为「视频音箱」。

img

四天后,百度在其总部召开一场硬件发布会,李彦宏亲自上阵,发布了传闻已久的百度智能视频音箱「小度在家」。

img

「小度在家」的宣传片里,忙碌的年轻人无法和父母团聚、焦虑的职场的妈妈想时刻和孩子通话等等场景反复出现。这年 Echo Show 发布时的广告几乎一模一样,尤其是家庭通讯功能:

其中,“一呼即通”功能最适合有老人和孩子的家庭。通过简单的权限设置,当你向家里的小度在家拨出电话时,不需要家人操作接听,小度在家就能帮你直接联通。

综上来看,智能音箱的设备形态、更丰富的交互方式,使得智能音箱的定位越发清晰化,它一个全新的家庭设备。另一方面,纵观国内外,不同公司对于自身智能音箱的功能也有不同的侧重,比如 HomePod 更强调其在整个苹果生态里的左右,而 Google Home 则是 Google 搜索的延伸,至于亚马逊 Echo,则藏着亚马逊电商扩张的野心。

在国内,百度虽然发布了多款智能音箱,但其用意是推动 DuerOS 的市场份额,而小米的智能音箱卖点,是其智能手机以及物联网的广泛布局。

因此,仅仅依靠语音识别和反馈,并不足以反映智能音箱的实力,更无法体现所谓的「智商」,它只是提供了一个简要的测试维度,不具备任何行业示范意义。