【开放文章】490 亿美元的市场诱惑,科技巨头如何押注语音领域(美国篇)?

如果以 2014 年 11 月亚马逊发布第一款 Echo 算起,以语音为主要甚至唯一交互入口的「新物种」已经有了四年多的历史。

四年时间成就了亚马逊无处不在的 Alexa,推动了 Google、微软在语音、 NLP 技术领域的研发突破,也让苹果体会到了「(语音)起了大早赶了晚集」的滋味。

根据此前的 CBinsights 的统计,全球语音领域的市场规模高达 490 亿美元。

下文将以美国四大巨头公司为例,详细介绍其产品布局以及技术研发特点。

Google

Google 正致力于提高搜索和人工智能对话的准确性,其中一个方面是人工智能的语言能力。截止 2018 年末,亚马逊的 Alexa 和 Google Assistant 支持的语言种类都不及苹果 Home Pod。

2019 年,Google 将赋予其语音助理 30 种语言能力,包括同时理解两种以上语言。

Google (包括苹果)有大量的智能手机用户群体,这一优势使其很好地掌握用户使用习惯,更容易完成产品整合,实现家庭、办公室和汽车等场景的无缝衔接。

通过对于大量用户数据的分析,Google 已经意识到用户使用智能语音不仅是完成打电话、导航等简单的任务,需求正在不断扩大。Google 运用人工智能理解用户使用文字搜索到语音搜索的转变,尝试准确判断意图。

Google的竞争力主要在搜索和任务要求的准确性方面(尤其与亚马逊相比)。

source:KPCB
source:KPCB

Google 准备用 Duplex 技术获得更多市场。

此项技术已被用于 Google Assistant,可以让人工智能代表用户打电话完成预订和邀约的任务。

Duplex 跟人的声音极为相似,甚至包括「恩……啊……」之类的语气词。这的确标志着语音智能助理在权限和准确性方面的突破,但也带来了一些伦理问题。

比如欺骗,当人类在跟各方面听起来酷似人的机器人说话时,人类应不应该知道真相呢?

初始版本中,机器人没有加入任何区分。但在收到一些负面反馈后,Google 发布了以下申明

我们在公开透明的情况下设计了这项技术,也将确保它被合理的认知和识别。我们在 I/O 大会上展示的只是技术样品,我们将会听取更多反馈以完成产品开发。

Google 正通过实现更自然和零错误的智能语音工具和搜索来获得优势。Google 收购 api.ai 就是一个很好的例子,以此将自然语言处理应用到真实世界的智能语音对话,并扩展到搜索功能。

Google 创立语音助理投资基金

最近 Google 创立了一个用于智能语音项目投资的风险基金。Google Assistant 基金目前投资了大约 10个项目,已经与酒店和医疗领域建立了合作。

从这些项目可以很直观地看出 Google 把重心放在了自然语言处理上,以下两项投资尤为明显。

医疗行业下一个前沿技术——患者语音助理

Google Assistant 基金和亚马逊 Alexa 基金共同投资了 Aiva Health 项目,这是一个应用在医院和疗养院的患者语音操作系统,患者用语音完成操作和任务,医生可通过手机 app 与患者沟通和跟进。

Google Assistant 还接入了 Novant 医疗系统,患者可通过语音获得诊室排队信息、预约安排和指导等,相关信息都会发送到用户的手机上。

Google 通过这些投资进入医疗领域,在 Google Home 和 Google Assistant 上为患者开启一条通道。

进入酒店的新方式

酒店行业是另一个 Google 语音关注的领域。 Google 投资的 GoMoment,是一个人工智能语音机器人,可以帮助酒店迎接客人、回答问题;还能评估用户的满意度,减少酒店服务的通话时间。

source: Google

Google 还在语音助手中加入了「翻译模式」,已经在几家连锁酒店试点,能实现对话的实时翻译。对话可以通过 Google Home 语音输入或者 Google Assistant app 完成翻译,也可显示在界面上。 

这是 Google 占领酒店行业市场份额的另一种方式。每个房间里都有一个接入酒店集团系统的 Google Home,客人可以通过语音轻松完成活动门票预订、客房服务预约、获取天气信息、查看行程信息等操作。

Amazon

虽然 Google 一直在发力,但亚马逊的 Alexa 仍然毫无争议地占据着智能语音市场的主导地位。 

显然亚马逊一直在通过电商渠道改善语音服务,这也是其在美国科技五巨头(FAMGA: Facebook, Amazon, Microsoft, Google, Apple)中最突出的优势:每个 Alexa 都能连接到世界最大的网上商城。

Source: Forbes

亚马逊通过「亚马逊精选( Amazon Choice)」连接语音与电商平台,选出了一些「排名较高、价格更优、立即配送」的产品加上此标签。 

根据 OC&C 战略咨询的调查,亚马逊精选和语音搜索结合的模式中有两个非常有趣的数据:亚马逊精选的产品往往比其他产品的销量高出 3 倍;更重要的是,85% 的消费者最终选择购买亚马逊推荐的产品。

亚马逊精选所带来的潜在商机代表了电商平台发展的新转折点。

但研究表明,目前只有30%的用户使用智能语音进行购物。

source:recode
source:recode

2018年只有2%的 Echo 用户尝试通过 Alexa 购物,这对于亚马逊来说,远没有达到原本的预期。

然而,这并不代表没有潜力。

亚马逊尝试通过内置零售、电商渠道占领语音购买市场,想把更多内置 Alexa 的智能产品放进用户家里;同时联合微软,借助其可以匹敌苹果和 Google 的操作系统。此外,亚马逊跟快销品公司合作推广 Alexa。

此后,亚马逊又开始向新的领域扩张。在家庭以外的场景,跟 Google 和苹果相比,亚马逊一直处于弱势。它目前正在计划新的语音设备,更好地完成数据收集,以扭转劣势。

Alexa,我们一起出发吧

Voicebot.ai

亚马逊并不想把 Alexa 局限在家中,但是在户外环境,Alexa 一直处于弱势。Google 和苹果都在手机中内置了智能语音,走到哪都能用,而 Alexa 一直是个家庭产品。 但是,这一情形将被打破。 最近亚马逊发布了 Echo Auto,并称预售已超过100万台,这个公司正在给消费者提供更多使用语音助手的方式。 

在 Echo Auto 中,用户可以使用 Alexa 的所有功能,不用任何手部操作就可以轻松打电话、导航、听播客、播放音乐和控制智能家居设备。

研究数据显示,在车里使用语音助手已经非常普遍,所以 Echo Auto 符合人们的需求。

目前亚马逊正在与各大汽车制造商接洽,包括宝马、丰田、福特等,有望将 Alexa 整合到他们的智能车载系统中。而英菲尼迪、捷豹、梅赛德斯奔驰等厂商也计划在新推出的车型中加入 Alexa。

智能家电来了

消费者想跟他们的家用电器说话吗?亚马逊认为是这样的。

亚马逊开发了 Amazon Connect Kit(ACK),让其他开发者可以将 Alexa 接入新的家用设备和电器。

在语音助手爆发的 2018 年,Alexa 已成为亚马逊的核心增长点,根据其智能家电的装载量可以看出 Alexa 巨大的增长潜力。

在 2018 年第二季度的收益报告中,贝佐斯强调了智能语音对亚马逊未来发展的重要性:

全球有超过150个国家的数以万计的开发者在他们的产品中加入了 Alexa 智能语音助手,去年 Alexa 的装载量翻了3倍,我们的合作伙伴正在不断扩大和增强 Alexa 的使用体验。

亚马逊称,目前已有 4500 个独立品牌的 28000 种智能家庭设备使用了 Alexa。

US smart appliances market revenue
US smart appliances market revenue

小家电的营收通常在市场份额扩大的情况下才会增加。LG、三星、惠而浦、肯摩尔、博世、通用等智能家电为 Alexa 和 Google Home 提供了巨大的市场占比。

一款智能微波炉目前已经在 AmazonBasics 上架,与摩恩和 iRobot 的合作也让用户可用语音打开淋浴和激活扫地机器人。

亚马逊正用 ACK 全面打造 Alexa 控制的智能家居系统。

苹果

2011年,苹果发布 Siri,打开了智能语音助手的新世界;但直到发布智能音箱 HomePod,苹果才算进入到智能音箱阵营。在与早已占有一席之地的 Google 和亚马逊竞争时,略显艰难。

行业分析师明确指出了 Homepod 的缺陷:不像 Alexa 那样「多才多艺」,又不及 Google 的语音助手智能。

source: Statisa
source: Statisa

对于苹果的死忠粉来说,这些都不是问题。但如果你没有苹果「全家桶」,也许会觉得 HomePod 没有那么好用。

HomePod 最大的优点也许是安全性和私密性。苹果在2018年收购了 Silk Labs,这家公司开发了无需接入云处理的人工智能操作系统。

无需接入线上的语音助手

安全性和私密性对于语音助手来说越来越重要了。苹果最近申请了两项专利,都是针对语音安全性。

第一项是「线下个人助手」,不接入网络时也可以唤醒 Siri。使用 HomePod 时,语音对话不会被记录,因为大多数指令都不用连接云端。

这与 Google 和亚马逊的做法很不同,用户不用再担心数据安全的问题,但也很想知道数据储存到了哪里。

苹果尝试在设备内部完成语音指令激活。

苹果的此项专利是语音能在设备内部转化为文字指令,不用通过苹果服务器。设备的系统中预先存储了大量的指令,使其听到语音就能马上执行,用户在联网或离线时都能使用。

Source: USPTO
Source: USPTO

另一项跟语音安全相关的专利是「声纹识别」,使 Siri 能够识别多个用户的声音,实现一个设备多人操作。

与 Salesforce 合作

苹果不止希望用户在家里使用语音助手,它正与 Salesforce 合作将语音技术放进各个应用,这样用户只需让 Siri 完成更新和操作,不用在各个系统之间切换。

Salesforce 是目前最有名的企业级销售和市场工具之一,还拥有海量的第三方软件开发者,他们可以进入后端,找到更好的与 iPhone 和 iPad 结合的方式。

苹果 CEO 蒂姆·库克在接受路透社采访时谈到,「企业级语音的使用规模还远不及消费级,我们正在改变人们工作的方式,这与苹果『将事物变得更好』的核心理念一致。」

微软

虽然微软很早就发布了 Cortana 进入智能语音市场,但很难与 Google 和亚马逊竞争。

比起正面较量,微软更倾向于寻求合作。现在,Win10 和 Alexa 用户可以共享一些功能,Cortana 可以在 Win10 里与 Alexa 对话,Alexa 用户可以通过 Cortana 读取 Outlook 的邮件。

两大科技巨头的战略合作,使他们在原本难以进入的领域有了立足之地。微软赢得了看好 Cortana 和 Alexa 结合的用户,而在企业层面,Alexa 可以用于简单的任务操作。

Source: Voicebot.ai

今后几年,Cortana 有望将智能语音带进企业办公。 

微软最近收购了对话式人工智能的开发团队 Semantic Machines,看来与Alexa 的合作对微软来说尤为重要,有望推出智能语音驱动的办公套组。

低声语音专利

最近,微软申请了一项「低声语音输入」的专利,让用户可以低声激活语音助手,方便在公共场合使用。 

目前,人们只习惯在家中或者车里使用语音助手,尽量避免在公共场合使用。该项技术将在一些手机、智能手表和远程控制设备使用。对着智能手表小声说话,会不会让人有「007」的即视感呢?

微软显然对语音生物识别技术方面的尝试很感兴趣,最近更是将一家名为 ID R&D 的语音生物识别公司纳入其「物联网-人工智能内部实验室」项目。

结语

经过四年多的发展,美国的语音市场竞争已经进入到一个新的阶段。一方面,消费领域的竞争已经成为亚马逊、Google 和苹果的「三国演义」;另一方面,在企业领域,语音交互所带来的价值正在显现,这也是微软、Google 所看重的领域。

语音技术的发展、大量场景化的应用,正在催生一场全新的人机交互革命,这或许才是当下最重要的技术变革领域。(完)

Zhao Saipo

View posts by Zhao Saipo
赵赛坡,科技博客作者、资深科技观察家、付费科技评论 Dailyio 创始人、出品人,覆盖 3000+ 付费用户。 曾担任 TechTarget 中国区记者、频道主编、AI 自媒体「机器之心」前联合创始人。