TL;DR.今天的「人工智能商业内参」,我将挑选本周人工智能领域最值得关注的事件并予以深度剖析,包括:
- F8 大会后,人工智能会成为 FB 的救命稻草吗?
- 语音领域再起波澜,Google、亚马逊和阿里巴巴的小算盘;
- 寒武纪的云端机器学习芯片意味着什么?
- 新一季财报后,阿里云营收与市场份额;
本周,Facebook 举行了年度开发者大会(F8),为期两天的会议上,正处在舆论漩涡中心的 FB 继续用「技术会让世界变得更好」的话术向开发者、媒体、华尔街分析师以及国会示好,比如桑德伯格在一个闭门演讲中就这样说道:
……
去年在这里,我说,面对科技行业的挑战,我始终会做一个乐观主义者。现在,我们只能说,科技行业面临了更多的挑战,但我却更加乐观,因为是技术让我们的世界更加安全,更加紧密地连接,是技术让美好的事情发生。正因为技术的存在,我们能够在自然灾害发生的时候,给亲朋好友报上平安,找到彼此,帮助彼此。Facebook 要做的不仅仅是提升社交的体验,更要肩负社会责任。我们承诺,将进我们所能,我从未如此坚定,我知道马克(扎克伯格)也是一样。
不过大会第一天的产品和演讲,并没有令人看到 FB 正在用技术让「世界更加安全」:基于 FB 平台的约会功能聊胜于无;虚拟现实头盔产品 Oculus Go 在 VR 不再流行的背景下也不具备成为大众产品的可能性。
舞台上,Facebook CTO Mike Schroepfer 告诉台下的观众,人工智能将成为保证 Facebook 社区安全运行的重要工具。类似的话,也是扎克伯格上月出席国会听证会时的观点,不过扎克伯格还在上周 FB 财报分析师会议上吐槽当下人工智能的无能:
One of the pieces of criticism we get that I think is fair is we’re much better able to enforce our nudity policies, for example, than we are hate speech,The reason for that is it’s much easier to make an AI system that can detect a nipple than it is to determine what is linguistically hate speech, so this is something I think we will make progress on and we’ll get better at over time. These are not unsolvable problems.
我给这段发言的后半句做了标注,与此同时,Mike Schroepfer 在 F8 大会期间告诉《连线》记者:
If I told you that there was a human reading every single one of your posts before it went up it would change what you would post……
也正是这样的假设,构成了今后 FB 应对舆论质疑的重要观点,这是硅谷对于技术、效率的迷恋,FB 也将自己的未来与人工智能的未来,尤其是自然语言理解的未来捆绑在一起,就像扎克伯格所指,人工智能在图像识别的进步远远超过自然语言理解的发展速度。
会议期间,FB 也展示了自然语言理解上的几个进步,比如该公司的算法可以根据用户发言内容判断用户是否有自残倾向,并发出预警;再比如,今年第一季度,Facebook 的算法自动检测数以十万计涉及到恐怖主义的文字,并自动删除。
然而,摆在 FB 算法面前的,不仅还包括如何检测仇恨言论,还有针对不同语言的理解。根据最新一季的财报,Facebook 月活跃用户已达到 22 亿,如下图所示,但作为主要英语地区的北美用户数量是最少的,特别是亚洲地区,语言更是多种多样,如何理解不同语言就成为一个巨大挑战。
根据联合国针对缅甸国内种族冲突的调查,Facebook 在传播仇恨言论以及虚假新闻中扮演了重要角色,今年 3月,路透社援引联合国独立调查小组主席 Marzuki Darusman 的话:
It has … substantively contributed to the level of acrimony and dissension and conflict, if you will, within the public. Hate speech is certainly of course a part of that. As far as the Myanmar situation is concerned, social media is Facebook, and Facebook is social media……
Facebook 针对多语言理解推出的解决方案是 MUSE,也就是「Multilingual Unsupervised and Supervised Embeddings」,希望利用监督学习和非监督学习的算法,实现不同语言理解中的迁移。换句话说,通过 MUSE,开发者们在面向不同语言环境时,可以直接调用过往在英语环境调试的算法和训练的模型。不过,这个项目到底能有多大的通用价值,到底能让机器在多大程度上适应不同语言,至少在缅甸这件事上,FB 并没有展示出机器学习的能力。
公平地说,今年的 F8 大会并不是像有些媒体所言的「无聊」大会,在减少诸多所谓「黑科技」产品之后,Facebook 展现了在未来愿景里,人工智能尤其是自然语言理解将成为重中之重。如果从纯粹的机器学习角度去看,FB 坐拥 22 亿月活用户、遍布全球各大洲,这可能是机器学习最好的训练场之一,倘若机器能在这个训练过程中攻克假新闻、仇恨言论以及多语言理解的难题,过往 FB 的一切「罪恶」,或许就成了进步的「代价」。
但问题是,这个代价是不是有点太大?
语音领域再起波澜,Google、亚马逊和阿里的小算盘
本周,围绕语音领域有几个大事件。
Google 针对语音领域设置了一项专门投资基金,面向所有早期的语音创业公司或开发者,当然,这些创业公司和开发者必须是 Google Home 智能音箱外部技能的重要贡献者。
第一批 Google 投资的公司里,GoMoment 公司提供面向酒店的语音交互工具,客人可以在客房里,通过智能音箱和酒店前台直接对话;Pulse Labs 则是帮助开发者测试语音服务的产品;BotSociety 则是一个帮助开发者涉及语音界面的工具。
Google 不仅将在资金方面予以投入,还将在技术、工具和人才培养上提供帮助。
这是一项十分类似亚马逊 Alexa 基金的项目,其目的都是通过资金和技术来打造围绕智能音箱或语音助手的外围生态,Alexa 基金目前孵化出 13 家企业,而 Google 此次宣布的几家公司,显示出 Google 在旅游、教育等领域的野心。
当 Google 紧追不舍的时候,亚马逊的 Alexa 又快了一步。本周,亚马逊宣布将向所有开发者们开放技能付费和收款功能,这意味着,Alexa 的开发者们可以将开发的技能直接售卖,并会得到整个收入的 70%。
事实上,上述两个功能早在 2017 年年底就已经开始小范围测试,但此次全面开放意义重大。这意味着,Alexa 平台正在成为类「App Store」的应用商店。如果说 iPhone 的成功得益于 App Store 海量的应用以及良好的生态环境,那么,亚马逊希望自己成为下一个「App Store」。
就目前来看,亚马逊 Alexa 的先发优势明显,根据 Voicebot.ai 的数据,Alexa 上的技能数量已经接近 25000 个:
同时,配备 Alexa 系统的 Echo 系列市场份额占据美国市场的一大半:
这些技能、设备的先发优势,再加上此次的技能付费、收款功能,也进一步完善了 Alexa 的生态体系,所谓的闭环效应已经初步显现出来。
另一个关于语音领域的大事件来自国内。多方的消息源称,阿里巴巴全资收购了北京先声互联科技有限公司,该公司从事语音增强和远场语音交互技术的研发,曾和阿里巴巴、百度、小米进行过合作。
此次收购并没有涉及到具体金额,但正如阿里巴巴的说法,收购主要是针对人才和技术。比如先声互联创始人、中科院声学所前研究员付强博士以及该团队的多位专家,都悉数加入阿里达摩院的机器智能技术实验室,从事语音交互前端技术和方案的研发。
有媒体指出,阿里此次收购也和 4 月份高调进军物联网相关。在物联网长长的产业链条上,阿里巴巴已经拥有云端的强大处理能力和品牌号召力,但在连接、终端交互层面并没有直接的优势,付强也透露了他们接下来的目标:
特别地,针对IoT化的智能家居的需求,我们正在研发基于小阵列语音增强技术的低功耗、低成本、高集成的端云一体语音交互技术和硬件方案。随着阿里在芯片上的战略布局,我们也会在语音专用芯片上有更多进展。
不过值得注意的是,阿里巴巴体系内还有一个针对家庭语音技术的部门,阿里巴巴人工智能实验室。对标 Echo 系列的天猫精灵正是出自这个部门,上月,该部门和戴姆勒、奥迪、沃尔沃三大车企达成合作,未来将把天猫精灵的底层系统 Ali Genie 植入到这些汽车的中控系统中,根据官方的说法:「……来监测汽油量、行驶里程数以及引擎与电池的状态,同时也能从家中透过语音指令控制车门、车窗与车内空调。」
这也让两个语音实验室的未来走向充满看点。同时,鉴于天猫精灵的重要性,阿里巴巴接下来会不会将智能家居的落地与天猫精灵打通等等,这些都会成为左右中国智能音箱以及语音交互市场的重要因素。
其他
本周在人工智能领域,还有众多值得关注的新闻。周三,寒武纪发布了一款面向云端机器学习的芯片,某种意义上也正式向英伟达、英特尔等公司宣战。深科技的记者写道:
本次发布的首款云端AI处理器—“MLU100”——这正是寒武纪科技在2017年底预告的其中一款云端高性能智能处理器,支持服务器端的推理和训练需求,尤其是侧重推理,另有一款MLU200偏重训练。在发布会现场,陈天石称MLU100的功耗仅为是英伟达同类产品的几分之一,将树立新的行业标杆。
加上此前基于终端的神经网络处理器,寒武纪正在打造一个从云到端的机器学习生态体系:
- 云:面向超算领域,为发布会站台的还有浪潮和联想;
- 端:面向手机,比如华为海思麒麟 970 处理器就采用了寒武纪的神经网络处理器;
目前来看,寒武纪在人工智能芯片领域的技术优势和产业生态已经初具规模,也是我最看好的中国人工智能创业公司之一。
周六,阿里巴巴新一季财报公布,其中阿里云的营收再创新高,季度收入达到 43.85 亿人民币,整个 2018 财年(2017 年 4 月至 2018 年 3 月底)营收为 133.9亿元。
现在,阿里巴巴的云服务也成了一个年度百亿收入的业务,但阿里云的收入还是低于 Google,如果放在这个季度对比,阿里云的收入换算成美元大概在 6 亿美元左右,我曾在上周的会员通讯里分析了 Google 云服务结构和收入预测:
Google 的云服务体系,包括云计算平台(也就是 Google Cloud)和 Google 办公套件(G Suite)。按照上一财季 Google CEO 皮查伊的说法,这两块业务已经变成了一个高达每季度 10 亿美元收入的业务。再结合本季财报分析师会议上的说法,Google 云计算的整个营收应该在 10-15 亿美元之间。
另外根据一份来自市场研究公司 synergy research 的数据显示,阿里云的市场份额,依然有不小的增长空间:
不过,这份数据在国内也被解读为阿里云、微软、Google 营收速度远超亚马逊,这当然不能算说谎,不过是呈现真相的一部分罢了。
最后,补充一个小新闻,Twitter 在本周宣布将部分数据平台业务迁移到 Google 云服务上。Twitter CTO 在官方博客里介绍道:
……we are excited to announce that we are working with Google Cloud to move cold data storage and our flexible compute Hadoop clusters to Google Cloud Platform. This will enable us to enhance the experience and productivity of our engineering teams working with our data platform.
此举,既是 Google 云服务获得越来越多青睐的重要证据,也凸显了混合云服务的市场需求,类似的案例,会在 2018 年越来越多。