132:炒作、机会与残酷现实,这是人工智能留给 2017 的所有

人工智能依然是 2017 年科技行业的热词。

上周的钛媒体 T-EDGE 2017 大会上,投资人徐小平表示,「未来五年一定是AI+」,他接着说:「任何一家公司,如果你没有人工智能,如果你没有大数据支撑,你可能会被淘汰。」

一天后,T-EDGE 又用一个整天去讨论围绕人工智能的想象与现实。我在上一期会员计划里也特别分享了 a16z 合伙人 Frank Chen 对当下人工智能发展现状的演讲,长期关注 I/O 会员计划的朋友或许也知道,过去一年我分享了诸多关于人工智能技术发展、商业模式以及社会伦理的思考和发现。

岁末年初,我还想继续谈点什么,去总结 2017 年被炒作的热词:人工智能。

五个基本认知

自 I/O 会员通讯启动以来,围绕人工智能相关概念的普及工作一直没有停止,比如我曾在去年 11 月份的一篇文章里介绍所谓人工智能(AI)、机器学习(ML)与深度学习(DL)的区别,同时我也花了很大功夫去解读霍金、马斯克所言的「人工智能」与硅谷公司所努力的「人工智能」之间的区别,我在这篇批判霍金的文章里写道:

最近几年热炒的人工智能,只是基于深度神经网络在某几个领域突破后的体现,比如语音识别、图像识别以及自然语言处理,除此之外,再无令人眼前一亮的表现。而不管是语音也好,图像也罢,都是互联网巨头们,如 Google 、百度、微软、苹果等大张旗鼓才加速的落地产品,从这个层面上看,倘若没有包括 Google 语音搜索、Siri 在内的语音搜索,语音识别技术到底能引发多大浪潮呢?或者换一个角度去思考,拥有巨大媒体影响力的硅谷公司们,在推动所谓人工智能成为热词的运动中可谓功不可没。

《经济学人》的一张图表也说明了诸多问题,下图里,右侧是公司财报会议上对于人工智能的关注程度,从 2014 年开始就是极度陡峭的增长线,而与之对应的左图里,咨询公司 IDC 制造的「digital universe」指代的是每年数据生产和复制的数量,其增速也是指数级的,这说明了两个方面问题:其一,人工智能的确是当下最热的命题之一;其二,人工智能的再次回归,是海量数据带来的最直接反应。

img

而在上半年最为热议的 AlphaGo 大战柯洁的新闻炒作里,我的观点非常明确

如果说去年 AlphaGo 打败人类棋手让人工智能攻克围棋这件事情从实验室走向了大众媒体,那么今年的这次所谓的人机大战,完全是一次毫无意义的营销。

当然,棋盘类游戏与人工智能之间的关系非常复杂,我在「人机大战」期间的对此作出了一些解释。更进一步,站在 2017 年末这个时间点,撇开一切炒作、想象的成分,以一种最理性的眼光为当下的人工智能定性定量,包括以下五个方面:

  1. 过度依赖数据,目前所有宣称的技术突破都是海量数据所驱动的;
  2. 都是「狭窄」智能,这意味着所谓智能,仅仅是围绕某个领域做文章;
  3. 对于结果的不可知,所谓深度学习的「黑盒子效应」,如果算法上没有突破,这个现象是无解的;
  4. 人工智能的能力来自学习,而非编程,这是区分人工智能应用与过往应用的最主要区别,但也会被有些公司滥用,最近国内不少从事自动化的公司摇身一变,成为「人工智能公司」;
  5. 人工智能不是一个定式,而是进化的概念,某种意义上说,我们现在所谈的人工智能,都是在技术不断发展过程的一种称谓,而非已确定的概念;

上述五点可以概括当下人工智能行业的全貌,看起来既单调又失望,而如果将镜头拉近整个行业,你所看到的则是另一番景象。

被「祸害」还是被「资助」的基础研究

一年一度的 NIPS(Neural Information Processing Systems)是深度学习最重要的行业学术会议,也是近距离观察人工智能发展状况的入口之一。在今年的会议上,一位名叫 Ben Recht 的加州大学伯克利分校的教授坦言:这再也不是一个学术会议了。

创立于 1987 年的 NIPS,在一个相当长的时间内都仅仅是学术界小圈子的事情。但事情在 2012年发生了变化,随着 Geoffrey Hinton 团队通过深度学习算法,在图像识别领域取得巨大突破,引发了包括 Google、FB 在内的互联网巨头的关注,NIPS 也成为各巨头关注的重要会议。

《经济学人》报道了 2017 年 NIPS 的盛况:

For the 7,850 attendees, the big draw is the algorithms presented in halls heaving with mostly male bodies (90% of the authors of NIPS papers were male this year, a gender imbalance widely found in science – see article). They hang on every word of AI wisdom imparted by luminaries from Google and Microsoft; pore over a dizzying number of advances (laid out in more than 670 published papers) from the likes of Facebook, DeepMind (a unit of Google) and Tencent; and devour stories of novel ways to train machines to perform useful tasks.

互联网公司之外,还有汽车公司,比如奔驰:

Many firms were also putting on a show as part of the battle for AI talent. They included Mercedes-Benz, a first-time sponsor, which is trying to recruit data scientists to work on its autonomous cars. The German producer is already some way down the road, with Rigel Smiroldo, the firm’s machine-learning boss in North America, happy to recite how the E-class Mercedes he drove to NIPS handled 250 miles of highway driving without him needing to intervene.

被工业界认可学术成果当然是一件好事,随之而来的,则是互联网巨头对于学术人才的抢夺,从业者的工资也是水涨船高,过往默默无闻的教授、博士生导师如今成为各大公司的香饽饽甚至网红,但这种认可的代价则是,越来越多的论文、研究都被公司产品/战略所驱动,比如今年 NIPS 的的热点包括深度学习与贝叶斯概率的结合,这是包括奔驰在内的自动驾驶产品所需要改进的算法。

纵观人工智能的发展历史,这几乎也是每一次复兴所能看到的盛况,商业公司出于利益考虑与学术界「拥抱」在一起,不过,一旦学术界的成果无法真正带来商业模式创新,也会毫不犹豫地将其抛弃,形成一次次的「人工智能寒冬」,这一次是否会重复「昨天的故事」还尚不可知,可以确定的一点则是:这次人工智能所引发的变革,才刚刚开始。

商业化的探索刚刚开始

上周,专注欧洲人工智能领域投资的 MMC 发布一份关于 2017 年人工智能行业的研究报告,这份报告总体上回答了两个问题:

  1. 企业人工智能进展如何?报告称,企业对于人工智能的接受和适应程度正在变得越来越乐观,但依然处在非常初级的阶段;
  2. 人工智能的影响到底哪些方面?报告认为,在创新、效率以及规模上将对企业生产、经营以及企业责任产生深远影响;

这份报告还介绍了英国人工智能发展的概况,有个数据很惊人,英国人工智能创业公司数量已经接近欧洲全部公司数量,如下图所示。

img

另外,这些公司里,三分之二的公司还处在创业的早期,超过四成的创业公司还没有盈利,不过,即便从全球范围来看,资本依然看好人工智能公司,下图可以看出,相比于传统软件公司,人工智能创业公司在早期的融资更有优势。

img

同样是在上周,美国数据分析机构 CBinsights 发布了一份「The AI 100 」榜单,列举了当下最值得关注的 100 家人工智能创业公司。国内媒体对这个榜单的解读过多停留在到底有多少家中国公司上榜,但在我看来,这个榜单传递出的信息更多。

首先,上榜的 100 家创业公司涉及诸多领域,所谓「AI+X」是一个可以任意组合的概念,但有三个领域最为集中

  • 健康;
  • 网络安全;
  • 企业级市场;

这三个领域都有几个共同点,比如数据集中,刚好也是当下人工智能最有可能解决的领域,再比如都已经超过了概念炒作阶段,多数公司也进入到 B 轮甚至 C 轮融资阶段。以健康领域的 Flatiron 为例,该公司的主要业务是利用机器学习辅助人类医生分析医疗数据,在完成 C 轮 1.75 亿美元融资之后,估值达到 12 亿美元。

其次,全球范围内的人工智能创业热潮区域的格局,目前包括法国、以色列、加拿大、台湾、日本、英国、美国和中国,其中美国依然是创业的大本营,但多数都处在早期投资阶段,而中国市场此次出现的 8 家公司里,有 5 家的估值超过 10 亿美元,其中今日头条的融资总额最多。

创业公司的人工智能探险处在早期,而巨头们的转型,也才刚刚开始。

巨头博弈的三个层面

当百度喊出「ALL in AI」不久,腾讯也开始宣传「AI in All」,承担阿里巴巴技术输出的阿里云,也一直以飞天智能(Aspara Intelligence)里的「AI」为口号。

大洋彼岸,Google、微软、亚马逊甚至包括苹果,也无一例外地作出了人工智能转型战略。

究其原因,如果参照前文提到的人工智能现状的基本认知,其中「数据依赖」就是一个非常大的驱动力,上述这些互联网巨头(苹果除外),在各自的产品中积累了海量数据,利用海量数据和算法,巨头们优先考虑的是改善自己现有产品体验,以 Google 为例,作为一家服务/产品的公司,Google 内部的深度学习改造计划由来已久,比如 Google Photo 和 Google Lens,就是利用深度学习提升了相册、相机的体验。

其次,互联网巨头们,除百度、苹果外,更热衷将人工智能与云计算结合在一起。作为云计算后起之秀的 Google Cloud 和阿里云,都选择了利用机器学习平台形成独特竞争力,从而获取一定的市场份额。

第三,互联网公司在平台之外还在通过新一代终端获得用户(数据)。语音交互几乎是中美两国同时兴起的产品类型,被誉为下一代交互模式的语音,得力于深度学习等算法带来的语音技术提升,更来自于各大巨头们对于音频内容/服务的整合,以中国为例,BAT 各自在生活服务、音频内容(音乐)、购物领域有不同布局,这些内容/服务资源都会体现在各家语音交互设备里,所谓的「百箱大战」,也才刚刚开始。

几个不靠谱的预测

一年多之前,我曾在一期会员通讯里对于芯片行业做出两个预测:其一,转向深度学习;其二,可扩展到智能手机的新一代芯片会出现。

如今回头去看,这两个预测早已成真,过去的 2017 年,基于神经网络的深度学习,改变了从服务器到智能手机的芯片变革,本月初高通宣布的下一代骁龙处理器也将更多具备神经网络处理能力,接下来的一个可预见的时间表里,我还可以大胆地提出几个不靠谱的预测:

  • 人工智能的热潮会在 2018 年逐步降温,2018 年的 Gartner 技术炒作曲线中,机器学习/深度学习将不再是最热的技术;
  • 人工智能的各个单项技术会更多与云计算、物联网结合在一起为不同行业赋能,从中国来看,教育、安防、健康领域的创业空间最大,制造领域的竞争会成为阿里、华为等巨头的博弈;
  • 面向 C 端的人工智能应用创业热潮会兴起,这是由于智能手机的硬件里加入更多神经网络处理能力,从而具备了更多可扩展的可能性;
  • 「AI+」会成为资本市场的热词,但本质上依然是一种技术创新推动商业模式变革的尝试,也是过去几年一直都在发生的事情;

如果说上述几个预测还不靠谱的话,新一年里我还有两个更不靠谱的预感,第一,量子计算机的发展速度如何,会对人工智能产生巨大影响;第二,则是中国政府的政策推力,到底会制造出人工智能巨无霸还是巨大的泡沫