上周,AI Index 2018 年度报告正式发布,我在上周的「Weekly Spot」里提到了里面的几个关键要点,但这份报告还有诸多值得关注的内容。
通过梳理和回顾 2018 年 AI 领域的发展,我也想对 2019 年的人工智能做一些预测和展望。
一
先从权威性的角度去看,参与该报告的人包括斯坦福大学的 Yoav Shoham、MIT 的 Erik Brynijolfsson、OpenAI 的 Jack Clark 等人。其中,Yoav Shoham 是斯坦福的计算机科学荣誉退休教授,而 Erik Brynijolfsson 则是 MIT 斯隆管理学院教授,长期关注数字化发展对于社会、企业以及个人的影响,至于 Jack Clark,他是前 Bloomberg 的神经网络领域资深记者,如今担任 Elon Musk 的非盈利组织 OpenAI 的战略总监,同时他也在运营一份 Newsletter「Import AI」。
正是这样的人员组成,也让这份报告不仅局限在 AI 技术领域,更具备了经济层面和道德层面的思考。
AI Index 2018 报告试图通过多个指标来衡量 AI 的发展总体状况。这些指标包括三大部分:
- 数据
- 政策
- 暂时无法衡量的领域;
我们一个个来展开。先来看「数据」。这里的「数据」包括了两个维度的数据:
- 全社会对 AI 的关注度数据;
- AI 各技术的突破数据;
这两组数据相互独立又相互关联,共同构成了观察 2018 AI 发展的重要视角。其中,全社会对于 AI 的关注点又体现在学术论文、AI 课程/培训、大型会议参与度、创业公司融资、大公司 AI 适应度、专利、人才需求、媒体关注等等。
来看几个有趣的数字,下面两幅图里,科技行业公司与其他行业公司在财报会议上提及的技术名词有着明显的时间差。再比如,为何其他行业一直都在关注 AI 和 ML,而科技行业会在 2015 年集体爆发?


再比如,下图是媒体文章里关于 AI 的情绪,2016 年 1 月是个重要的时间拐点,这个时间点恰恰是 DeepMind 首次披露 AlphaGo 可以战胜人类棋手的时刻。

二
与 AI 参与度并行发展的,则是 AI 各技术的发展数据,这份报告列举了图像识别、自然语言处理、机器人问答的发展状况,基本可以总结为一句话:机器识别率持续上升、训练时间持续下降。
以 ImageNet 的训练时间为例,仅仅用了一年半的时间,利用 ImageNet 训练神经网络的时间从将近一个小时下降到 4 分钟,这是一个巨大的提速

报告指出,这个数据至少有两大意义:其一,由于图像识别是典型的监督学习,这个领域的突破可以适用在多个监督学习领域;其二,这也充分体现了过去一年半,围绕 AI 的软硬件的进步。
在政策层面,该报告对比了美国、欧洲与中国近四年的重要 AI 政策,感兴趣的读者朋友可以直接去浏览,这个部分就不再赘述。
接下来,谈谈几个暂时还无法衡量的指标,这些领域目前还停留在相对早期的阶段,只是个别公司或研究者所关注的,但却极具潜力。
比如,IBM 研究者 Francesca Rossei 提出了一个关注领域「常识推理和自然语言理解」。这里探讨的是,如何将常识推理纳入到问答系统中。目前,机器问答系统依然无法具有真正的「对话」能力,而只有加入常识推理,才能最大限度提升机器对于对话的理解能力,这个领域的研究正在加速,该报告也强调,他们会持续关注这些新指标的发展。
再比如 ,来自 MIT 的 Rodney Brooks 将 AI 与机器人放在一起,就目前来看,机器人的出货量还没有一个统一的指标,更多的机器人出货量统计还是工业机器人,但工业机器人缺乏或根本就没有 AI 能力。随着越来越多的机器人拥有了 AI 能力,这些机器人的出货量统计也会成为一个观察 AI 发展的重要指标。
三
至此,关于 AI Index 2018 年度报告的主要内容已经梳理完毕,如果你关注 AI 发展,我强烈建议各位阅读这份报告,从而可以进一步感受全球 AI 的发展和进步。
在即将到来的 2019 年,我对全球 AI 领域也有几个预测。
首先值得关注的是 AI 硬件创业领域。过往几年 AI 创业热点聚集在算法和软件上,但围绕 AI 的硬件创业公司也非常值得关注,比如 AI 芯片,这个领域的会在 2019 年出现爆发增长,从而成为资本重点投资的新赛道。
其次,过去几年创业热门领域,如自动化、预测分析、机器视觉等,将步入大量「大鱼吃小鱼」的新阶段,一方面,创业公司之间的兼并会加速,另一方面则是巨头的收割已经开始。
第三,AI 领域的新工作需求开始凸显,比如「数据标注师」和「数据训练师」也成为热门职业,这也是当下 AI 需要大量标注数据的必然要求。
第四,GAN(Generative Adversarial Networks),即生成对抗网络将具有真正的应用落地。
GAN 是近四年来深度学习的一个热门领域,简而言之,就是通过两个神经网络的「对抗」,来提升最终的算法质量。微软一位工程师曾经这样解释:
……一个是摄影师(男生),一个是摄影师的女朋友(女生)。男生一直试图拍出像众多优秀摄影师一样的好照片,而女生一直以挑剔的眼光找出“自己男朋友”拍的照片和“别人家的男朋友”拍的照片的区别。于是两者的交流过程类似于:男生拍一些照片 ->女生分辨男生拍的照片和自己喜欢的照片的区别->男生根据反馈改进自己的技术,拍新的照片->女生根据新的照片继续提出改进意见->……,这个过程直到均衡出现:即女生不能再分辨出“自己男朋友”拍的照片和“别人家的男朋友”拍的照片的区别。
GAN 拥有巨大的应用场景,比如图片、机器翻译、对话、语音合成等领域。甚至也有人在研究,将 GAN 应用到自动驾驶中,这个领域的发展,非常值得期待。
第五,深度学习之外,我们还应该注意其他方法。如今,关于深度学习局限性的争议越来越多,事实也的确如此。数据量始终是深度学习无法克服的难题,更困难的事,深度学习无法产生人类习以为常的「常识」,这也将大大限制机器智能的发展。
长期以来,人工智能研究中都存在「联结主义」与「符号主义」两大门派的对抗,前者催生了目前的深度学习,而后者则强调常识推理,这恰恰也是当下人工智能所欠缺的。在这个领域,Google 正在发力,预计在 2019 年,符号逻辑的人工智能研究方法会初露锋芒。
伴随着技术突破的激动与技术伦理问题的担忧,AI 的 2018 即将画上一个句号,但这一切也仅仅只是一个开始(完)。