在最近关于人工智能的讨论中,斯蒂芬·霍金的声音远比凯文·凯利(以下简称 KK)大了许多。
这当然不奇怪,一个是物理学百年难遇的奇才,「全球最聪明的头脑之一」,另一个不过是来自硅谷的媒介和技术观察家,两人各自不同的社会认可度,也让两人在人工智能舆论场的份量各有不同。
但声音大小却与对错无关。
霍金最新关于人工智能的态度是在上月末北京举行的 Gmic 大会的演讲,霍金这样说道:
现在,关于人工智能的研究正在迅速发展。这一研究可以从短期和长期来讨论。一些短期的担忧在无人驾驶方面,从民用无人机到自主驾驶汽车。比如说,在紧急情况下,一辆无人驾驶汽车不得不在小风险的大事故和大概率的小事故之间进行选择。另一个担忧在致命性智能自主武器。他们是否该被禁止?如果是,那么“自主”该如何精确定义。如果不是,任何使用不当和故障的过失应该如何问责。还有另外一些担忧,由人工智能逐渐可以解读大量监控数据引起的隐私和担忧,以及如何管理因人工智能取代工作岗位带来的经济影响。
长期担忧主要是人工智能系统失控的潜在风险,随着不遵循人类意愿行事的超级智能的崛起,那个强大的系统威胁到人类。这样错位的结果是否有可能?如果是,这些情况是如何出现的?我们应该投入什么样的研究,以便更好的理解和解决危险的超级智能崛起的可能性,或智能爆发的出现?
更进一步,霍金继续发出警告[1]:
But it could also be the last, unless we learn how to avoid the risks。 I have said in the past that the development of full AI, could spell the end of the human race, such as the ultimate use of powerful autonomous weapons…
就在霍金发表此番演讲之前,曾经是中国互联网公司的老朋友 KK 公开发文指出:当下人工智能威胁论完全是错误的看法。之所以错误,则是因为这些人,当然也包括霍金在内[2],有意无意地利用若干个假设来佐证他们的「担忧」,这些假设包括:
- Artificial intelligence is already getting smarter than us, at an exponential rate.
- We’ll make AIs into a general purpose intelligence, like our own.
- We can make human intelligence in silicon.
- Intelligence can be expanded without limit.
- Once we have exploding superintelligence it can solve most of our problems..
简单来说,这五个假设指出了一种显而易见的论调:人工智能正在快速发展中,而且正在超越人类智能,这种快速崛起的智能不仅将在通用层面帮助人类解决难题,还有可能超出人类的控制。
这正是霍金、马斯克等人立论的起点,但事实却绝非这么简单。
二
接下来,KK 提出了若干个与上述假设相反的假设,试图进一步证明:妄图以超级智能来解决人类终极难题或者试图以超级智能来散播人类灭亡的言论都是一种宗教信仰,是一种迷思。
这其中最关键的假设就是:所谓智能,并非一个维度,而且人类没有通用智能,也因此,机器同样不具有通用智能。与之相对的,则是霍金、马斯克提倡的通用智能理念——我们可以制造出媲美人类大脑的智能,而且随着近期的进化,这种智能最终超越人类。但 KK 很好地反驳了这个观点:
The starting point of the theory is: “Given infinite tape [memory] and time, all computation is equivalent.” The problem is that in reality, no computer has infinite memory or time. When you are operating in the real world, real time makes a huge difference, often a life-or-death difference. Yes, all thinking is equivalent if you ignore time. Yes, you can emulate human-type thinking in any matrix you want, as long as you ignore time or the real-life constraints of storage and memory. However, if you incorporate time, then you have to restate the principal in a significant way: Two computing systems operating on vastly different platforms won’t be equivalent in real time. That can be restated again as: The only way to have equivalent modes of thinking is to run them on equivalent substrates. The physical matter you run your computation on — particularly as it gets more complex — greatly influences the type of cognition that can be done well in real time.
文章里,KK 还专门询问「奇点爆炸」提出者库兹韦尔:
When I asked Ray Kurzweil, the exponential wizard himself, where the evidence for exponential AI was, he wrote to me that AI does not increase explosively but rather by levels. He said: “It takes an exponential improvement both in computation and algorithmic complexity to add each additional level to the hierarchy…. So we can expect to add levels linearly because it requires exponentially more complexity to add each additional layer, and we are indeed making exponential progress in our ability to do this. We are not that many levels away from being comparable to what the neocortex can do, so my 2029 date continues to look comfortable to me.”
请注意上文里那句加粗的话,这或许才是库兹韦尔的真实想法,这就是说,人工智能的增长曲线并非指数的,但通往人工智能的努力或实践才是指数级别的。更简单的表达就是:尽管人类在人工智能上投入越来越多,但到底能否有好的效果,谁也不知道。
库兹韦尔的这个表态当然没问题,最新一期的《经济学人》封面文章里,有一张图表说明了诸多问题:
右图是公司财报会议上对于人工智能的关注程度,从 2014 年开始就是极度陡峭的增长线,而与之对应的左图里,IDC 制造的「digital universe」指代的是每年数据生产和复制的数量,其增速也是指数级的,这说明了两个方面问题:其一,人工智能的确是当下最热的命题之一;其二,人工智能的再次回归,是海量数据带来的最直接反应。
如今数不胜数关于人工智能的视频要么充满了无知,要么充满了炒作,DARPA 今年 2 月份的一个视频则非常客观地指出,人工智能经历了第一阶段的失败之后,正在迎来充满机遇和挑战的第二阶段,无论如何炒作这个阶段,本质上说,当下人工智能研究并没有跳出过往的范畴,只不过是数据量增多了。
三
最新一期的 MIT Technology Review 封面故事里,人工智能的真实状况就是一个黑盒子。
这篇文章列举了两个案例,第一个是一辆采用深度学习的自动驾驶汽车,它不需要按照工程师预先设置的代码,而是通过算法在海量数据中挖掘有用的模型,进而做出决策——这听起来是一个非常棒的主意,看起来这样的决策方式与人类很相似,但硬币的另一面则是:没有人能够描述这辆车的决策方式,即便是开发算法的工程师。
第二个案例,纽约一家研究机构在 2015 年开始将深度学习应用在一些医院海量的数据挖掘中,这些数据包括病人病历、住院记录、药物测试反应等等。研究者将这个项目命名为「Deep Patient」,在抓取了高达 70 万病人的数据后,没有任何医疗专业人士的参与,Deep Patient 发现了诸多线索,比如它发现了很多患有潜在大病(比如癌症)的患者,这些患者在之前的病历并没有显示,但随后不同程度地患上了大病。换句话说,机器比他们主治医师还要清楚这些患者的未来病情。
和第一辆自动驾驶汽车一样,没有人清楚 Deep Patient 是如何做出诊断,这也是当下以深度学习为代表的人工智能所面临的巨大困境:如何破解机器决策的黑盒子?
另一个被媒体忽略的事实则是,最近几年热炒的人工智能,只是基于深度神经网络在某几个领域突破后的体现,比如语音识别、图像识别以及自然语言处理,除此之外,再无令人眼前一亮的表现。而不管是语音也好,图像也罢,都是互联网巨头们,如 Google 、百度、微软、苹果等大张旗鼓才加速的落地产品,从这个层面上看,倘若没有包括 Google 语音搜索、Siri 在内的语音搜索,语音识别技术到底能引发多大浪潮呢?或者换一个角度去思考,拥有巨大媒体影响力的硅谷公司们,在推动所谓人工智能成为热词的运动中可谓功不可没。[3]
而在「人工智能」的文字游戏之下,互联网巨头们俨然正在成长为新一代的能源(石油)公司,这个杀手锏就是数据:
Data are to this century what oil was to the last one: a driver of growth and change. Flows of data have created new infrastructure, new businesses, new monopolies, new politics and—crucially—new economics. Digital information is unlike any previous resource; it is extracted, refined, valued, bought and sold in different ways. It changes the rules for markets and it demands new approaches from regulators. Many a battle will be fought over who should own, and benefit from, data.
关于「数据就是新石油」的说法到底属于阿里巴巴的马云还是英特尔的科再奇已无关紧要,因为所有的公司都在围绕「数据」做文章:收集数据、挖掘数据、分析数据、买卖数据……
这一切与霍金所言的人工智能威胁人类毫无关系,但却是「人工智能」热背后的真实一面——没有哪家公司在开发可能超越人类的超级智能,而是以「人工智能」包装自己过往的产品,如私有云(亚马逊、阿里云)、如数据库(Oracle)、如企业软件(如 Selasforce)、如摄像头(苹果的 iPhone)等等。当然,这并非是否定霍金或马斯克的所言所言,只是,离他们所宣称的那个时刻,还相当遥远。