073:AlphaGo 再战围棋,一场无关人类命运的屠杀

本周,AlphaGo 将和中国围棋高手再次过招,但正如我在较早前的会员通讯里所言:这是一场毫无意义的人机对战。理解这个判断的前提则是,为何人工智能要在棋类项目中表现自己?

人工智能与棋类项目「结缘」完全是因为人工智能需要一把「尺子」来衡量其发展水平。在那个遥远的 1936 年,当天才般的阿兰·图灵发布《论数字计算在决断难题中的应用》时,图灵将人作为计算模型的模拟对象和灵感来源,他为机器的发展指明了道路——模仿人类,但图兰并没有回答一个问题:如何衡量机器的「智能」?

1920年代,美国心理学家 Louis Lean Thurstone 在研究中发现,受访者在回答问题时更倾向于回答一些相对意义或者比较意义的问题,比如类似这样的问题「你更喜欢谁的画,A 还是 B?」就比单纯回答「你对A 画喜欢多少?」要容易简单的多。这套理论被称为「比较性判断准则(Law of Comparative Judgement)」。通过让人们每次比较多个对象中的两个,而最终可以计算出每个对象的测量分数(定距尺度)。

其运用范围非常广泛,人工智能研究者终于不再为定义「智能」来担忧了,只需要将机器与人类放在某个同样环境下继续比赛,利用人的智能来衡量机器的智能。棋类游戏首先被用于测试机器的智能,这是因为,本质上说,棋类游戏是一种「完美」信息的游戏,对玩家而言,无论人类还是机器,所面对的信息是透明且对等的——就是棋盘和棋子而已。

这样的暧昧情节始于1956年,IBM 工程师 Arthur Samuel 创造了一种西洋跳棋的应用程序,并使用强化学习来训练这个程序。1962年的时候,Arthur Samuel 的这个西洋跳棋程序打败了当时全美最强的业余选手 Robert Nealey。

与西洋跳棋程序同时进化的还有十五子棋。1979年,Hans Berliner 开发的 BKG 9.8 应用程序以7:1 的大比分打败了当时十五子棋的人类冠军 Luigi Villa, BKG 9.8 之后,包括 TD-Gammon 以及随后的应用程序都要比人类玩得更好。

接下来就是国际象棋。在 Arthur Samuel 打造他的西洋跳棋程序之前,克劳德·香农(信息论的开山鼻祖)在1950 年认为,国际象棋对人工智能研究来说是一项令人兴奋的挑战。「这个问题的解决方案将迫使我们承认机器是否能够思考的可能性,以及重新定义所谓思考的概念」。

但香农的预言显然是错了,在 1997 年 IBM 的深蓝打败卡斯帕洛夫之后,人类并没有遇到上述难题的困扰。于是,在几乎所有棋类游戏被机器征服之后,唯一剩下的就是起源于中国的围棋。

想理解围棋的复杂性,不妨来看一组数字:国际象棋平均每一步有大约 35 种可能的下法,围棋则多达 250 种,每一种下法之后又有250种下法,以此类推。这意味着,哪怕是最强大的超级计算机也无法预测每一种可能下法的最终结果,因为这实在是个复杂到无法想象的计算过程,即便是现在最强大的计算机处理能力,也无法快速完成这一计算任务。

尽管困难重重,人工智能研究者并未放弃对于围棋的追求。过去几年,Crazy Stone 和 Zen 这样的人工智能应用先后在人类让子的情况下打败过人类棋手。两年之前,开发了当时世界上最先进围棋系统 Crazy Stone 的 Rémi Coulom曾预言,机器打败人类顶尖围棋选手的时间至少还要10年。

但这个预言很快又被打脸了。如果从所谓「尺子」的角度去看,人工智能的确在进步。从西洋跳棋到国际象棋再到围棋的「跨越」,背后也是数据、算法以及计算能力的发展,但硬币的另一面则是:这些进步也仅仅局限在特定领域,或者准确地说,仅仅是在棋类领域。

即便是到了 AlphaGo 击败李世石以后,人工智能在棋类项目上已经碾压这个星球上最聪明的人类,我们依然无法回答香农的问题,去承认机器的可思考性,也无法对于机器智能的水准作出判断,譬如你如何定义 AlphaGo 与一个三岁孩子之间的智能水准?这也意味着,棋类项目作为人工智能进步标尺的功能已经失效,事实也的确如此,随着计算机、互联网的发展,在任何一个封闭规则的「游戏」来,机器都在无情地取代人类存在的价值

当 AlphaGo 完成对李世石的完胜之后,围棋领域就已经是人工智能主宰的游戏了,随后的 AlphaGo 进阶版「Master」又一次横扫人类棋手的故事再一次说明这个问题,从这个角度来说,本周这场人机大战,就像一个电影剧本一样,结局早已写好,每个「演员」只需对号入座自由发挥即可。

去年 AlphaGo 挑战李世石之前,《卫报》采访了 DeepMind 创始人 Demis Hassabis,下面这段对话非常有趣,也很有深意:

I’m reminded of AlphaGo, up there in Google’s unimaginably powerful computing cloud, just playing and playing and playing, self-improving every single second of every single day because the only way it can learn is to keep going…

“Does it ever get to rest?” I ask.

“Nope. No rest! It didn’t even have Christmas off.”

I hesitate. “Doesn’t it ever need a break?”

“Maybe it likes it,” he shoots back, a twinkle in his eye.

发表评论