什么是智能

最近,我和我的妻子梅亚很幸运地参加了一个由瑞典诺贝尔基金会举办的人工智能研讨会。在会议中,那些顶尖的人工智能研究者在“什么是智能”这个问题上展开了一场冗长的讨论,最后却未能达成共识。我们觉得这件事很有趣:居然连人工智能研究者也无法就“什么是智能”达成一致意见!因此,关于智能,显然不存在一个无可辩驳的“正确”定义。相反,有许多不同的定义在互相竞争,“参战”的定义有逻辑能力、理解能力、计划能力、情感知识、自我意识、创造力、解决问题的能力和学习能力等。

在这场关于智能未来的探索中,我们想采用一个最广泛、最兼容并包的观点,而不想局限于目前已知的智能范围。这就是为什么我会在第1章对智能下一个很广的定义,并在本书中用一种很宽泛的方式来使用这个词的原因。


智能(intelligence):完成复杂目标的能力。


这个定义很广,足以涵盖前文提到的所有定义,因为理解力、自我意识、解决问题的能力、学习能力等都属于我们可能会遇到的复杂目标。同时,这个定义还能将《牛津英语词典》中的定义“获得和应用知识与技能的能力”也涵盖进去,因为你也可以将“应用知识与技能”作为一个目标。

由于可能存在许多不同的目标,因此,也可能存在许多不同的智能。所以,从我们的定义出发,用IQ这种单一指标来量化人类、动物或机器是没有意义的若想理解这一点,请想象一下,假如有人声称,奥运会运动员的运动能力可以用一个数字来量化,这个数字称为“运动商”(Athletic Quotient),简称“AQ”,而AQ最高的人可以直接获得所有运动项目的金牌。你会怎么想呢?。假设有两个计算机程序,一个只会下象棋,另一个只会下围棋,请问哪一个更智能?这个问题并没有标准答案,因为它俩各自擅长的事情没法进行直接的比较。不过,假如存在第三个计算机程序,它能够完成所有目标,并且,它在某一个目标上,比如下象棋,做得远比前面所说的两个程序都好,而且在其他目标上完成得也不比它们差,那我们就可以说,第三个程序比前面两个程序更加智能。

另外,争论某些边缘化的例子是否具备智能,也没什么意义,因为能力不是非黑即白、非有即无的,而是分布在一个连续谱上。举个例子,什么样的人算得上能说话?新生儿?不能。电台主持人?能。但是,假如一个幼童能说10个词,她算不算得上能说话?如果她会500个词呢?界限应该划在何处?在我所说的智能定义中,我特意用了一个很模糊的词——复杂,因为人为地在智能和非智能之间画一条界线是于事无补的,不如对不同目标所需的能力进行量化,可能会更有用一些。

对智能进行分类,还有一种方法,那就是用“狭义”(narrow)和“广义”(broad)来进行区分。IBM公司的深蓝(Deep Blue)计算机虽然在1997年战胜了国际象棋冠军加里·卡斯帕罗夫(Garry Kasparov),但它能完成的任务范围非常“狭窄”,因为它只能下象棋,尽管它的硬件和软件都令人印象深刻,但它甚至不能在井字棋游戏中战胜一个4岁的儿童。谷歌旗下DeepMind公司的“DQN”人工智能系统能完成的任务范围稍微广一点:它会玩几十种经典的雅达利电子游戏,并且玩的水平与人类的水平不相上下,甚至更好。相比之下,人类智能的宽度可比它们广多了,人类能掌握多如牛毛的技能。只要经过训练,假以时日,一个健康的儿童不仅能够学会任何游戏,还能学会任何语言、运动或职业技能。将人类智能和机器智能做个比较,我们人类会在宽度上立马胜出。不过,机器在某些比较狭窄的任务上胜过了我们,这些任务虽然小,但数量却在与日俱增。我在图2-1中列出了这些任务。人工智能研究的“圣杯”就是建造最广泛的通用人工智能,它能够完成任何目标,包括学习。我们将在第4章详细探讨这个话题。“通用人工智能”这个词变得流行起来,得感谢三位人工智能研究者:沙恩·莱格(Shane Legg)、马克·古布鲁德(Mark Gubrud)和本·戈策尔(Ben Goerzel),他们用这个词来形容人类水平的通用人工智能,即能够完成任何目标并且完成得与人类不相上下的能力关于通用人工智能(AGI)这个词的来源的注解:http://wp.goertzel.org/who-coined-the-term-agi.。我将遵照他们的定义。因此,每次我使用通用人工智能时,都是在说“人类水平的通用人工智能”有些人喜欢将“人类水平的人工智能”或“强人工智能”作为通用人工智能的同义词,但这是有问题的。从狭义的角度来说,一个计算器也可以算得上人类水平的人工智能。“强人工智能”的反义词应该是“弱人工智能”,但把深蓝计算机、沃森和AlphaGo这类“狭义人工智能”系统称为“弱人工智能”是一件令人觉得很古怪的事情。,除非我明确地在这个缩写前面加上了形容词,比如超人类水平的通用人工智能。

图2-1 人工智能可以胜出人类的任务

注:智能的定义是,完成复杂目标的能力。它不能用单一的IQ指标来衡量,只能用一个由所有目标组成的能力“谱”来衡量。箭头指的是当今最好的人工智能系统在不同目标上的表现。通过这张图可以看出,当今人工智能的能力总是比较“狭窄”,每个系统只能完成非常特定的目标。与之相比,人类智能则非常宽广:一个健康儿童能学会做任何事情,而且在所有事情上都做得比人工智能更好。

虽然人们在使用“智能”这个词时,总是倾向于带有积极正面的色彩,但我想强调的是,在本书中使用“智能”这个词时,我不会做任何价值判断,它就是完成复杂目标的能力,而无论这个目标被认为是好的还是坏的。因此,一个智能的人可能非常擅长帮助他人,也可能擅长伤害他人。我们将在第7章探讨有关目标的问题。说到目标,我们还需要澄清一个微妙的问题,那就是:我们所说的目标,究竟是谁的目标?假设在未来,你拥有了一台全新的个人机器助理,它虽然没有自己的目标,但会完成你安排给它的任何事情。某一天,你叫它为你做一顿美味的意大利晚餐,然后,它上网搜索了意大利菜的菜谱,了解了如何到达最近的超市、如何煮意大利面等问题,最后成功地买来了所需的原料,并为你烹制了一顿美味的晚餐。那么,你可能会认为它是智能的,即使最原始的目标其实是你的。实际上,当你提出要求时,它就继承了你的目标,并将其分解成几层子目标,从付钱给收银员到磨碎帕尔玛干酪,而这些子目标都是属于它自己的。从这个层面来看,智能行为毫无疑问是与达成目标联系在一起的。

人类总喜欢按难度对任务进行排序(见图2-1),但这些任务的难度顺序对计算机来说却不一样。对人类来说,计算314159和271828的乘积,可比从照片中识别一个朋友难多了,但计算机早在我出生迈克斯·泰格马克生于1969年。——编者注以前就已经在计算能力上超过了人类,而接近人类水平的计算机图像识别技术却一直到近期才成为可能。低级的“感觉运动”感觉运动(sensorimotor)是指刺激作用于感觉神经而传至大脑,再由运动神经做出动作的活动。——编者注任务对计算机来说虽然需要消耗大量的计算资源,但很容易完成。这种现象被称为“莫拉维克悖论”(Moravec's paradox)。有人解释说,造成这个悖论的原因是,为了完成这些任务,我们的大脑其实调用了其1/4的资源,即大量的专门硬件,从而使这些任务感觉起来很容易完成。

我很喜欢汉斯·莫拉维克所做的下面这个比喻,并冒昧地将其呈现在了图2-2中:


计算机是通用机器,它们的能力均匀地分布在一个宽广得无边无际的任务区域上。不过,人类能力的分布却没那么均匀。在对生存至关重要的领域,人类的能力十分强大,但在不那么重要的事情上就很微弱。想象一下,如果用地形来比拟人类的能力,就可以画出一幅“人类能力地形图”,其中低地代表着“算数”和“死记硬背”,丘陵代表着“定理证明”和“下象棋”,高耸的山峦代表着“运动”“手眼协调”和“社交互动”。不断进步的计算机性能就好像水平面,正在逐步上升,淹没整个陆地。半个世纪以前,它开始淹没低地,将人类计算员和档案员逐出了历史舞台。不过,大部分地方还是“干燥如初”。现在,这场洪水开始淹没丘陵,我们的前线正在逐步向后撤退。虽然我们在山顶上感到很安全,但以目前的速度来看,再过半个世纪,山顶也会被淹没。由于那一天已经不远了,我建议,我们应该建造一艘方舟,尽快适应航海生活!选自汉斯·莫拉维克于1998年发表的文章《当计算机硬件与人类大脑相媲美时》(When will computer hardware match the human brain), Journal of Evolution and Technology, vol. 1.


在莫拉维克写出这段话的几十年之后,“海平面”如他所预言的那样毫不留情地持续上升,就好像全球变暖打了鸡血一样。一些“丘陵”地区(包括下象棋)早已被淹没。下一步会发生什么,我们又应当做些什么,这就是本书余下部分的主题。

图2-2 人类能力地形图

注:这张“人类能力地形图”是机器人专家汉斯·莫拉维克提出的,其中,海拔高度代表这项任务对计算机的难度,不断上涨的海平面代表计算机现在能做的事情。

随着“海平面”持续上升,它可能会在某一天到达一个临界点,从而触发翻天覆地的变化。在这个临界点,机器开始具备设计人工智能的能力。在这个临界点之前,“海平面”的上升是由人类对机器的改进所引起的,但在这个临界点之后,“海平面”的上升可能会由机器改进机器的过程推动,其速度很可能比人类改进机器的速度快得多,因此,很快,所有“陆地”都会被淹没在水下。这就是“奇点”理论的思想。这个思想虽然十分迷人,但却充满争议。我们将在第4章探索这个有趣的话题。

计算机先驱艾伦·图灵曾有一个著名的证明,假如一台计算机能实施一组最小的特定运算,那么,只要给它足够的时间和内存,它就能被编程以实施其他任何计算机能做的任何事情。超过这个临界点的机器被称为“通用计算机”(universal computers),又叫作“图灵通用计算机”(Turing-universal computers)。就这个意义而言,今天所有的智能手机和笔记本电脑都算得上是通用计算机。类似地,设计人工智能所需的智能也有一个临界点,我喜欢将这个临界点视为“普遍智能”泰格马克在这里用“universal intelligence”与“universal computer”(通用计算机)进行类比,按理来说,应该将两个“universal”翻译成同一个词“通用”。但“通用智能”是另一个词组“general intelligence”的专有翻译,为避免混淆,我将“universal intelligence”翻译成“普遍智能”。——译者注的临界点:给它足够的时间和资源,它就可以具备完成任何目标的能力,并且完成得和其他任何智能体不相上下。比如,如果普遍智能认为自己需要更好的社交技能、预测技能或设计人工智能的技能,那它就有能力去获得这些技能;如果它想要了解如何建造一个机器人工厂,它也完全有能力去获得建造工厂的技能。换句话说,普遍智能具备发展到生命3.0的潜力。

然而,既然物理学提出,万事万物在最基本的层面上都只是四处游走的物质和能量而已,那么,信息和计算究竟是什么呢?看得见摸得着、具备物理实体的物体如何体现出抽象无形、虚无缥缈的东西,比如信息和计算呢?换言之,一堆无聊愚钝、按照物理定律飞来飞去的粒子是如何展现出我们认为的“智能”的行为的呢?

如果你认为这个问题的答案是显而易见的,并且认为机器可能会在21世纪内达到人类的智能水平,或者如果你是一位人工智能研究者,那么,请跳过本章余下的部分,直接开始阅读第3章;否则,请你读一读本章剩下的三节,这是我特别为你而写的内容。