知识就是力量

1996年2月10日,下午3点,加里·卡斯帕罗夫(Gary Kasparov)昂首阔步地走进费城会展中心的一个小房间,参加象棋史上最受期盼的一场比赛。他身穿整洁的黑色西装和白色衬衣,面露紧张神色,注意力十分集中。入座后,他扫了一眼棋盘对面的许峰雄博士,这个戴着眼镜的美籍华人戏谑地看着他。

房间里,除了卡斯帕罗夫和许峰雄,还有3名摄影师、1名裁判、卡斯帕罗夫的3名随行人员以及1名技术顾问。赛场上要求绝对肃静,500名观众挤在附近的一个大讲堂里,观看着现场3台摄影机传来的实时报道,聆听着国际象棋大师亚瑟·塞拉万从现场传来的实况解说。大家一致认为现场气氛与以往任何一场象棋比赛都不同。

卡斯帕罗夫是国际象棋史上最伟大的象棋大师,这是人们公认的。他的国际等级分(ELO rating)——评判相关成绩的官方分数——是有记录以来最高的:比俄罗斯象棋大师阿纳托里·卡尔波夫高71分,比美国象棋大师博比·费舍尔高66分。当时赛场上的卡斯帕罗夫已经连续10年蝉联世界第一了;单是卡斯帕罗夫的出现就足以令一些德高望重的国际象棋大师忌惮三分。

不过,卡斯帕罗夫那天的对手可是一点儿都没被吓到,也没被卡斯帕罗夫闻名业内的心理战术影响。卡斯帕罗夫艺高人胆大,但他的对手对此毫不知情。其实,他对手甚至不在现场,而是远在数千米外的纽约州约克敦海茨的一幢大楼灯光昏暗的房间里。他的对手是一台计算机,名叫“深蓝”(Deep Blue)。

媒体大肆宣传,并预言说这是一场人机间的终极大对决。“人类的未来岌岌可危。”一名新闻广播员断言。“这场比赛不仅仅是棋艺的对决,更是在挑战人类至高无上的尊严。”这是《今日美国》(USA Today)的观点。就连卡斯帕罗夫自己似乎都受到了世界末日般的赛前宣传的影响,表示:“这是一项捍卫人类尊严的使命……是物种间的对决。”

卡斯帕罗夫开局第一步下在C5,许峰雄将这一步输入棋盘附近的一台计算机(深蓝背后的研发智囊团是电子技术行业的龙头老大——IBM公司),随后,一项当时相对新潮、名叫“互联网”的技术将这一信息传输到纽约的IBM中心。

这时候,深蓝立刻行动起来。它受专门研发的256个象棋处理器驱动,这些处理器同时运行,每32个处理器集中处理8个格,使得它的运算速度达到每秒钟一亿步。片刻后,深蓝快速回应,许峰雄严格按照指令行事:卒到C3。

8天6局比赛的这场人机大战吸引了全世界的目光。卡斯帕罗夫出生于阿塞拜疆,性格古怪,脾气暴躁,他喜欢装腔作势是出了名的,还经常愤怒地低吼和用力地摇头。好多人都指责他举止乖张怪异,说他是在故意扰乱对手。不过,这次他的计算机对手完全不为所动,反倒是他总从椅子上起来,在房间里走来走去。

2月17日,最后一局棋,走第40步前,卡斯帕罗夫拿起桌子上的手表,戴在了手腕上——大家都知道这个动作意味着这位世界冠军觉得比赛已经接近尾声。大讲堂里的观众都屏息以待。3步过后,许峰雄缓缓站起身来,向卡斯帕罗夫伸出手。观众中爆发出了雷鸣般的掌声。

卡斯帕罗夫胜利了。

问题是:他是如何做到的?一个运算速度每秒不超过3步的人(这是人类目前能达到的极限水平)是如何打败一个运算速度以亿计算的机器的?即将揭晓的答案将帮助我们解开专家表现背后最深的秘密,不仅限于运动领域,在其他更广阔领域里也是如此。

20世纪90年代,在美国军方的资助下,纽约心理学家加里·克莱因(Gary Klein)开始了一项大型研究,对现实生活中的决策情况进行调查。他打算验证以下推测是否正确——专业人士在做决定时运用逻辑思维,在确定最佳选择前,他们会仔细排查所有其他的备选方案。令克莱因感到困惑的是,研究进行的时间越长,该理论与决策者的实际情况就越不相符。

令人费解的不是顶级决策者们——医生、消防员、军事指挥官等——做决定时依据的是某些预料之外的因素,而是他们似乎根本就没有进行选择。在一番审时度势后,决策就完成了。他们压根没考虑其他备选方案,有些人甚至连自己是怎样采取相应行动的都解释不清楚。

克莱因在《洞察力的秘密》(Sources of Power: How People Make Decisions)一书中讲述了一名消防队长所做的决策救了人们性命的故事:

某住宅小区里的一间平房着火了,火势不猛,容易扑灭。是房子后方着了火,厨房的位置。消防队长带领队员进入房子,走到后方,向大火浇水,但大火却从他们后方蹿起,咆哮着。

“真奇怪。”他想。火应该能被浇灭才对啊。他们又试了一回,结果还是一样。他们后退了几步,重新部署。

然后,这位队长开始觉得有些不对劲。不过,他也不清楚具体哪里不对,就是觉得继续待在房子里不太好,于是下令所有人员撤出房间——这幢房子完全符合标准,毫无古怪之处。

所有人员刚踏出房间,他们刚才站着的地板就塌了。如果他们还待在房间里的话,他们早就掉进火海了。

后来,克莱因问队长他是怎么知道情况不对的,队长说,这都归功于“超感官知觉”。这是他能想到的可以用来解释他是如何做出这个决定、救大家一命的唯一理由,而且大家也喜欢这种说法,虽然它似乎是无稽之谈。克莱因是个彻头彻尾的理性主义者,所以他并不会认同特异功能的解释。其他专业级决策者也有类似的能力,令人百思不得其解,克莱因已经注意到了这一点,并给了他们同样的关注。这些决策者似乎知道要做什么,但是通常不知道自己为什么会这样做。

克莱因的一名同事花了好几周时间对一家大医院的新生儿病房展开研究。他发现,经验丰富的护士能在外行还没有察觉任何外显的可见症状时就判断新生儿患了传染病。这不仅仅是了不起,而是救了孩子的命:新生儿年龄尚小,要不是发现得早,他们很快就会死于传染病。

也许整件事情中最奇妙的就是,医院会给孩子做检查,看护士们的诊断是否准确无误,有时结果会呈阴性,但可以十分确定的一点是,如果第二天再查一遍,结果一定是阳性——护士们从来没出过错。在研究人员看来,这近乎神奇,就连护士们自己也困惑不解,说是“直觉”或是“第六感”在起作用。

这究竟是怎么一回事?来自运动领域的经验能否帮助我们揭晓谜底?

回想一下德斯蒙德·道格拉斯——英国乒坛的“飞毛腿冈萨雷斯”。对手的球拍还没碰到球,他就能凭借短期记忆群组里对手的一招一式,预测出球的运动轨迹。再想想看,体育赛事里的顶级运动员是怎么知道如何先发制人、创造所谓时间悖论的?即便时间极其有限,他们也从容不迫。

克莱因开始意识到,经验丰富的消防员的心理过程也是这样的。面对熊熊烈火中的房子,他们泰然处之,能立即根据多年经验找准火源,制订出一个细节丰富、概念精准的灭火计划。他们能将场景的可见特性印入脑海,吃透难解的动态变数,但通常不知道自己是如何做到的。消防队长认为这是“超感官知觉”的功劳,而道格拉斯的说法你肯定还记得——“第六感”。

消防队长在地板坍塌前命令全部人员撤离火场,通过深入探究他的思维方式,我们便会清楚这是怎么一回事。他并未怀疑火源是在地下室,因为他根本不知道这幢房子有地下室。他只是觉得有些奇怪,根据以往丰富的经验,火势应该会被控制住才对。火势并不大,客厅不应该那么热,而且还安静得出奇。实际情况与预期不符,但因为非常不显眼,他也没意识到其中的缘由。

在事后进行分析并和克莱因谈了几个小时的话后,队长才意识到事件的真相。队员们没扑灭大火,是因为火源在他们脚下而不在厨房;客厅比预想中要热,是因为在几米以下的地下室,大火烧得正旺,高温都是从那里传来的;房间里那么安静,是因为地板有隔音作用。所有这些——以及其他环环相扣、错综复杂程度不可名状的可变因素——是队长做出让大家离开火场的决定的原因,消防员们因此躲过一劫。

克莱因解释说:“队长以往的经验为他提供了一系列可靠的模型。他习惯将实际情况与脑海里的模型对应起来,以衡量现场情况的严峻程度。他也许无法清晰地描述出模型的样子或特点,但他会凭借这一模型匹配过程让自己安心并掌握现场的大体情况。”

在与新生儿护士进行过一番细致入微的谈话后,研究员们得出了相同的结论。其实,护士们依靠的是她们对知觉线索的深层认识。这些线索中每一个都是不易察觉、十分细微的,但是综合考虑,她们就能看出孩子生病了。无论是飞行员、将军还是侦探,凡是你能想到的职业,他们的心理过程都是这样的。正如我们所看到的,顶级运动员也是如此。他们的共同点就是都拥有长期经验和深层知识。

多年来,人们都认为知识在决策过程中扮演着无足轻重的角色。研究人员会选择在相关领域就是一张白纸的实验对象,以便在最纯粹、原始的状态下研究他们在“认知过程”中表现出的学习、推理和解决问题的能力,这种实验的核心思想就是,优秀决策者靠的是天赋——超凡的综合推理能力和杰出的逻辑思维,而不是先前的知识储备。

杰夫·科尔文在《哪来的天才?》一书中提到,一流商学院和知名企业都认为这一推断是正确的。他们认为自己能够制造出大量杰出管理者,这些管理者几乎可以空降到任何机构,并能凭借自身超凡的推理能力扭转乾坤。人们都说这无关经验,只要你脑子够聪明,懂得运用逻辑思维解决问题就行。杰夫·伊梅尔特(Jeff Immelt)于2001年担任美国通用电气公司的董事长后,委托人对全球业绩最佳的公司进行调查。他们的共同点是什么?科尔文在《哪来的天才?》一书中写道:“研究发现,这些公司都十分重视管理者身上的一大重要特质,那就是专业知识——对公司专攻的领域,知识储备要渊博。伊梅尔特现在明确要求,要想担任通用电气的领导,深层专业知识必不可少。”

这些认识不仅是现代重要的经营策略,更是人工智能的基础组成部分。1957年,两名计算机专家编写了一套程序,并将其命名为“通用问题求解程序”(General Problem Solver),还四处宣传说这是个万能问题解决机。它不具备任何专业知识,只有一个“通用求解引擎”(从本质上讲就是一套抽象的推理程序)。据悉,该引擎能解决任何问题。

但是,人们很快就认识到,这台没有任何专业知识储备的计算机虽然复杂先进,其实没有什么实质性的作用。正如人工智能领域的三大领头人布鲁斯·布肯南(Bruce Buchanan)、兰德尔·戴维斯(Randall Davis)和爱德华·费根鲍姆(Edward Feigenbaum)所说的那样:“任何专家系统中最重要的组成要素就是知识储备。虽然程序含有大量通用推理法,有些甚至还具有数理逻辑功能,但是没有专业知识储备,便无法专业地完成任何任务。”

回想一下消防员吧。许多年轻人都想从事这一职业,因为他们觉得自己十分擅长在压力下做决策,但他们很快便会发现自己无法胜任这一工作。面对熊熊燃烧的烈火,这些年轻人和我们一样,看到的只有火光冲天的骇人场景。只有经过不下10年的在岗培训,他们才能将眼前的火情放入对火灾类型的复杂认知中分析。

一流水平难以达到,这主要是因为,我们并不能靠某个下雨午后的一堂课就讲清楚专业知识,就算花一千个下雨午后的时间也做不到(克莱因研究中的消防员平均有23年的工作经验)。教师确实能提供些建议,告诉学生们大致方向以及有哪些注意事项,这是十分有益的,但他们无法让学生们全盘复制他们的毕生所学,因为无论是在体育运动还是其他领域,专家们对信息的处理加工过程是十分微妙而复杂的,关乎方方面面,信息总量之多令人难以想象。专家们永远也不可能将其编成法则,传授给世人。这就是“组合性爆炸”(combinatorial explosion)现象。有了这一概念,你就能明白本章中的诸多观点了。

许多人都不太了解组合性爆炸的威力有多大,最形象的方式就是将一张纸对折,使其厚度变为原来的两倍。现在重复这一步骤100遍,猜一猜纸变成多厚了?大多数人的估测都在十几厘米到几米之间。实际上,这时纸的厚度比地球到太阳距离的800兆倍还要多。

现实生活中,发生过很多变量的数量迅速增加的情况——包括体育运动领域,正是因此,我们根本不可能在做决定前排查所有线索证据,需要的时间太多了。只有有效压缩信息量,解码通过经验获得的模式的含义,我们才能做出漂亮的决策。这不是你能在课堂上学到的知识,也不是什么与生俱来的本领,你需要生活在其中,并不断学习。换句话说,实践出真知。

西佛罗里达州大学人类与机器研究所(Institute for Human and Machine Cognition at the University of West Florida)的研究员保罗·费尔托维奇(Paul Feltovich)表示:“人们认为,知道专家是怎么做的以后,就可以将这些技能直接传授给外行人,但现实通常没有这么完美。专业知识的习得是一个漫长的发展过程,需要丰富的业内经历和大量练习,不是能够简单传授的。”

卡斯帕罗夫和他的机器对手相比占有的决定性优势就是这个道理的鲜明写照。深蓝拥有所有必备的“天赋”:其运算速度能达到每秒钟上亿步。不过,虽然卡斯帕罗夫的运算速度和机器相比慢得可怜,只达到每秒3步,但是他有专业知识储备——一种深奥、精湛、不断完善的棋艺。实战中棋子如何布阵才能制胜,防御和进攻应当如何取舍,国际象棋对决中的全盘布局,他全都了如指掌。卡斯帕罗夫看一眼棋盘,就知道该采取什么行动;同样,经验丰富的消防员也能正视熊熊燃烧的建筑,想出对策。但是,深蓝不行。

还有一点值得关注。还记得SF吗?他出色地完成了数字记忆任务;利用赛跑选手的经验,他记住了不下80个数字。例如,他将数字9、4、6、2解读为9分46.2秒,跑两英里的话,这是个相当不错的成绩。SF的这一记忆模式是源于其测试以外的个人生活的特殊技巧。

而卡斯帕罗夫对棋子布阵的记忆则深深根植于实战演练中,完全真实,没掺半点假。他看到棋盘时,并非借助完全不同领域的经验来死记棋子位置,而是直接将其看作“西西里防御”或“拉脱维亚弃兵开局”。他的记忆结构深植于国际象棋体系之中。这种类型的知识最为强大,消防员、一流运动员以及其他专家掌握的也正是这种知识。

现在看来,深蓝在运算速度方面的压倒性优势不足以获胜的原因应该十分明显了——组合性爆炸效用。即便是国际象棋这种复杂程度没那么高的比赛,可变因素的增速之快,也超出了任何机器的运算能力范围。开局之初,就有大约30种走法。双方各走两步之后,可能的走法就增加到约8万种。几步过后,就该以万亿为单位进行计算了。最后,棋子的布阵走法比世界上已知的原子数量还多。

棋手想要获胜,就必须要削减计算量,忽略无益于取胜的走法,把心思放在能增加获胜筹码的走法上。卡斯帕罗夫理解了比赛的精髓,也就能做到这一点。深蓝就不行。

在赢得6局比赛中的2局以后,卡斯帕罗夫说:“要是和强手比赛的话,能打成平手我就很满足了。但决胜局的本质我懂,深蓝不懂。它强大的计算能力和我丰富的实战经验与排兵布阵的直觉相比,简直是小巫见大巫。”

加里·克莱因,那个研究消防员的心理学家,想再次确认棋手是不是真会根据感知组块模式来快速做出决定(这和计算机采取的暴力算法正好相反。)

他推论说,如果组块理论正确的话,即便可用时间骤减,顶级棋手仍能做出类似的决定。于是他对象棋大师们进行了“闪电战”测试,即每个人总共只有5分钟,大约6秒就要走出一步棋(标准情况是90分钟走40步,每步棋约有2分15秒的思考时间)。

克莱因发现,即使是在“闪电战”模式下,国际象棋大师排兵布阵的质量也几乎不会变差,虽然时间短得可怜,也就刚够拿起棋子,移动棋子,放下棋子,接着按下计时器。

克莱因接着测试了模式识别理论在直接做决策方面的应用。他让国际象棋大师们在下棋时边思考边宣布自己打算怎么下。他让大师们把每一步想法都告诉他,走每一步时是如何考虑的,包括有失水准的选择,尤其是他们最初考虑的走法。他发现第一感觉不但是可行的,而且在大多数情况下都是最优选择。

我们可以将“国际象棋不看运算能力和处理速度”这一假设从脑海里抹去了。和消防员以及网球运动员一样,国际象棋大师是靠直觉做出最优选择的。第一次看到时,你肯定会觉得很神奇(尤其是大师们还同时下着好几盘棋),不过这是因为我们没有看到他们为了达到这一水平,练习了上万个小时。

这和学语言有点像。起初,记住上千个单词,再用抽象的语法规则将其串在一起,似乎是项不可能完成的任务。但是,有了多年积累的经验,看到任意一句话,我们都能迅速理解它的意思。据估计,大多数英语使用者的词汇量可达到2万左右。美国心理学家赫伯特·西蒙估计,国际象棋大师掌握的棋子布局模式和模块的数量和这一词汇量不相上下。

现在想想看,在像冰球、美式橄榄球、英式橄榄球、网球、足球等运动中,组合性爆炸的威力有多大。就算科学家们已经发明了这些运动的简化版,复杂程度依旧不减分毫。例如,在机器人足球大赛中,球场上的位置得用1 680×1 088的像素呈现。想想看,棋盘只有纵横各8个小方格,棋子的每一步都是工工整整的,设计“深蓝”还是一件难事,而足球可随时都会到处乱飞。这样一来,便不难明白,要设计一台不会沦为信息负荷牺牲品的机器来和运动员竞争,简直难于上青天。

下面这段文字节选自《纽约时报杂志》1997年的一篇文章,是对冰球史上最伟大的运动员韦恩·格雷茨基(Wayne Gretzky)的一段描写:

格雷茨基看起来不像是个冰球运动员……他天赋异禀,总有神来之笔,这都是需要细细揣摩的……

对大多数球迷,甚至也包括场上的球员而言,冰球场上经常混乱一片:冰球杆挥来打去,球员摔得东倒西歪,冰球四处弹跳,够也够不着。但就是在这一片混乱中,格雷茨基能看出潜在的模式和人流,还能先现场所有人一步预测将会发生什么,精确极了……

比赛时,你会好几次看到他像是在冰球场的另一侧毫无目的地转着圈,远离人群,然后像是回应信号一样,立即先球一步飞奔到场上的某一点,等着几秒后冰球的出现。

这完美说明了专家在实际中是如何做决策的——预测规律,进而巧妙规避组合性爆炸。卡斯帕罗夫用的正是这一技能,只不过是在棋盘上,而不是在冰球场上。那格雷茨基又是如何做到的呢?我们来听听当事人自己的说法:“我在体型和速度方面都不具有先天优势;我的球感都是通过后天努力得来的。”后来,他还说:“你们能给我的最高赞誉就是肯定我每天都在非常努力地练习……这样一来,球还没落地,我就知道它要往哪去。”

所有这些都说明了本章先前提出的必备先决条件的重要性。你一定还记得“一万小时定律”吧?据说它适用于任何复杂任务。复杂到什么程度呢?实际上,这里指的复杂任务都具有组合性爆炸这一特点;其成败明显首要取决于“软件”(规律认知体系和高级运动程序)而不是“硬件”(单纯的速度快、力量大)。

大多数运动都具有组合性爆炸的特点:网球、乒乓球、足球、冰球,等等。试想一下,某一天我们设计出了一个能在网球场上击败罗杰·费德勒的机器人,它具有获胜所必需的实时空间感悟力,并且动作迅猛,具有良好球感,能完成挑战。但实际上,这样一个机器人的复杂程度决定它是无法得到完善的,更不用说完成这项挑战了。只有在赛跑和举重这类难度不高、仅考验速度或力量等单一能力的活动中,这种设计理念才有可能实现。

当然了,并非所有专家级别的决策都是凭直觉快速做出的。在某些情况下,国际象棋选手需要深入探寻可能的走法,消防员需要运用逻辑思维能力,理清行动后果。一流运动员和军事指挥官亦是如此。

不过,即使是在做最抽象的决策时,相关经验和知识仍旧发挥核心作用。斯坦福大学心理学家大卫·鲁梅尔哈特(David Rumelhart)曾做过这样一个实验:分别用真实场景表述法(“置办物品超过30美元就必须得到经理批准”)和表意清晰度差一些的方式(“所有正面有个元音的卡片,背面必须有个整数”)对一个逻辑表达式进行表述。通过第一种方式了解其含义的人数是第二种方式的5倍之多。

本章早些时候表示,关于天资的误解导致人们一旦无法迅速取得进步,就会索性放弃。而现在看来,如果某个机构坚持让资历浅薄之人掌权,就算他们拥有很强的逻辑思维能力,也会对机构造成损害。

例如,想想看,英国政府由于部长调任惯例而遭受的损害。部长是英国最有影响力的官员,而他们从一个部门被调到另一个部门,根本没机会充分建立和发展管理任何一个部门所需的知识储备。近年来,英国部长的平均任期已经减少到约1.7年。约翰·里德(John Reid)是托尼·布莱尔政府内阁成员,资历很老,7年间其调任次数不下7次。这就好比让泰格·伍兹从高尔夫球转去打篮球,然后转去踢足球,再去打冰球,在这种情况下还指望他在每个领域都发挥出极高的专业水平,简直荒谬。

当练习、知识与天赋相遇时,我们如何做出抉择,不仅会对我们自身和家庭产生极大影响,还会对企业、体育竞技、政府部门甚至人工智能的未来产生重要影响。

1997年5月3日,卡斯帕罗夫和“深蓝”再次正面交锋。这次的宣传依旧天花乱坠,赌注依旧高得惊人。奖金超过100万,由IBM提供。这次比赛在纽约第七大道安盛公正中心的35层举办,世界媒体蜂拥而至,数量远多于上次比赛(IBM估计自己会因免费宣传获利5亿多美元)。

不过,这次的赢家是“深蓝”,它两胜一负,战胜了世界冠军。这对卡斯帕罗夫而言是毁灭性打击,他气急败坏地冲出了比赛场地。之后,他声称IBM在制定规则时偏袒“深蓝”;还说他们拒绝提供他需要用来做赛前准备的打印件;他还信口开河说IBM比赛作弊。他输不起。

赛前的15个月发生了什么?“深蓝”是如何做到反败为胜的?首先,该计算机处理器的速度翻了一番(运算速度达到每秒两亿多步)。不过,要是没有另一项关键革新,这次胜利也是痴人说梦。

正如美国物理学会所说:“在IBM公司顾问和国际象棋大师乔尔·本杰明的共同努力下,‘深蓝’的国际象棋常识水平得到了显著提升。这样一来,它就能大量利用存储的信息资源,例如过去100年间国际象棋大师们在公开赛中的对决所产生的棋局数据库。”

“深蓝”程序的编写者就像加里·克莱因、吉姆·伊梅尔特和韦恩·格雷茨基一样,已经认识到了知识就是力量这一事实。

1码≈0.9米。——编者注

美国同名动画片中跑得飞快的小老鼠主人公。——编者注

在体育经济领域,有个人尽皆知的附加条文能够说明练习的重要性:像篮球和相扑这类运动,身高和基本体型明显是决定成败的关键因素,而且就算加大练习量也不会有什么改变。从很大程度上讲,这是由基因决定的。因此,对这类运动而言,身高(或是基本体型)相当于门槛。身高太矮,你是不会成功的。不过,你要是足够幸运,身高够了,比如说能去NBA打球,成败会再次取决于球感和动作技能——只要练习,这些技能都能得到提高。