猎鹿博弈:寻求帕累托最优

爱情的麦穗理论与极大极小

选择伴侣是人生中最重要的事,特别是对于女性,婚姻无异于女人的第二次生命。俗话说得好:“男怕入错行,女怕嫁错郎。”因此,女性朋友在择偶时必须慎之又慎。那么,如何用博弈论来指导自己的择夫行为呢?“麦穗理论”就可以帮助我们解决。

伟大的思想家、哲学家柏拉图问老师苏格拉底什么是爱情。老师让他先到麦田里去摘一棵全麦田里最大最金黄的麦穗来,只能摘一次,并且只可向前走,不能回头。

柏拉图于是按照老师说的去做,结果两手空空他走出了麦田。老师问他为什么没摘?他说:“因为只能摘一次,又不能走回头路,其间即使见到最大最金黄的,因为不知前面是否有更好的,所以没有摘。走到前面时,又发觉总不及之前见到的好,原来最大最金黄的麦穗早已错过了;于是我什么也没摘。”

老师说:“这就是爱情。”

之后又有一天,柏拉图问他的老师什么是婚姻。他的老师就叫他先到树林里砍下一棵全树林里最大最茂盛的树。其间同样只能砍一次,同样只可以向前走,不能回头。

柏拉图于是照着老师说的话做。这次,他带了一棵普普通通,不是很茂盛,亦不算太差的树回来。老师问他:“怎么带这棵普普通通的树回来?”他说:“有了上一次的经验,当我走到大半路程还两手空空时,看到这棵树也不太差,便砍下来,免得最后又什么也带不出来。”

老师说:“这就是婚姻。”

西方的择偶观里有著名的“麦穗理论”,是说我们寻找伴侣时如同走进了一个麦田,一路有麦穗向我们招手,很多人不知道摘取哪一棵,因而就会有踌躇和彷徨、遗憾和悲伤。而正常人再花心,他或她也得选择一人来陪伴自己的旅程。当然并不排除有极少数人会在短短的一生里一换再换。

可见,完美的爱情和婚姻是很难得到的,大多数人只是凑合状态。真正合适的概率是很小的。

不妨假设有20个合适的单身男子都有意追求某个女孩,这个女孩的任务就是从他们当中挑选最好的一位作为结婚对象,决定跟谁结婚。从这20个里面选出最好的一个并非易事,怎么做才能争取到这个结果?

首先,要考虑的是约会时对对方真实性格、人品的判断。约会时,男女双方一开始都是展示自己的优点,掩盖自己的不足。当然,他们都想了解对方的一切,不管是优点还是缺点。对于一个女孩来说,男朋友赠送的花是相对廉价的,而贵重的钻石、金表、项链等礼物也许更能代表一个人的真心。正如有句话说的:“一个男人爱一个女人有多深,就会为她掏出多少钞票。”然而,礼物值多少“钱”对于不同的人是有差异的。对一个身价亿万的有钱人来说,送上一颗名贵钻石可能比带女孩游山玩水的价值要低得多。反之,一个穷小子,花了大量时间辛勤工作,买上一颗钻石的价值就要高得多。她也应当意识到,她的约会对象同样会对她的行为挑剔一番。因此,她得采取能真正代表她具有高素质的行为,而不是谁都学得来的那些行为。

其次,要考虑的是选择什么样的方法来筛选出比较合适的异性。很明显,最好的方法是和这20个人都接触一遍,了解每个人的情况,经过筛选,找出最适合的那个人。然而在现实生活中,一个人的精力是有限的,不可能花大把的时间去和每个人都交往。不妨假定更加严格的条件:每个人只能约会一次,而且只能一次性选择放弃或接受,一旦选中结婚对象,就没有机会再约会别人。那么最好的选择方法存不存在呢?事实上是存在的。

不如我们来模拟一下。显然,我们不应该选择第一个遇到的人,因为他是最适合者的概率只有1/20。这个概率可以说是非常的渺茫,直接把筹码放在第一个人身上,也是最糟的赌注。同样的,后面的人情况都相同,每个人都只有1/20的概率可能是20个人当中的最适合者。

可以将所有的追求者分成组(比如分成5组,每组4人)。首先从第一组中开始选择。与第一组中每一个男性都约会,但并不选择第一组中的男性,即使他再优秀、再完美都要选择放弃。因为最合适的对象在第一组中存在的概率不超过1/5。

如果以后遇到比这组人更好的对象,就嫁给这个人。当然这种方法像“麦穗理论”一样,并不能保证选择出的是最饱满、最美丽的麦穗,但却能选择出比较饱满比较美丽的麦穗。无论是选择爱情、事业、婚姻、朋友,最优结果只可能在理论上存在。不要把追求最佳人选作为最大目标,而是设法避免挑到最差的人选。这种规避风险的观念,对我们在做人生选择时非常有用。

冯·诺依曼认为,在一个二人零和游戏中,总会找到一种明确而合乎理性的方法以获得个人的最佳利益。这个“明确而合乎理性的方法”就是“极小极大原理”。诺依曼的这一发现可能是博弈论最重要的核心内容。

何谓极小极大原理呢?用通俗一点儿的话说就是,我们想赢得竞争,可能有几种选择。我们当然愿意选择受益最大的一种,但是我们的选择不能不考虑到对方的决策,因为他跟我们一样也是这样想的,所以我们必须把对方的选择也考虑清楚。比如上面这个爱情故事中,因为双方都以自己的付出视为最大的受益,所以面对付出和不付出这两种策略选择时,他们都会选择付出。选择了付出,无论对方做出何种决策,其效果都比不付出要好,此时的付出策略就被称为这场博弈中的“优势策略”。反之,不付出是这场博弈的“劣势策略”,即在博弈中,不论对方采取什么策略,在我们可能采取的策略中,对自己严格不利的策略。劣势策略是我们在日常生活中不可以选择的行动。显然,如果双方都选择优势策略,那么这个博弈就是有迹可循、可以预测的,也就是所谓“理性的解”,并形成某种定式,即“均衡”。

在博弈中有了局中人,就要开始进行策略的选择。一局博弈中,每个局中人都有可供选择的、实际可行的、完整的行动方案,即方案不是某阶段的行动方案,而是指导整个行动的方案。一个局中人的一个可行的自始至终全局筹划的一个行动方案,称为这个局中人的一个策略。如果在一个博弈中,每个局中人都只有有限个策略,则称为“有限博弈”,否则称为“无限博弈”。人生随时面对着各种选择,所以在人生这场大游戏里,策略的选择也就异常重要。一旦选择不慎,则可能出现整个人生的败局,正所谓“一招不慎,全盘皆输”。

寻找帕累托最优

墨子的徒弟去见杨朱说:“先生,如果你拔掉一根毛,天下因此能得利益,你干不干?”杨朱说:“不干。”墨子的徒弟不高兴,出了杨朱的屋。他遇到杨朱的徒弟,就跟杨朱的徒弟说:“你的老师一毛不拔。”杨朱的徒弟说:“你不懂我老师的真意啊,我解释给你听吧。”于是,两人就展开了一段对话。

杨朱的徒弟:“给你财物,打你一顿,你干不干?”

墨子的徒弟:“我干。”

杨朱的徒弟:“砍掉你一条腿,给你一个国家,你干不干?”

墨子的徒弟不说话了,他心知再说下去杨朱的徒弟肯定会问:“砍掉你的头,给你天下,你干不干?”这还真不能随便答应下来。

杨朱的徒弟于是继续解释说:“毛没了,皮肤就没了;皮肤没了,肌肉就没了;肌肉没了,四肢就没了;四肢没了,身体就没了;身体没了,生命就没了。不可小看个体,现在当权者要牺牲百姓去满足自己的私心,将百姓的天下变成自己的天下,这怎么行?如果每一个百姓都能尽自己的本分,该耕田的耕田,该纺织的纺织,一个个的小利益积累起来,就是天下的大利益了,即所谓‘无为而无不为,无利而无不利’。”

这就是“一毛不拔”的典故来源,其间蕴涵着深刻的经济学原理。但对杨朱的这种观点,西方功利主义持不同观点。

比如说,假设一个社会里只有一个百万富翁和一个快饿死的乞丐,如果这个百万富翁拿出自己财富的万分之一,就可以使后者免于死亡,但是因为这样无偿的财富转移损害了富翁的利益(假设这个乞丐没有什么可以用于回报富翁的资源或服务),所以进行这种财富转移并不是“帕累托改进”,而这个只有一个百万富翁和一个快饿死的乞丐的社会可以被认为是“帕累托最优的”。

这里可以与古典功利主义的标准作比较。按功利主义的标准,理想的状态是使人们的福利总和最大化的状态。如果一个富翁损失很少的福利,却能够极大地增加乞丐的福利,使其免于死亡,那么社会的福利总和就增加。这样的财富转移是一种改善,而最初的极端不平等状态则是不理想的,因为它的福利总和较低。所以西方经济学中的功利主义认为,应当“拔一毛而利天下”,为了提高福利总和可以减少一些人的福利。但现代西方经济学出现了一种最佳的方案——帕累托改进,即在提高某些人福利的同时不减少其他任何一个人的福利。

帕累托最优是指资源分配的一种状态,在不使任何人的境况变坏的情况下,不可能再使某些人的处境变好的状态。帕累托最优只是各种理想态标准中的“最低标准”。也就是说,一种状态如果尚未达到帕累托最优,那么它一定不是最理想的,因为还存在改进的余地,可以在不损害任何人的前提下使某一些人的福利得到提高。但是,一种达到了帕累托最优的状态也并不一定真的很理想。

帕累托最优是博弈论中的重要概念,并且在经济学、工程学和社会科学中有着广泛的应用。如果一个经济体不是帕累托最优,则存在一些人可以在不使其他人的境况变坏的情况下使自己的境况变好的情形。帕累托最优是评价一个经济体和政治方针非常重要的标准。

帕累托改进,是指一种变化,在没有使任何人的境况变坏的情况下,使得至少一个人变得更好。一方面,帕累托最优是指没有进行帕累托改进余地的状态;另一方面,帕累托改进是达到帕累托最优的路径和方法。帕累托最优是公平与效率的“理想王国”。

下地狱而不升天堂

有一个人死后升了天,在天堂待了数日,觉得天堂太单调,于是就请求天使让他去地狱看看,天使答应了他。

他到了地狱,看到繁花似锦的宫殿、一群群妖媚的鬼女以及各种美食,就对魔鬼说:“我决定今天在这里过夜,听说这里很好玩。”魔鬼同意让他留下来过夜,并派了个美女招待他。

第二天,那人回到天堂。跟地狱比起来,天堂的生活仍然很单调。过了不久,他又开始想念地狱的花天酒地,再次请求天使准许他去地狱。一切都如同上一次,他容光焕发地回到天堂。又过了一阵子,他向天使说他要去地狱永久居住,说完不理天使的劝告,坚决地离开了天堂。

他到了地狱,告诉魔鬼他是来定居的。魔鬼把他迎进去,可这次接待他的是一个蓬头散发、满脸皱纹的老太太。“以前接待我的那些美女哪儿去了?”那人不满又好奇地问。

“朋友,老实跟你说,旅游是旅游,移民却不是一回事。”魔鬼告诉他。

如果你不知道这个故事所蕴涵的博弈原理,表示你还没有掌握博弈的互动性。

我们先看故事里的局中人,有天使、魔鬼、当事人。当事人有两种策略选择,一种是继续待下去,一种是换个环境比如地狱,这两种选择是他与自己生活状态的一种博弈。如果我们把与他博弈的局中人换成天使,那么他在选择两种策略的时候,就要考虑天使的反应。他想选择第二种策略去地狱,天使就面临着答应与不答应两种策略。若天使答应,他怎么办,不答应他怎么办。当然,最后的策略均衡是答应了。

当事人去地狱后,魔鬼与他进行博弈,在用诱惑来吸引他和用丑恶来接待他这两种策略选择中,魔鬼为了留住当事人,先用第一种策略来吸引他。如果魔鬼先用第二种策略的话,当事人肯定就走了,绝不会留在地狱的。魔鬼先选择第一种,而等当事人决定留在地狱时,魔鬼又拿出了第二种。魔鬼的每一个策略都是揣摩当事人的意思而定的。他和当事人之间有一个互动关系,如果当事人的策略选择是不留下,魔鬼肯定要换另外的策略,他总是按照当事人可能的策略选择来定自己的策略。

博弈者的身边充斥着其他具有主观能动性的决策者,他们的选择与其他博弈者的选择相互作用、相互影响。这种互动关系自然会对博弈各方的思维和行动产生重要的影响,有时甚至直接影响博弈结果。

这种互动性是博弈的最大特色。有学者认为,博弈论叫做“互动决策理论”更为准确,因为在博弈论中,博弈者往往是先考虑别人可能会出什么样招,再采取行动的。但是,假如我们的做法是以对手的可能动向为依据,那么,相同的,他们在行动时也会考虑到我们将会怎么做,所以在某种程度上,我们的做法其实是建立在我们觉得对手觉得我们会怎么做的基础上。

互动性对我们的启示意义在于,每个对弈者在决定采取何种行动时,不但要根据自身的利益和目的行事,也要考虑到自身的决策行为对其他人的可能影响,以及其他人的行为对自身的可能影响,通过选择最佳行动计划,来寻求收益或效用的最大化。

在激烈的市场竞争中,当商品在性能、价格、服务等方面相似时,商家应加强信息传递,与客户实现互动。商品信息若能先为人知、广为人知;企业若能知客户所想、做客户所求,就能占据绝对有利的市场营销地位。

一些地方政府在做出一项决策之前,召开听证会、做调查,这也是互动决策的一种表现形式。一项社会政策的制定和推行,只有照顾到更广泛的群众利益,才能有效地贯彻和执行。

新闻大战:同时行动中的优势策略

任何一个决策都是由决策主体做出的,如果从决策主体的人数来分,决策分个人决策和群体决策。个人决策是指,某一个决策者根据他自己的目标从他备选的策略中选择最优策略的一个过程;群体决策则指,一个至少由两个人组成的群体,在一定的规则下,根据群体各成员的决策而形成一个总的决策的过程。

对于某个决策者而言,其决策环境有两种:其他决策者,或自然。所谓其他决策者构成他的决策环境是指这样的情况:决策者的利益与其他决策者的行为选择有关联,其他决策者的利益与该决策者的利益存在关联。此时,决策者的策略选择要考虑他人的策略选择,他人的决策也要考虑该决策者的策略选择。此时的行为选择构成一个博弈。博弈是行为的互动过程,当不存在这样的互动的时候,决策便是面对自然的决策。

生活是由无数的博弈即互动所组成的。我们并不是单独地生活在自然之中,而是生活在群体或社会之中。我们不仅从社会中获得生活必需品,而且也从社会中获得荣誉感和认同感。同时,我们也为社会或者说为他人作出贡献。我们与人群中的其他人组成一个互动的社会,我们依存于这个社会。

由于我们生活在社会之中,我们决策的外部环境更多的是他人。所以我们进行决策时要考虑我们的策略对他人的影响(这个影响反过来又影响到我们自己),我们也要考虑他人的策略选择对我们的影响。

我们的行动和他人的行动是交织在一起的,我们时刻与他人处于互动即博弈之中。因此,我们这里所说的策略选择是针对我们与他人处于一个博弈而言,而不讨论人们面对自然的决策。我们在做决策时要对我们所处于其中的博弈局势进行理性分析,正确地做出策略选择,以达到我们所要实现的目标。

博弈实际上就是互动的策略性行为。在每一个利益对抗中,人们都是在寻求满足自身利益最大化的优势策略。另外,博弈的精髓在于参与者的策略相互影响、相互依存。这种互动通过两种方式体现出:同时行动和相继行动。

其中一种互动方式是同时行动。比如囚徒困境故事中的情节,参与者同时出招,完全不知道其他人走哪一步。不过,每个人必须心中有数,知道这个博弈游戏存在其他参与者,其他参与者也非常清楚这一点。因此,每个人必须设想一下若是自己处在其他人的位置,会做出什么反应,从而预计自己这一步会带来什么结果。他选择的最佳策略也是这一全盘考虑的一个组成部分,无论对方采取何种策略,我们均应采取自己的优势策略,这正是博弈论研究的主题。为了理解这一点,我们来看一个新闻大战的案例。

美国的两大杂志《时代》和《新闻周刊》在每个星期都会暗自较劲。对于作为周刊的《时代》来说,做出引人注目的封面故事是非常重要的。因为一个饶有趣味的封面,可以吸引站在报摊前的潜在买主的目光。所以说,《时代》的编辑们每个星期都会举行闭门会议,选择下一个封面故事。

其实,他们这么做的同时,《新闻周刊》的编辑们也在关起门来开会,选择下一个封面故事。换句话说,《新闻周刊》的编辑们知道《时代》的编辑们正在做与他们同样的事,而《时代》的编辑们也知道《新闻周刊》的编辑们知道这一点……这两家新闻杂志投入了一场策略博弈中。

由于《时代》与《新闻周刊》的行动是同时进行的,双方不得不在毫不知晓对手决定的情况下采取行动。如果等到彼此发现对方做什么时,再想做或改变什么就太迟了。当然,这个星期的输家很可能在下个星期竭力反扑,但是等到那时,或许已经出现了另外一种搏击模式,双方展开的又将是一场完全不同的博弈。

从《时代》和《新闻周刊》的新闻大战中我们可以看出,同时行动中的博弈策略与相继行动中的博弈策略有很大不同。这种博弈相当于下棋时的一人一步的相继行动,每个参与者都必须向前展望,估计对手的意图,然后倒后推理,从而决定自己应该怎么走才会在这一轮中占据优势。这是一条线性的推理链,“假如我这么做,他就会那么做,若是他那样的话,我会这么反击”,以此类推。换句话说,我们怎么走取决于对手的上一步行动。

那么,对于每个竞争者来说,怎样才能看穿那些错综复杂而又看不见的策略呢?最重要的一点就是,我们不要把其他参与者的未知行动看做像天气那样,具有与个人无关的不确定性。也就是说,对于两家周刊来说,为封面故事而做决定的概率与天气是否变坏的概率完全不同。《时代》的编辑们对《新闻周刊》的编辑们有一个非常中肯的了解,就跟《时代》的编辑们自己一样。即使是同一个编辑也不会真的观察到另一个杂志的决定,但是他可以通过另一个杂志的视角来思考问题,猜测对方现在在做什么。此时,寻找一个优势策略是首要任务。

我们假设本周有两个大新闻:一个是国会就预算问题吵得不可开交;另一个是发明了一种据说对艾滋病有特效的新药。当两家周刊的编辑们选择封面故事时,都会首先考虑哪一条新闻能更加吸引报摊前的买主(订户则无论采用哪一条新闻封面故事都会买这本杂志)。我们假设在报摊前的买主中,30%的人对预算问题感兴趣,70%的人对艾滋病新药感兴趣,每个人都只会掏钱买那本封面故事是自己感兴趣的新闻的杂志。如果两本杂志用了同一条新闻做封面,那么感兴趣的买主就会平分两部分,一部分买《时代》,而另一部分买《新闻周刊》。而如果一家用预算做封面故事,另一家用艾滋病新药做封面故事,那么买主就会是3∶7。

这时,双方就开始积极行动。《时代》的编辑会进行如下推理:如果《新闻周刊》采用艾滋病新药做封面故事,那么,我要是采用预算问题的话,就会得到整个“预算问题市场”(即全体读者的30%);但我要是采用艾滋病新药的话,我们两家就会平分艾滋病新药市场(即我得到全体读者的35%),所以说,‘艾滋病新药’所带来的收入就会超过预算问题。如果《新闻周刊》采用预算问题,那么,我要是采用同样故事的话,我得到一半的读者;假设我采用艾滋病新药问题,就会得到70%的读者,这一次的方案会给我带来更大的收入。因此,不论对手采取什么策略,我的优势策略就是采用艾滋病新药做封面。

由此可见,在那些不存在传统策略均衡的博弈中,仍然可以根据优势策略的逻辑找出均衡。只要有一方采用优势策略,另一方就可针对这个策略采用自己的最佳策略。

我们每个人都是策略的使用者,时刻都面临着不同的行动选择,时刻都计算着应当采取何种行动。这种选择不仅体现在选择上哪所大学、学哪门专业、从事何种工作等这样的大事上,而且也体现在买什么菜、穿什么衣服这样的小事上。然而,尽管我们每个人都是策略的使用者,但为什么有的人功成名就,而有的人一辈子却默默无闻呢?其答案就在于,他是蹩脚的策略使用者还是优秀的策略使用者。优秀的策略使用者——我们称之为策略家,他们会自觉和不自觉地进行博弈思维,把博弈思维贯穿于各种竞争性的活动之中,从而在人生的很多方面都能够取得成功;而蹩脚的策略使用者往往缺乏博弈思维,他们的策略选择往往是不合理的,这导致了他们在人生中常常失意。当然,我们这里不是在宣扬某种价值观。事实上,成功与否与幸福之间没有必然联系。默默无闻的人可能是一辈子幸福的人,而功成名就的人也可能是不幸福的。我们在此所要表明的是,如果一个人希望成功,那么你就要运用博弈思维,成为策略家。

在优势策略均衡中,不论其他参与人选择什么策略,这个参与人的优势策略都是他的最佳策略。显然,这一策略一定是其他参与人选择某一特定策略时该参与人的占优策略。

举个常见的例子:一名篮球前锋和队友在篮下面对峙对方的一个后卫时,形成了二打一的局面。该前锋可以选择直接投篮,也可以选择传球给队友。根据经验,传球过人的成功率更大,那么传球就是该前锋的优势策略。即某些时候它胜于其他策略,且任何时候都不会比其他策略差。

如果一个球员,无论其他球员怎么做,他的策略都会高出一筹,那么这个球员就有一个优势策略。当然如果一个球员有这么一个优势策略,他的决策就会变得非常简单,只需直接采用该策略而完全不必考虑对手的应对策略。

应该说,对局者所采用的优势策略在对方采取任何策略时,总能够显示出优势。

田忌赛马:相继行动中的优势策略

《史记》中记载了“田忌赛马”的故事。

田忌经常与齐威王及诸公子赛马,设重金赌注。但每次田忌和齐威王赛马都会输,原因是田忌的马比齐威王的马稍逊一筹。孙膑通过观察发现,齐威王和田忌的马大致可分为上、中、下三等,于是,孙膑对田忌说:“您只管下大赌注,我能让您取胜。”田忌相信并答应了他,与齐威王和诸公子用千金来赌胜。比赛即将开始,孙膑说:“现在用您的下等马对付他们的上等马,用您的上等马对付他们的中等马,用您的中等马对付他们的下等马。”三场比赛过后,田忌一场落败而两场得胜,最终赢得齐威王的千金赌注。

后来,田忌把孙膑推荐给齐威王。齐威王向他请教兵法后,请他当自己的老师,孙膑的才学有了更宽广的用武之地。

同样是三匹马,由于选择的配置方法不同,结果就大不相同。田忌的马要比齐威王的马低劣,在这样的约束前提下,孙膑只是利用选择配置的不同就赢得了比赛。在做选择的过程中,我们应该学习“田忌赛马”中相继行动的优势策略。

每个参与者都必须展望一下他的这一步行动将会给其他人和自己以后的行动造成什么影响。也就是说,相继行动的博弈中,每一个参与者都必须预计其他参与者接下来会有什么反应,据此盘算自己的最佳招数。田忌就是通过相继行动的优势策略赢得了比赛。

东晋时,桓玄执掌朝权后,任命卢循为永嘉太守。卢循表面受令,却暗中扩展势力。刘裕平定桓玄之乱后控扼东晋朝政,任命卢循为广州刺史,卢循的姐夫徐道覆为始兴相。

公元410年春,卢循和徐道覆趁刘裕北伐南燕,后方空虚之机,实施北征。他们率军在始兴会合,然后分东西二路北上,进入湘州(今长沙)与江州(今江西九江西南)诸郡,一路势如破竹,声威大震。徐道覆力主东进,卢循犹豫数日才勉强同意,遂自桑落洲(今江西九江东北)进抵淮口(今江苏南京西北秦淮河口),向兵力不过数千的建康逼近。

刘裕闻讯,急忙自北线前线返京,紧锣密鼓地部署防卫行动。来到长江边,刘裕对各位将领说:“贼兵如果从新亭直接挺进,那么他们的锋芒就不可阻挡,应该暂且回避一下,是胜是负也就不可推测了。如果他们回到西岸去停泊,就可以一战擒之。”

徐道覆建议从新亭进军白石,然后烧掉战船登陆,分几路进攻刘裕。卢循打算采取尽可能保险的策略,对徐道覆说:“根据敌军的慌乱程度来看,他们自会在几天内崩溃散乱。现在,决定胜负也就是一朝之事,一味凭侥幸在战场上投机取利,既不一定能战胜敌人,又会损兵折将,不如按兵不动。”

刘裕在城头遥望卢循的部队,最初看见他们向新亭方向移动,脸色稍变,恐怕他们发动突然袭击。后来他看见敌军船只回到蔡州停泊下来,马上调动各路军队转移集中,砍伐树木在石头城和秦淮河口等地全部立起栅栏。同时命人尽快整修越城,兴筑查浦、药园、廷尉三座堡垒,派兵在那里把守。结果,卢循兵临建康近两月,兵疲粮乏,被迫于七月初退还浔阳,最后兵败投水自尽。

通过上面的例子我们可以看出,在这场相继行动的战役中,卢循之所以失败,是因为他受到了对方状态的影响,而一鼓作气,渡过长江,才是他的最优策略。作为进攻的一方,无论对方是已经调集了人马还是没有调来人马,他的策略都应该保证自己的锐气不被挫伤,并且制造最大的压力。

从上面这个例子中我们可以归纳出一个指导相继行动时的博弈法则:假如我们有一个优势策略照办,不要考虑对手会怎么做。假如我们没有一个优势策略,但对手有,那么就假定他会采用这个优势策略,相应地选择我们自己最好的做法。

在已经确立了同时行动的优势策略的前提下,如果运用了相继行动的博弈,在采用优势策略的时候就必须小心。因为策略互动的本质已经改变,优势策略的概念已完全不同。假如我们有一个优势策略,无论对手选择怎么做,我们按照这个策略做都行。如果我们选择相继行动,而对手先行,我们就应该选择自己的优势策略。这是我们对对手每一个行动的最佳对策,也是对他选择的特定行动的最佳对策。但是,如果我们先行,我们就不会知道对手将会采取什么行动。而他会观察我们的选择,同时做出自己的决定,所以说他的选择将会受到你的选择的影响。在一些情况下,如果采用优势策略以外的策略,我们将会有更有效地施加这种影响。

当没有优势策略时随机应变

在博弈中,并不是所有的博弈者都有优势策略,哪怕这个博弈只有一个参与者。实际上,优势与其说是一种规律,不如说是一种例外。虽然出现一个优势策略可以大大地简化行动的规则,但这些规则并不适用于大多数现实生活中的博弈。此时,我们必须运用其他原理来寻求解决之道。

我们知道一个优势策略优于任何其他策略,同样,一个劣势策略则劣于任何其他策略。如我们有一个优势策略,我们可以选择采用,并且知道我们的对手若是有一个优势策略他也会采用;同样,假如我们有一个劣势策略,我们应该避免采用,并且知道我们的对手若是有一个劣势策略,他同样会避免采用。

假如我们只有两个策略可以选择,其中一个是劣势策略,另一个一定是优势策略。那么,我们的策略必须建立在一方拥有至少三个策略的博弈的基础之上,采用与选择和优势策略做法完全不同的规避劣势策略的做法。即在没有优势策略的情况下,我们要做的就是剔除所有劣势策略不予考虑,如此一步一步做下去。

对利用优势策略方法与规避劣势策略方法进行简化之后,整个博弈的复杂程度已经降到最低限度,不能继续简化,而我们也不得不面对循环推理的问题。我们的最佳策略要以对手的最佳策略为基础,反过来对手的角度分析也是一样。在博弈中,无论是优势策略还是劣势策略,都是为了达到均衡的结果,关键是看我们如何行动了。

明朝嘉靖年间,著名奸臣严嵩掌权。在他掌权的日子里,以严家父子为首的腐败集团个个依官仗势,作威作福。上至朝廷大臣,下至地方官吏,谁都不得不让他们几分。

可是在浙江淳安县里,却出了一个为政清明的政坛奇人,他的名字叫海瑞。

海瑞是广东琼山人,自小死了父亲,靠母亲抚养长大,家里生活十分贫苦。二十多岁他中了举人后,做过县里的学堂教谕,教育学生十分严格认真。不久,上司把他调到浙江淳安做知县。过去,县里的官吏审理案件,大多接受贿赂,胡乱定案。海瑞到了淳安,认真审理积案。不管什么疑难案件,海瑞都调查得水落石出,从不冤枉好人,也不放过坏人。当地百姓都称他为“海青天”。

海瑞的上司浙江总督胡宗宪是严嵩一党,他仗着有后台,到处敲诈勒索,谁敢不顺他的心,就倒霉。有一次,胡宗宪的儿子带了一大批随从经过淳安,住在县里的馆驿里。要是换了别的县,官吏见到总督大人的公子奉承都来不及,可是在淳安县,海瑞立下一条规矩,不管皇亲国戚,一律按普通客人招待。

胡宗宪的儿子,平时养尊处优惯了,看到驿吏送上来的饭菜,认为是有意怠慢他,气得掀翻了饭桌,喝令随从把驿吏捆绑起来,倒吊在梁上。驿里的差役赶快报告海瑞。海瑞知道胡公子招摇过境,本来已经感到厌烦,现在竟吊打起驿吏来,就觉得非管不可了。

海瑞听完差役的报告,装作镇静地说:“总督是个清廉的大臣。他早有吩咐,要各县招待过往官吏不得铺张浪费。现在来的那个花花公子,排场阔绰,态度骄横,不会是胡大人的公子,一定是什么地方的坏人冒充公子,到本县来招摇撞骗的。”随后,他带了一大批差役赶到驿馆,把胡宗宪的儿子和他的随从统统抓了起来,带回县衙审讯。一开始,胡公子仗着父亲的官势,暴跳如雷,但海瑞一口咬定他是假冒公子,还说要把他重办,他才泄了气。海瑞又从他的行装里搜出几千两银子,统统没收充公,还把他狠狠教训一顿,撵出县境。

等胡公子回到杭州向他父亲哭诉的时候,海瑞的报告也已经送到巡抚衙门,说有人冒充公子,非法吊打驿吏。胡宗宪明知道他儿子吃了大亏,但是海瑞信里没牵连到他,如果把这件事声张起来,反而失了自己的体面,只好打落门牙往肚子里咽。

海瑞面对强大于自己的势力时,并没有趋炎附势,而是利用计谋,既打击了对方的嚣张气焰,让其有苦说不出,又让自己占据了一个有理有据的制高点,真可谓一举两得。

洛克菲勒为什么会成为超级富豪

19世纪中期,在美国宾夕法尼亚州发现了石油,成千上万人奔向采油区。一时间,宾夕法尼亚土地上井架林立,原油产量飞速上升。克利夫兰的商人们对这一新行当也怦然心动,他们推选年轻有为的经纪商洛克菲勒去宾宾夕法尼亚州原油产地亲自调查一下,以便获得直接而可靠的信息。

经过一段时间考察,洛克菲勒回到了克利夫兰。他建议商人们不要在原油生产上投资,因为那里的油井已有72座,日产1135桶,而石油需求有限,油市的行情必定下跌,这是盲目开采的必然结果。他告诫说,当别人全都开始进入一个行业时,我们自己的策略选择就是退出。

每一个行业的利润是有限的,当人们全都涌入其中疯狂争抢这有限的一块“蛋糕”时,在这场博弈里最理智的选择就是退出。洛克菲勒因此理性地选择了退出。

果然,不出洛克菲勒所料:“打先锋的赚不到钱。”由于疯狂地钻油,导致油价一跌再跌,每桶原油从当初的20美元暴跌到10美分。那些钻油先锋一个个败下阵来。3年后,原油一再暴跌之时,洛克菲勒却认为投资石油的时候到了。

此时,别人全都不从事石油了,洛克菲勒却出乎意料地选择从事石油。洛克菲勒总是根据众多商家的策略选择来判断自己的行为选择,这实际上就是博弈论的精明运用。

1865年,洛克菲勒初进石油业时,克利夫兰有55家炼油厂,到1870年洛克菲勒的公司成了克利夫兰最大的一家炼油公司,并成立了标准石油公司。标准石油公司成立之初只有26家生存下来,1872年底,标准石油公司就控股了26家中的2l家。

洛克菲勒成了美国十大超级富豪之一,从此以后,洛克菲勒家族成了美国威望最高的家族之一。

正是博弈中正确的策略选择成就了洛克菲勒的辉煌。他每一次都根据别人的选择判断出自己进入的最佳时机,每一次选择对洛克菲勒的事业都是一次极大的进步。