第1节:囚徒困境

要点

在被称为“囚徒困境”的一对一单次同时博弈(单阶段同时两人博弈)之中,如果各参与者都选择占优策略,就会导致比合作更坏的结果。但在现实的商业活动之中,为了自身的利益而出卖对方的情况十分常见。即便是同时博弈,也存在没有占优策略的情况。

案例

一、案例1:X汽车选择技术开发委托方

欧洲大型汽车生产企业X汽车打算委托其他企业开发一种安全装置。现在候选企业有安德森公司、布什公司、库克公司和戴尔公司四家。最终采用的安全装置技术肯定是在安德森公司的安德森方式和布什公司的布什方式之中二选一。

但在X汽车看来,不管是安德森公司还是布什公司,其资金和技术都不足以单独完成开发。因此还需要至少一家企业加入开发中来。而这个补充企业的候选就是库克公司和戴尔公司。这两家企业都拥有一定的资金和技术实力,完全能够弥补安德森公司和布什公司的不足之处。

安德森公司表示将在这项技术的开发上投入20亿日元的经费,布什公司则表示将投资30亿日元。X汽车向库克公司和戴尔公司咨询后得知,这两家企业都准备了15亿日元的开发资金。从技术难度和这四家企业的综合实力来看,他们的投资额都不会再发生太大的变化。

安德森方式和布什方式在技术上难分伯仲,而且完成开发所需的资金规模基本相同。产品化后所需的制造成本也不相上下。因此,X汽车希望库克公司和戴尔公司进行一场“投票”,最终选择合计投资额最多的一方。

库克公司和戴尔公司需要在限定期限之内告诉X汽车自己究竟是支持安德森方式还是支持布什方式。至于库克公司和戴尔公司是各自做出决定还是事先商量之后再做出决定,X汽车不予追究。根据上述规则,可能出现如下的情况。

两家公司都支持安德森方式、X汽车采用安德森方式。

安德森方式合计50亿日元VS布什方式合计30亿日元。

两家公司都支持布什方式、X汽车采用布什方式。

安德森方式合计20亿日元VS布什方式合计60亿日元。

库克公司支持安德森方式、戴尔公司支持布什方式、X汽车采用布什方式。

安德森方式合计35亿日元VS布什方式合计45亿日元。

库克公司支持布什方式、戴尔公司支持安德森方式、X汽车采用布什方式。

安德森方式合计35亿日元VS布什方式合计45亿日元。

不管采用哪种方式,将来通过该技术获得的收益,都按照开发投资额,也就是各企业投入的开发资金所占的比例进行分配。

X汽车将上述信息全都传达给了库克公司和戴尔公司。

* * *

距离给X汽车答复的最终期限还有不到一个星期,但库克公司的董事长库克还是迟迟无法做出选择。安德森公司和布什公司都对库克发起了猛烈攻势,双方都明确表示“只要你选择我们公司,必将给你最大限度的回报”。

库克公司最重要的课题是要选择能够被X汽车采用的技术,同时也要尽可能使自己获得更多的收益。

最理想的情况是库克公司支持布什方式而戴尔公司支持安德森方式。在这种情况下,库克公司的投资额占三分之一(45亿日元中的15亿日元),能够获得最多的收益。反之,如果库克公司支持安德森方式而戴尔公司支持布什方式,那么库克公司将一无所得。

对X汽车提供的资料进行分析后可知,不管采用安德森公司还是布什公司的安全装置技术,该项目的总净现值固定为150亿日元。因此,在前者的情况下库克公司能够得到50亿日元(=150÷3)的收益,而后者的情况则为零。

库克公司和戴尔公司都支持相同方式的情况下,选择安德森方式和选择布什方式所能够获得的收益也是不同的。两家公司都支持安德森方式的话,库克公司的投资为50亿日元中的15亿日元。两家公司都支持布什方式的话,库克公司投资则为60亿日元中的15亿日元。也就是说,在前者的情况下,库克公司能够获得45亿日元的收益,后者的情况下则只能获得37.5亿日元的收益。很显然,如果两家公司都支持相同的方式,选择两家所占投资比重大的方式最为有利。

库克在思考这个问题的时候,尝试将所有的情况都整理出来,最后得出图表1-1。

图表1-1 库克整理的情况

通过这个图表可以看出,库克不仅考虑了自身的情况,还将戴尔公司的情况也考虑了进来。比如库克公司支持布什方式,而戴尔公司支持安德森方式的话,那么库克公司将获得最多的收益50亿日元,而戴尔公司则一无所获。因为库克公司和戴尔公司的投资额刚好相同,所以图标呈对称的形式。

令库克感到烦恼的是,最终的结果很有可能是情况4。从库克公司所能够获得的收益来看,这是排在第三位的选择。如果能够与戴尔公司共同合作,那么就应该以实现情况1为目标,共同支持安德森方式。但若采用这一策略,戴尔公司遵守约定的话当然皆大欢喜,万一戴尔公司临时改变了主意,那么就会出现最坏的情况(从情况1变成情况2)。当然,对于库克公司来说,背叛戴尔公司选择支持布什方式的诱惑(从情况1变成情况3)也令人非常难以拒绝。

最终,库克认为选择支持布什方式是最没有风险的明智决定。大概戴尔公司也是这样想的吧。当然,因为害怕遭到背叛而眼睁睁地看着7.5亿日元(=45-37.5)白白溜走,也实在是让人心有不甘。所以库克的脑海中有那么一瞬间也闪过了“对方背叛的概率有多少”的想法,但遭到背叛的话所要付出的代价实在是太大,还是应该尽可能避免这样的情况发生。

就在这个时候,库克办公桌上的电话响了起来。是戴尔公司的董事长戴尔打来的。戴尔开门见山地说道。

“库克先生,这次我们一起支持安德森方式吧。关键在于我们要通力合作。想必库克先生也很清楚,一起支持安德森方式对我们双方来说都有利。”

“但是,我怎么知道你肯定不会背叛我呢。在这种情况下我怎么能接受你的提议?”

“要这么说的话,我也一样。如果你不遵守约定的话我也会很被动。而且就算我们两人之间签订了协议,也不具备任何法律效力,我们只能相信彼此。”

“虽然我也很想信任你,但还是怕有‘万一’啊。”

“在这个行业,信用不是摆在第一位的吗。我们谁都不想被贴上‘背叛者’的标签吧。说不定以后还有合作的机会呢。”

“你说的没错,但眼下最重要的是这个项目。将来的事情谁知道呢。”

“看来我是说服不了你了。希望你能够再考虑考虑,如果你不想眼睁睁地看着几亿日元白白溜走,就给我打电话。好不容易有个大赚一笔的机会,错过了岂不是很可惜。”

放下电话后,库克陷入了深深的思考。

“戴尔先生的葫芦里究竟卖的是什么药。他说的是真心话吗,还是故意迷惑我?他应该也知道最坏的情况是什么。”

* * *

最终,库克公司和戴尔公司并没有选择合作。他们都无法相信“对方一定能够遵守约定”。所以,结果和库克当初预计的一样,库克公司和戴尔公司都支持布什方式,X汽车也选择了布什公司作为技术委托方。虽然库克用“尽管并不是最好的结果,但总算赚到了一些。少赚总比不赚强。”来安慰自己,但心中却总感觉有些难以释怀。

理论

二、占优策略

前文中提到的案例1,是以博弈论中最著名的模型“囚徒困境”为基础改编的。

虽然囚徒困境是博弈论中最古典的模型,但在现实的商务活动中十分常见。比如新技术的开发竞争、在媒体上的广告竞争、环境问题的成本负担、零售业的价格竞争等。在这些情况下,每个参与者都难以预先获得竞争对手的行动和信息,而且一旦自身不采取某种行动,竞争对手采取了这一行动的话,自己就会单方面受到损害。

那么,为了更深入地了解囚徒困境,让我们对案例1进行一下整理。

(一)参与者

“库克公司”与“戴尔公司”两个。这里用参与者1代表“库克公司”,参与者2代表“戴尔公司”。

(二)策略

两个参与者都可以采取“支持安德森方式”或者“支持布什方式”的策略。将所有可能采取的策略进行排列组合,会得出以下4种情况(括号内顺序为参与者1的策略,参与者2的策略)。

(支持安德森方式,支持安德森方式)

(支持安德森方式,支持布什方式)

(支持布什方式,支持安德森方式)

(支持布什方式,支持布什方式)

(三)收益

在上述4种情况下,库克公司和戴尔公司所能够获得的收益如下。

(支持安德森方式,支持安德森方式)

(+45,+45)

(支持安德森方式,支持布什方式)

(0,+50)

(支持布什方式,支持安德森方式)

(+50,0)

(支持布什方式,支持布什方式)

(+37.5,+37.5)

(四)收益矩阵

像上述内容这样,只是将博弈的策略和收益罗列出来,还是很难理解这个博弈的本质、也难以预测各参与者究竟会采取怎样的行动。在这个时候,我们就需要将各参与者的行动整理成图表。本节介绍的单阶段同时两人博弈(参与者同时采取行动的两人博弈)一般可以整理为如图表1-2这样的收益矩阵。在收益矩阵中,一般将参与者1的行动作为纵轴,参与者2的行动作为横轴。括号内的收益也按照参与者1,参与者2的顺序标记。

图表1-2 库克公司与戴尔公司的收益矩阵

接下来,让我们通过收益矩阵中的数字来对这个博弈进行一下分析。对于库克公司来说,“支持安德森方式”和“支持布什方式”哪一个更有利呢?我们先来看一看参与者1和参与者2分别能够获得多少收益。

(五)参与者1的收益:参与者2支持安德森方式的情况

首先比较参与者2选择“支持安德森方式”的情况下,参与者1的收益(括号内第一个数字)。如果库克公司也表明“支持安德森方式”,那么X汽车就会采用安德森方式,这样库克和戴尔公司都能参与到这个项目中来。在这种情况下,库克公司的收益是45亿日元。

但如果库克公司支持布什方式,X汽车采用布什方式,那么戴尔公司就被排除到项目外。在这种情况下,库克公司能够得到50亿日元的最大收益。

(六)参与者1的收益:参与者2支持布什方式的情况

假设戴尔公司同样选择支持布什方式。那么我们就需要比较收益矩阵中“支持布什方式”的纵列。如果库克公司支持安德森方式,那么X汽车就会采用合计投资额较高的布什方式。结果是戴尔公司参与到项目中去,库克公司被排除到项目外。在这种情况下,库克公司的收益为零。

另一方面,如果库克公司支持布什方式,X汽车也采用布什方式的话,库克公司和戴尔公司都能够参与到项目中来。在这种情况下,两家公司都能获得37.5亿日元的收益。

综上所述,不管参与者2支持安德森方式还是支持布什方式,参与者1都应该支持布什方式,这样能够保证获得更多的收益。

(七)参与者2的收益

戴尔公司在考虑自身收益的时候,可以参照收益矩阵,比较括号内第二个数字(戴尔公司的收益)。经过分析可以发现,不管库克公司如何选择,戴尔公司都应该支持布什方式,这样能够保证获得更多的收益。

类似这种不管博弈的其他参与者采用何种策略,自己只要采取特定策略就能够获得较高收益的情况下,这种策略就被称为“占优策略”。

在本节的这个案例中,库克公司和戴尔公司都拥有占优策略。那就是不管对方采取何种策略,自己都选择“支持布什方式”。这样一来,双方都采用“支持布什方式”的策略,就是这个博弈的解。最终,两家企业分别获得37.5亿日元的收益。

(八)囚徒困境

本节的案例是以博弈论中最著名的“囚徒困境”模型为基础制作的。在原版的囚徒困境中,两名共同犯案的强盗是参与者。这两个人分别被捕并且被关押在不同的房间中接受审问。

警方并没有两人共同犯案的证据,如果两名强盗都不承认共同犯案的罪行,那么就只能按照他们当前所犯的罪行各自判处1年有期徒刑。但如果其中一方坦白,而另一人抵赖的话,那么坦白的人就会被无罪释放,抵赖的人则被判处20年有期徒刑。如果两个人都坦白的话,那么他们都会被处以10年有期徒刑。

将上述情况整理成收益矩阵如图表1-3所示。括号内的数字之所以用了负数,是因为对犯罪者来说,刑期越短收益越高(年数增加收益就是负数)。

图表1-3 囚徒困境

在这个原版的“囚徒困境”之中,两名强盗都选择“坦白”这一占优策略,结果就是两人都被判处10年有期徒刑。

三、使占优策略失效的方法

存在占优策略的情况下,博弈的解只有一个。也就是说,在本节这个案例之中,两家公司都会选择“支持布什方式”的策略,没有其他的可能性。但正如我们在收益矩阵中看到的那样,对于参与者来说这个解并不是最优解。如果两家公司都选择“支持安德森方式”,那么两家公司都能多获得7.5亿日元的收益。

在类似这样的案例中,两个参与者都想获得更多收益并不容易。因为双方都对事前协议持不信任的态度。比如在案例1中戴尔公司就提出“一起支持安德森方式”的建议,但库克公司并没有接受。就算两家公司事前达成了协议,也很难一直互相信任直到最后。

如果两家公司事前达成了“一起支持安德森方式”的合作协议,但其中一方背叛选择了“支持布什方式”,那么遵守协议选择“支持安德森方式”的一方就一点收益也得不到,而背叛的一方则将赚取巨额收益。在像这样只进行一次同时博弈的情况下,只要有占优策略存在,参与者就很难做出其他的选择。

类似于囚徒困境的情况在现实的商业活动中也十分常见。特别是在双方只进行一次博弈(交易)的情况下,背叛对方让自己获取更多收益的诱惑非常大,当然任何人都能想到这一点。因为双方都害怕遭到背叛,所以即便明知道获得的收益较少,也只能选择占优策略。

在面对“囚徒困境”的时候,双方要想获取更多的收益,可以采取以下的方法。

(一)对背叛者施加惩罚

通过对背叛者施加惩罚,可以降低损人利己带来的诱惑。在本节的案例中,双方可以签订一份合作协议,规定如果任何一方违反合作协议,选择“支持布什方式”,那么就要向受损害的一方支付巨额的赔偿。在不考虑这份协议是否具备法律效力的情况下,这样做可以改变这次博弈的收益,使占优策略失去效果。

假设背叛的一方要支付给受损害的一方15亿日元赔偿金,那么这次博弈的收益矩阵就会变成图表1-4那样。如果双方全都选择了背叛,都支持布什方式,那么双方相互赔偿15亿日元就自动抵消了,最终的结果和之前的收益(+37.5,+37.5)相同。

图表1-4 有惩罚情况下的收益矩阵

在图表1-4所示的博弈中就不存在占优策略了。假设我们站在库克公司的立场上。如果我们背叛对方选择“支持布什方式”,那么最终获得的收益(35亿日元)比“支持安德森方式”获得的收益(45亿日元)更低。

因此,不管是库克公司还是戴尔公司,都从囚徒困境中摆脱了出来,可以选择对双方都更加有利的“支持安德森方式”。这种签订合作协议后的博弈,实际上与我在下一节中即将为大家介绍的“夫妻博弈”十分相似。这种解决方法通过“改变现有博弈”使结果更符合双方的期望。

(二)增加博弈(交易)次数

另一种解决方法就是增加库克公司和戴尔公司之间的交易次数。如果两家企业今后还有继续合作的可能性,那么为了追求眼前的收益而背叛对方,可能会对今后的合作造成影响。

遭到背叛的一方在今后的合作之中肯定会采取相应的报复行动。考虑到这一点的话,“追求眼前的收益而背叛对方”就不是最好的选择。

也就是说,通过将博弈从“单阶段”变成“重复”,可能会得出不同的解决方法。关于这部分内容我将在第2章中为大家做详细的说明。

比如日本的汽车生产企业和零件供应商之间的连续交易。即便一家从未合作过的供应商给出的价格很低,汽车生产企业也更愿意选择自己比较熟悉的供应商。

尽管类似于这样的交易习惯经常被美国当作表现日本市场封闭性的反面教材加以批判,但换一个角度来看的话,这也是对双方来说风险都比较小的商业选择。对于汽车生产企业来说,避免了遭到零件供应商背叛使汽车出现故障的风险,对零件供应商来说,避免了遭到汽车生产企业背叛强行压低采购价格的风险。也就是说,通过增加参与者进行博弈(交易)的次数,降低出现双方不愿看到的结果的风险。