第2节:纳什均衡与夫妻博弈

要点

纳什均衡指的是所有参与者“在考虑到其他参与者采取策略的前提下选择自己最合适的策略”的状态。这种均衡并非只有一个,往往存在多个。在满足纳什均衡的状态下,任何参与者打破均衡采取其他的策略都会使自身收益受到损害,因此这种稳定的状态会一直持续下去。

案例

一、案例2:选择两家银行合并后的系统

某年春,樱花盛开的时节,位于东京CBD一角的A银行总部中,系统科长吉田接到了一项特殊的命令。这项命令要求他针对即将到来的与B银行的合并,提出信息系统的整合方案。

日本金融界在金融大爆炸的影响下进入开放竞争时代。日本的金融机构迟迟未能解决泡沫经济时期的不良债权问题,外资金融机构趁此机会收购走投无路的日本金融机构,或者与迫切需求全新金融领域技术和经验的日本金融机构展开合作,从而在日本市场站稳了脚跟。

A银行和B银行都是在泡沫经济时期称霸资本市场的大型银行,但如今收益率大幅下滑,资金量也无法与那些通过不断合并而发展壮大的欧美大金融集团相抗衡,如果继续这样下去最终必将一败涂地。

为了解决上述危机,A银行和B银行决定合并,并且都在暗中对存在的课题和问题点展开了讨论,A银行的经营层要求吉田秘密分析合并后的系统整合能够对成本削减起到哪些作用。

* * *

近10年来,金融业已经转变为一个庞大的信息产业。在线服务与内部管理等系统网络已经成为当今金融机构业务中的核心。金融信息系统所涉及的内容非常广泛,从顾客的存款和借贷信息到顾客间的资金流动,以及顾客的资产和运用情况应有尽有。此外,金融信息系统还对包括海外分行在内的各部门的利息、汇率以及信用等各种风险情况都进行实时的分析和管理。各银行都在金融信息系统上投入了大量的资金。也就是说,在两家银行合并后,选择哪种信息系统将对今后的系统成本造成巨大的影响。

吉田在接到命令后,首先想到的是曾经因为工作关系结识的B银行系统科长野村。

“大概野村科长也从上司那里接到了同样的命令吧。虽然今后有可能要和他一起共事,但现在还不能挑明合并的事情。不过,在宣布合并的时候,应该也会同时宣布继续采用哪家银行的系统吧。”

吉田经过调查发现,现在A银行使用的是外资企业D公司的金融信息系统,而B银行使用的则是国内信息处理公司E公司的金融信息系统。

如果两家银行都采用A银行使用的D公司的系统,那么A银行的收益能够增加2亿日元。在这种情况下B银行为了保证系统的统一性,需要将系统换成和A银行一样的D公司的系统,收益只能增加1亿日元。反之,如果两家银行都采用B银行使用的E公司的系统,那么A银行的收益增加1亿日元,B银行增加2亿日元。

最糟糕的情况是两家银行继续沿用各自的系统。在这种情况下两家银行实现了合并,但系统迟迟无法统一,无法通过合作使业务得到改善,反而都会出现1亿日元的损失。

只要系统能够统一,那么 两家银行能够合计取得3亿日元的收益。但从公司高层的角度来看,不管最后结果怎样,都希望自身能够取得最高的收益。况且两家银行最终可能并不能真正实现合并,只是停留在合作的层面上。

吉田开始努力寻找让两家银行都统一采用D公司信息系统的方法。最坏的情况就是野村科长坚持采用E公司的信息系统,结果两家银行无法实现系统的统一。吉田一边回忆对野村科长的印象,一边思考自己应该采取什么样的策略。

* * *

就在吉田制定信息系统统一计划的时候,C银行的行长来到A银行总部的行长办公室,秘密提出也想参与到A银行与B银行的合作中来,而吉田对此一无所知。

理论

在上一节中我为大家介绍过,如果各参与者存在“占优策略”,那么博弈的解就只有一个。占优策略是博弈论中非常强大的概念,参与者很难选择占优策略之外的其他策略。

比如案例1中的库克公司和戴尔公司,他们都很清楚一起选择支持安德森方式对双方来说是最有利的,而且戴尔公司也对库克公司提出了共同支持安德森方式的建议。即便如此,双方还是难以摆脱对遭到背叛的恐惧,最终选择了对双方来说都不是最佳结果的支持布什方式。

二、纳什均衡

在现实的博弈之中,不一定总是存在满足占优策略条件的策略,本节中的案例2就是这种情况。

虽然不存在占优策略,但对双方参与者来说都能够接受的均衡选择却很多。这种均衡被称为“纳什均衡”。

纳什均衡是博弈论中最重要的概念之一。这是由诺贝尔奖得主约翰·纳什提出的概念。在本节之中,我将主要为大家介绍什么是纳什均衡,并且以商业活动现场的案例为基础给大家说明纳什均衡选择的策略特征。

首先,让我们利用案例2中出现的参与者、策略以及收益来制作一个简单的收益矩阵(图表1-5)。

(一)参与者

参与者有“A银行”和“B银行”两个。这里用参与者1代表“A银行”,参与者2代表“B银行”。

(二)策略

两个参与者都可能选择D公司的系统或者E公司的系统。排列组合后得出以下4种结果。

(D公司,D公司)

(D公司,E公司)

(E公司,D公司)

(E公司,E公司)

(三)收益(单位为亿日元)

(D公司,D公司)

(+2,+1)

(D公司,E公司)

(-1,-1)

(E公司,D公司)

(-1,-1)

(E公司,E公司)

(+1,+2)

让我们通过收益矩阵中的数字来对这次博弈进行以下分析。

A银行应该怎样选择才能提高自身的收益呢?首先假设B银行选择D公司(选择D公司的纵列),那么A银行选择D公司的话自身的收益较高(+2)。但如果B银行选择E公司的话(选择E公司的纵列),A银行就应该选择收益更高(+1)的E公司。

在这种情况下,对方的选择会对A银行的策略造成影响。也就是说,从A银行的角度来看,不存在不管对方如何选择都对自身有利的占优策略。

图表1-5 案例2的收益矩阵

同样的情况也适用于B银行。不管A银行选择D公司还是E公司,B银行都要保持和A银行相同的选择才能获取较高的收益。对于B银行来说同样不存在占优策略。

在这种情况下,参与者应该如何选择策略呢?纳什均衡将告诉我们答案。

三、存在多个纳什均衡

用一句话来概括纳什均衡,就是“所有参与者都在‘以其他参与者的策略为前提的情况下,选择自己最合适的策略’的状态”。也就是说,一旦参与者们选择了满足纳什均衡的策略(以下简称为纳什均衡策略),那么不管博弈中的任何参与者选择其他任何策略,都不能使自身的收益增加。

在这种情况下,所有参与者都只能维持现状,从而实现一种“均衡”。与其他的策略组合相比,参与者实际选择纳什均衡策略的可能性更高,而且纳什均衡策略比占优策略出现的频率更高,所以是博弈的参与者都会优先考虑的策略。不过,在一次博弈中并非只有一种纳什均衡策略。一次博弈中存在多种纳什均衡策略的情况也很常见。

比如案例2的情况。假设实现了(D公司,D公司)的策略组合,而A银行却故意采取了选择E公司的策略,那么A银行的收益就会从+2变成-1。对于B银行来说也一样,如果只有B银行选择E公司,那么其收益就会从+1变成-1。在纳什均衡策略中,如果只有自己改变策略并不能使收益得到提高。

但这个博弈中的纳什均衡策略并不是唯一的。假设实现了(E公司,E公司)的策略组合,A银行或B银行单方面改变自己的策略也不会使收益得到提高。

在这里需要注意的问题是,占优策略也满足纳什均衡策略的条件。比如上一节中的案例1,占优策略(支持布什方式,支持布什方式)也满足纳什均衡策略的条件。如果其中一名参与者单方面选择支持安德森方式,并不会使自身的收益得到提高。

四、夫妻博弈与发现纳什均衡策略的方法

本节中案例的原型是被称为“夫妻博弈”的著名博弈模型。在原版的夫妻博弈之中,夫妻二人需要决定是去看拳击比赛还是去看歌剧。

对丈夫来说,看拳击(+2)比看歌剧(+1)的收益更大,而对妻子来说看歌剧(+2)比看拳击(+1)的收益更大。但是,两人都不想自己一个人去(-1)。在这种情况下,(拳击,拳击)(歌剧,歌剧)这两种策略组合都满足纳什均衡的条件(图表1-6)。

有一个简单的方法可以帮助我们通过收益矩阵来发现纳什均衡策略。

图表1-6 夫妻博弈的收益模型

首先沿纵列比较参与者1的收益,在最高的数值下划线(如果最高值有多个,则在所有最高值下面都划线)。其次沿横轴比较参与者2的收益,同样在最高值下划线。以图表1-5为例,划线后的结果如图表1-7所示。

如果在一个括号内有两个下划线,那么这个策略组合就是纳什均衡策略(图内灰色的部分)。即便有三个以上备选项的情况下,也同样可以使用这个方法来发现纳什均衡策略。

假设在参与者不变的情况下,可选的策略又增加了一个F公司。那么各策略组合的收益矩阵如图表1-8所示。

通过这个收益矩阵可以看出,两个参与者都有下划线的策略组合分别是(D公司,D公司)(E公司,E公司)(F公司,F公司)。因此在这种情况下,存在三种纳什均衡策略。

图表1-7 发现纳什均衡策略的方法①

图表1-8 发现纳什均衡策略的方法①

五、搞清楚实现纳什均衡的机制是今后的重要课题

虽然纳什均衡是博弈论中非常重要的概念,但并不意味着纳什均衡就是完美无缺的。

其中最重要的课题就是人们尚不清楚实现纳什均衡的机制。比如本节的案例2,A银行和B银行如果必须在事先没有任何交流,而且在不知道对方所选策略的情况下同时做出选择的话(同时博弈),要怎样才能实现纳什均衡策略呢?

纳什均衡策略一旦实现,任何参与者都不能再选择其他策略,这一点是毋庸置疑的,但实现纳什均衡策略的机制又是什么呢?在案例2中,如果A银行无法准确预测B银行的策略,就无法选择满足纳什均衡的策略。对于B银行来说也一样。如果想预测对方的策略,就必须掌握诸如“B银行的态度一向很强硬,所以肯定会选择对自身有利的E公司”“A银行和D公司之间的关系非常密切,所以他们肯定会选择D公司”之类的其他信息。在没有掌握这些信息的情况下,两家银行很有可能选择纳什均衡之外的策略,也就是出现两家银行各自选择不同系统的情况。这也是导致纳什均衡遭到批判的主要原因。

从这个意义上来说,同样作为对各参与者的行动进行分析的概念,纳什均衡策略与占优策略相比存在着不确定性。而这种不确定性在一次博弈存在多个纳什均衡策略或者存在多个参与者的情况下又会有所提高。

比如像图表1-8那样,包括(F公司,F公司)的策略在内共有三个纳什均衡策略存在,参与者很难决定应该从这么多均衡中选择哪一个。另外在有两个以上参与者的情况下,想预测各参与者都会选择哪个均衡策略也非常困难。接下来让我们以有三名参与者的三人博弈为例进行一下思考。

六、三人之间的“夫妻博弈”

如果参与者从两个变成三个会发生怎样的变化呢?让我们在案例2中加入第三名参与者(参与者3)C银行再进行一下思考。三家银行的系统统一博弈状况如下。

(一)参与者

参与者有“A银行”“B银行”“C银行”三个。参与者1代表“A银行”、参与者2代表“B银行”、参与者3代表“C银行”。

(二)策略

与最开始的情况相同,各参与者从D公司和E公司之中二选一。排列组合后得出以下8种结果。

(D公司,D公司,D公司)

(D公司,D公司,E公司)

(D公司,E公司,D公司)

(D公司,E公司,E公司)

(E公司,D公司,D公司)

(E公司,D公司,E公司)

(E公司,E公司,D公司)

(E公司,E公司,E公司)

(三)收益

(D公司,D公司,D公司)

(+2,+1,+1)

(E公司,E公司,E公司)

(+1,+2,+1)

其他情况下全为(-1,-1,-1)

先说结论,即便参与者变成三个,同时博弈的基本概念仍然有效。与两人博弈之间的区别在于,随着参与者的增加,博弈模型变得更加复杂,分析起来更加困难。

而且在参与者不以合作为前提的博弈中,参与者数量越多,“纳什均衡”的不确定性就越大。

(四)三人博弈中建立收益矩阵的方法

当参与者变成三个之后,一个收益矩阵就无法表示全部参与者的策略了。于是只能通过多个矩阵来对三家银行的策略进行整理,如图表1-9所示。收益矩阵中括号内的数字顺序依次代表A银行、B银行、C银行的收益。

存在三个参与者的情况下,需要制作两个收益矩阵对更加复杂的收益状况进行整理。具体来说,就是用一个矩阵表示C银行选择D公司时各参与者的收益情况,用另一个矩阵表示C银行选择E公司时各参与者的收益情况。

图表1-9 三人博弈的收益矩阵

比如A银行、B银行、C银行选择(D公司,E公司,D公司)时的收益情况,相当于上方收益矩阵中右上角的部分,选择(E公司,E公司,E公司)时的收益情况则相当于下方收益矩阵中右下角的部分。

只有在三家银行全都选择D公司(或者全都选择E公司)的情况下,收益矩阵括号内的数字全部为正,除此以外(三家银行没有选择相同系统)的情况,全部为负。

(五)在三人博弈中实现纳什均衡策略的方法

在这个收益矩阵中,可以根据和二人博弈相同的方法来发现纳什均衡策略。

首先在两个收益矩阵中比较参与者1和参与者2的收益。也就是首先沿着纵列对参与者1的收益进行比较,在数值高的下方划线,然后沿着横轴对参与者2的收益进行比较,在数值高的下方划线。收益相同的时候在所有相同的数值下划线。

然后比较参与者3的收益,在上下两个矩阵的相同格子(比如D公司,D公司的格子)中代表参与者3收益的数值(括号内最后一个数字)较大的下方划线。

比如对(D公司,D公司)的格子进行比较,参与者3的收益分别是+1和-1,那么就在数值较大的+1下方划线(图中用虚线表示)。其他格子中也用同样的方法划线。

在所有格子中,存在三条下划线的策略就是这个博弈的纳什均衡策略。对于这个案例来说,三家银行选择同一家公司的情况(D公司,D公司,D公司)以及(E公司,E公司,E公司)就是纳什均衡策略。

正如收益矩阵所显示的那样,一旦三家银行选择同一家公司,那么任何一家银行做出不同的选择都会使自身的收益受到损害。也就是说(D公司,D公司,D公司)以及(E公司,E公司,E公司)的策略组合,满足“所有参与者在只有自己选择其他策略的情况下都会使自身的收益受到损害”这一纳什均衡成立的条件。

在这个三人博弈的案例中,纳什均衡中的最大问题——实现机制尚不明确表现得更加明显。在需要对其他参与者可能采取的策略进行预测的情况下,A银行的负责人不但要预测B银行的行动,还要预测C银行的行动。而且如果无法获得其他参与者相关信息的话,做出纳什均衡策略之外选择的可能性就变得更高了。

七、事实标准也是纳什均衡的一种

参与者采取同样的行动能够获得较多的收益,如果只有一人采取不同的行动则收益降低,这种情况在商业活动的现场可以说屡见不鲜。比如betamax和VHS之间的录像格式之争,手机之间的摩托罗拉和NTT之争,电脑之间的IBM和MAC之争,HDTV的格式之争等。

事实标准实际上也是一种纳什均衡状况。特别是在没有法律规定的情况下,某种格式成为市场标准——比如电脑系统中的Windows——使用其他格式的消费者就很难增加自身的收益。事实上,IOS系统的软件价格一般都比Windows系统的软件价格更高。因此消费者只能屈从于事实标准。

专栏:日常生活中的纳什均衡

在我们的日常生活中,也时常能够发现纳什均衡的存在。

比如在车站搭乘自动扶梯的时候。为了给赶时间的人让开一条快速的通道,搭乘自动扶梯的人都会自觉站在同一侧。如果每个人都按照自己的喜好随意站的话,那么赶时间的人就没办法快速通过。如果在其他人都站在同一侧的情况下,只有自己一个人站在另一侧,会让人感觉很不好意思,最终自己也会和其他人站到同一侧去。这就是纳什均衡。

至于在自动扶梯上究竟应该站在哪一侧,不同的国家和地区都有不同的习惯。东京地区乘客在左侧站立,行人在右侧通行,而大阪地区则是行人在左侧通行。英国也是左侧通行、右侧站立。从全世界范围来看,似乎采用英国方式的国家居多。

为什么只有东京地区的习惯不同呢?原因至今尚未解明。但不管怎样,一旦这种均衡的状态实现,那么就没有人愿意打破这种均衡。

顺带一提,最先进的演化博弈论(第2部第4章)正在尝试解明实现这种稳定状态的过程。