1.1 博弈论与信息经济学概述

博弈论研究的是给定信息结构下的均衡是什么,而信息经济学研究的是给定信息结构下什么是最优的合约安排。

信息经济学主要研究非对称信息环境中的最优合约,故又称为合约(契约、合同)理论或机制设计理论。

信息经济学与博弈论之间的关系是,前者是后者在信息不对称环境下的应用,但从特点上看,博弈论更注重于方法论,而信息经济学注重于问题的解析。博弈论从某种意义上看是“实证的”,而信息经济学是“规范的”。

在进一步叙述之前,让我们先了解什么是博弈以及博弈论的研究范畴,继而介绍博弈论与主流经济学之间的关系,然后简要介绍“问题导向学习”(Problem-Based Learning,PBL),的发展历史、基本特征和原理,最后介绍几个常见的博弈模型以体现博弈论在日常生活、学习中的应用。

1.1.1 博弈及博弈论

“博弈论”译自英文“Game Theory”。“Game”的基本意义是游戏,因此“Game Theory”直译应该是“游戏理论”。

说起游戏,人们一般想到的是小朋友玩的躲猫猫、比大小、围棋等棋类比赛,桥牌、拱猪等扑克游戏,以及田径、球类等各种体育比赛。博弈论来源于这些真正的游戏,但又高于这些游戏。那么,博弈论与这些游戏的本质区别在哪里呢?

其实如果我们认真观察、思考一下就能发现,很多游戏都有如下共同的特点:

(1)都有一定的规则,规定游戏的参加者(可以是个人,也可以是队组)可以做什么,不可以做什么,应该按怎样的次序做,什么时候结束游戏和一旦参加者犯规将受怎样的处罚等。

(2)都有一个结果,如一方赢一方输、平局或参加者各有所得等,而且结果常能用正或负的数来表示,或能按照一定的规则折算成数值。

(3)策略至关重要,游戏者不同的策略选择常会带来不同的游戏结果。

(4)策略和利益有相互依存性,即每一个游戏者所得结果的好坏,不仅取决于自身的策略选择,也取决于其他参加者的策略选择。有时一个差的策略选择也许会带来并不差的结果,原因是其他游戏者选择了更差的策略。因此在有策略依存性的游戏中,策略本身常常没有绝对的好坏之分,只有相对于其他策略的相对好坏。

上述几点正是许多游戏共有的本质特征。同时,人们发现许多经济、政治、军事活动中的决策问题也与游戏有着基本相似的特征。为了扩大游戏理论的应用研究,一般把“Game”译成“博弈”,而将“Game Theory”译成“博弈论”或“对策论”。

定义1.1 博弈是指决策主体(可能是个人,也可能是团体,如企业、国家、国际组织等)在相互对抗中,对抗双方(或多方)相互依存的一系列策略和行动的过程集合。

在定义1.1中,有几点需要注意。

第一,博弈中的参与人各自追求的利益具有冲突性。如果决策主体之间的利益是一致的,就不是博弈。从学术观点来看,即使一个博弈包含无穷多个参与人,如果他们利益一致,也可以理解为一个人。由于一个人是不会和自己博弈的,因此从某种意义上看,博弈论是一门专门研究冲突的学科,它为人们理解冲突和合作提供了一种重要的思想方法。

第二,博弈是一个过程。博弈不是一个孤立的事件,而是人们在对抗过程中有关的所有方面的集合。它包含参与人集合、策略的集合、行动的集合、信息的集合等。把博弈看做一个集合是思维从具体到抽象的重要一步。

第三,博弈的一个本质特征就是策略的相互依存性。如果参与人之间的策略不存在依存性,那么与一个人自娱自乐的游戏并无区别,当然也就不能称其为博弈。不过在一种特殊的情形下,有一种博弈“不存在”策略的相互依存性,这种博弈就是包含严格占优策略的博弈,在以后的章节中我们会介绍到。

定义1.2 博弈论就是系统研究博弈如何出现均衡的规律的学科。

1.1.2 博弈的分类

可以根据各种不同的标准对博弈进行分类。

信息经济学与博弈论都研究所讨论的问题的信息结构对问题结果的影响。在非合作博弈理论中,通常将信息结构分为四类,对应的博弈模型也就分为四种,如表1.1所示。

表1.1 非合作博弈的分类及对应的均衡概念

首先,根据参与人在博弈中的行为是否达成一个具有约束力的协议,可将博弈划分为合作博弈和非合作博弈。如果达成一个具有约束力的协议,就是合作博弈;反之,则是非合作博弈。

其次,根据博弈的时间或参与人的行动顺序,可将博弈分为静态博弈和动态博弈。静态博弈指的是博弈中参与人同时选择行动,或虽非同时但后行动者并不知道前行动者采取了什么具体行动;动态博弈指的是参与人的行动有先后顺序,且后行动者能够观察到先行动者的行动。

再次,根据参与人所拥有的有关博弈的信息知识,可将博弈划分为完全信息博弈和不完全信息博弈。完全信息博弈指的是博弈中每一个参与人对其他参与人的特征、策略空间及支付函数有准确的认识;否则,就是不完全信息博弈。

最后,根据博弈的收益分配情况,可以将博弈划分为零和博弈与非零和博弈。零和博弈是指参与博弈的各方在严格竞争下,一方的收益必然意味着另一方的损失。博弈各方的收益和损失相加总和永远为“零”;否则,就是非零和博弈。

在现实经济管理问题中,绝大多数博弈是非合作、不完全信息、动态的、非零和博弈。因此,研究非合作博弈、不完全信息博弈及动态博弈更具有实际意义。

1.1.3 博弈论与主流经济学的新发展

经济学是研究什么的呢?传统教科书上讲,经济学是研究稀缺资源的有效配置。不过,从现代的观点看,更为恰当地说,经济学是研究人的行为(human behaviour)。当然,研究人的行为的学科很多,不止经济学。那么,经济学与其他学科有什么不同呢?这个不同之处就在于经济学假定人是理性的。理性人是什么意思呢?理性人是指有一个定义得很好的偏好,在面临给定的约束条件下最大化自己的偏好。正是理性人的假设使得经济学家得以运用数学工具描述人的行为。注意,理性人与自私人不同。理性人可能是利己主义者,也可能是利他主义者。

无论是利己还是利他,理性人在最大化偏好时,需要相互合作(cooperation),而合作中又存在着冲突(conflics)。为了实现合作的潜在利益和有效地解决合作中的冲突,理性人发明了各种各样的制度规范他们的行为。价格制度(或称市场制度)是人类为达到合作和解决冲突所发明的最重要的制度之一。

传统的新古典经济学(neo–classic economics)就是以价格制度为研究对象的,故又称为价格理论。新古典经济学的两个基本假定是:(l)市场参与者的数量足够多,从而市场是竞争性的;(2)参与人之间不存在信息不对称问题。但这两个假设在现实中一般是不满足的。首先,在现实中,买卖双方的人数常常是非常有限的,在有限人数下,市场不可能是完全竞争的。在不完全竞争市场中,人们之间的行为是直接相互影响的,所以一个人在决策时必须考虑对方的反应,这就是博弈论要研究的问题。其次,现实中市场参与者之间的信息一般是不对称的,例如说,卖者对产品质量的了解通常比买者多。当参与人之间存在信息不对称时,任何一种有效的制度安排必须满足“激励相容”(incentive compatible)或“自选择”(self–selection)条件,这是信息经济学研究的问题。不完全信息使得价格制度常常不是实现合作和解决冲突的最有效安排,诸如学校、企业、家庭、政府等这样一些非价格制度,也许更为有效。而非价格制度的最显著特征是参与人之间行为的相互作用。因此,毫不奇怪,当20世纪70年代经济学家开始将注意力由价格制度转向非价格制度时,博弈论逐渐成为经济学的基石。

博弈论是研究决策主体的行为发生直接相互作用时候的决策以及这种决策的均衡问题,也就是说,当一个主体,例如说一个人或一个企业的选择受到其他人、其他企业选择的影响,而且反过来影响到其他人,其他企业选择时的决策问题和均衡问题。所以在这个意义上说,博弈论又称为“对策论”。这里我们可以把博弈论与我们在一般传统微观经济学上学的东西作一比较。传统微观经济学谈到个人的决策,就是在给定一个价格参数和收入的条件下,最大化他的效用;个人效用函数只依赖于他自己的选择,而不依赖于其他人的选择;个人的最优选择只是价格和收入的函数,而不是其他人选择的函数。这里,经济作为一个整体,人与人之间的选择是相互作用的,但是对单个人来讲,所有其他人的行为都被总结在一个参数里,这个参数就是价格。这样,一个人作出决策时他面临的似乎是一个非人格化的东西,而不是面临着另外一个人或另外一个决策主体。他既不考虑自己的选择对别人选择的影响,也不考虑别人选择对自己选择的影响。与此相对照,在博弈论里,个人效用函数不仅依赖于他自己的选择,而且依赖于他人的选择;个人的最优选择是其他人选择的函数。从这个意义上讲,博弈论研究的是在存在相互外部经济条件下的个人选择问题。在传统微观经济学中,寡头市场是一个例外,而这一部分正是博弈论最主要的应用领域之一。

人们之间决策行为相互影响的例子很多,几乎所有我们在生活中遇到的事情都是这样的。例如,OPEC石油输出国组织成员国家选择石油产量;在寡头市场上,企业选择他们的价格和产量;又如家庭中的夫妻,他们之间的行为也是一种博弈;还有国家与国家之间的关系也存在这种情况;再例如我国的中央政府和地方政府之间也存在一种博弈。就是说,中央采取一种行动会影响地方的行动;反过来,地方的行动又会使中央采取相应的政策,所以博弈论的应用是非常广泛的。

博弈论可以划分为合作博弈(cooperative game)与非合作博弈(noncooperative game)。纳什、泽尔腾和海萨尼的贡献主要是在非合作博弈方面;而且现在经济学家谈到博弈论,一般指的是非合作博弈。合作博弈与非合作博弈之间的区别主要在于人们的行为相互作用时,当事人能否达成一个具有约束力的协议,也就是说,有没有一种binding agreement。如果有,就是合作博弈,反之,则是非合作博弈。例如我们刚才讲的两个寡头企业,如果它们之间达成一个协议,联合最大化垄断利润,并且各自按这个协议生产,就是合作博弈。它们面临的问题就是如何分享合作带来的剩余。但是如果这两个企业间的协议不具有约束力,也就是说,没有哪一方能够强制另一方遵守这个协议,每个企业都只选择自己的最优产量(或价格),则是非合作博弈。这就是两个概念的区别。同时应该指出的是,合作博弈强调的是团体理性,就是collective rationality,强调的是效率(efficiency)、公正(fairness)、公平(equality)。非合作博弈强调的是个人理性、个人最优决策,其结果可能是有效率的,也可能是无效率的。

严格地讲,博弈论并不是经济学的一个分支。它是一种方法,应用范围不仅包括经济学。其他如政治学、军事、外交、国际关系、公共选择,还有犯罪学,都涉及博弈论。实际上,好多人把博弈论看成是数学的一个分支。纳什在1951年关于博奕论的奠基性文章就是发表在数学杂志上,而不是经济学杂志上,在相当长一段时间里经济学家们并不把纳什当作一个经济学家。还有夏普利作于1953年的文章本身也是一篇数学手稿,而非经济学手稿。那么为什么把诺贝尔经济学奖授给这3个人,而不是把其他的什么奖授给他们呢?大致有以下3个方面的原因。

(1)博弈论在经济学中的应用最广泛、最成功;博弈论的许多成果是借助于经济学的例子来发展的,特别是在应用领域。

(2)经济学家对博弈论的贡献也越来越大,特别是在动态分析和不完全信息引入博弈论之后,例如克瑞普斯和威尔逊都是经济学家。

(3)最带根本性意义的原因是经济学和博弈论的研究模式是一样的,即强调个人理性,也就是在给定的约束条件下追求效用最大化。在这一点上,博弈论和经济学是完全一样的。

大体是因为这3个原因,博弈论逐渐被当成是经济学的一部分,诺贝尔经济学奖自然就授给了3位博弈论专家。

但是,博弈论真正成为主流经济学的一部分不过是近二三十年的事。大体来讲,在20世纪70年代中期之前,经济学家也有一部分用到博弈论,但所有这些经济学家应用到的博弈论知识大体在1953年之前就已经被创造出来了(当然也有一些例外)。只是到20世纪70年代中期以后经济学家开始转而强调个人理性,特别是强调对个人的最基础的效用函数的研究之后,他们才发现信息是一个非常重要的问题,信息问题成为经济学家关注的焦点。同时,在研究个人行为时,个人决策有一个时间顺序(sequence或time order),就是说当你作出某项决策时,必须对你之前(或之后)别人的决策有一个了解(或猜测),你的决策受你之前别人决策的影响,同时反过来影响你之后别人的行为,这样,时序问题在经济学中就变得非常重要。博弈论发展到这一阶段正好为这两方面的问题(一个是信息,一个是时序)提供了有力的研究工具,这些工具包括泽尔腾在1965年发表的关于动态博弈精炼均衡和海萨尼在1967—1968年发表的关于不完全信息的研究成果(这些成果在20世纪70年代中期之前经济学家们没有用过)。后来的包括克瑞普斯和威尔逊于1982年的研究成果,还有克瑞普斯、米格罗姆(Milgrom)、罗伯茨(Roberts)和威尔逊发表于1982年关于信誉(reputation)问题的非常有名的“四人帮模型”。

博弈论在经济学中的绝大多数应用模型都是在20世纪70年代中期之后发展起来的。大体从20世纪80年代开始,博弈论逐渐成为主流经济学的一部分,甚至可以说成为微观经济学的基础。博弈论的发展和经济学的发展可以说是你中有我,我中有你,不少当今赫赫有名的经济学家就发迹于其在博弈论方面的研究成果。

这里引用一下美国印第安纳大学的经济学家艾瑞克·拉斯马森(Eric Rasmusen)在《博弈与信息》(Games and Information,1989)一书中的一段话来概括博弈论在主流经济学中的地位变迁史。他说:

不久前,一个爱开玩笑的人或许会说,计量经济学和博弈论就如同日本和阿根廷。在20世纪40年代晚期,这两门学科都充满了生机,正如同这两个国家一样都充满了希望,做好准备开始迅速的经济增长,并对世界产生广泛的影响。我们都知道日本和阿根廷发生了什么。在这两门学科中,计量经济学变成了经济学不可分割的一部分,而博弈论则萎缩成为一个子科目,仅对博弈论专家来说充满乐趣而被整个经济学界所遗忘。这些博弈论专家一般都是数学家,他们只关心定义和证明,而不关心其应用;他们很为博弈论能在众多学科中的应用感到自豪,但是没有一门学科把博弈论当作自己不可分割的一部分。

但到20世纪70年代后,把博弈论比作阿根廷就不再合适了。在阿根廷把她的前专制君主Juan Peron迎回来的同时,经济学家们开始发现通过把博弈论应用于复杂的经济问题可能得到的东西。理论和应用方面的新发现对非对称信息和动态行为的分析尤其有用。在20世纪80年代,博弈论迅速成为主流经济学的重要组成部分。事实上,它几乎吞没了整个微观经济学,就如用计量经济学吞没了“经验经济学”(empirical economics)一样。

博弈论在西方经济学中的地位也可以从国外流行的教科书中看出来,这里举几个例子:

例一,哈尔·范里安(Hal Varian)的《微观经济分析》(Microeconomic Analysis)是一本在欧美非常流行的高级微观经济学教科书,几乎所有大学的研究生课程都用这本书。在1984年的第二版中,没有博弈论,甚至在书后的词汇表上都找不到“博弈论”这个词,但是在1992年的第三版就加上了“博弈论”一章,而且有关寡头竞争这一章也按博弈论的理论重写了。

例二,克瑞普斯在1990年出版的《微观经济理论教程》(A Course in Microeconomic Theory)是1991年最畅销的经济学教科书,被相当多的欧美名牌大学选为研究生课程的教材,其中的第三部分就是“非合作博弈”,共219页,占全书正文的28%以上,且书中的许多内容也涉及博弈论。当然这可能与他本人就是博弈论专家有关。1990年他因对博弈论的贡献而获美国克拉克奖(Clark Medal,全美对40岁以下经济学家的最高奖)。

例三,让·梯若尔泰勒尔(Jean Tirole,法国经济学家,2014年诺贝尔经济学奖获得者)在1988年出版了《产业组织理论》一书。该书是目前最受欢迎、最流行的有关产业组织的教科书,全书的内容都是建立在非合作博弈论的基础上的,以致作者不得不在最后加上一章“非合作博弈论”,供不熟悉非合作博弈论的读者参考。现在,博弈论已经基本上成为产业组织理论中占主导地位的研究方法。

博弈论进入主流经济学,反映了经济学发展的以下几个趋势。

第一,经济学研究的对象越来越转向个体,放弃了一些没有微观基础的假定,如消费函数及其投资函数、销售最大化等,一切从个人效用函数及其约束条件开始,解约束条件下的个人效用最大化问题而导出行为及均衡结果。这正是博弈论研究的范式:给出个人的支付函数及战略空间,然后看当每个人都选择其最优战略以最大化个人支付函数时将发生什么。这与经济学效用最大化的方式完全吻合。

第二,经济学越来越转向对人与人关系的研究,特别是对人与人之间行为的相互影响和作用、人们之间的利益冲突与一致、竞争与合作的研究。过去经济学研究个人行为时,总是假设其他人的行为都被总结在一个非人格化的参数——价格——里面,所以个人是在给定价格参数下进行决策,人们行为之间的相互作用是通过价格来间接完成的。但是现在不是这样了,经济学开始转向对人与人之间的直接关系进行研究,经济学越来越重视对人与人之间关系的研究,特别是经济学开始注意到理性人的个人理性行为可能导致的集体非理性。这一点和传统经济学形成明显对照。在传统经济学里,价格可以使个人理性和集体理性达到一致。现代经济学开始注意到个人理性和集体理性的矛盾与冲突,但是解决这个问题的办法并不是像传统经济学主张的那样通过政府干预来避免市场失败所导致的无效状态,而是认为,如果一种制度安排不能满足个人理性的话,就不可能实行下去。所以解决个人理性与集体理性之间冲突的办法不是否认个人理性,而是设计一种机制,在满足个人理性的前提下达到集体理性。认识到个人理性与集体理性的冲突对于认识制度安排是非常重要的。

第三,经济学越来越重视对信息的研究,特别是信息不对称对个人选择及制度安排的影响。如我们已经提到的,博弈论成为主流经济学的一部分,正是伴随着经济学对信息问题的重视而来的。从某种意义上讲,信息经济学是博弈论应用的一部分,或者说,信息经济学是非对称信息博弈论。