理性的概念
博弈论假定行为是理性的。但理性是什么意思?在日常谈话中,理性的行为可以表示任何东西,从合理的、考虑周全的、深思熟虑的行为到有智慧的、正义的、理智的行动等。我们一般不会认为一个人在狭窄的小巷里以每小时80英里的速度开车是理性的。然而,我们所说的理性的行为所表示的意思比它的通常意义更窄。简单地说,理性的行为表示选择最好的途径来达到一组预先定下的目的。这是对选择的前后一致性的评估,而不是对思想过程的评估,也不是对既定目标的实施的评估,更不是对这些目标的道德性的评估。
在效用理论中,理性的行为者拥有明确的目标和一组他们能够选择的行动。于是他们选择能最好地达到这些目标的行动(对于“最好”和“达到”的准确含义,我在这里先模糊处理)。理性的行为是以目标为导向的,行为者努力创造更令人向往的结果,而不是那些不那么令人向往的结果。
然而,我们怎么知道行为者的目标是什么?我们通常通过观察行为者的先前的行为或通过实验来推断出他们的目标。然后我们假定行为者会继续追求这些我们推断他们过去所追求的目标。我们固定住行为者的偏好,并允许所拥有的信息和所面对的情境发生变化,从而创造出他们在行动上的变化。
为了形式化地表示这些目标,我们首先介绍后果(consequences)或结果(outcomes)(在我对这两个词的使用中,它们是可以互换的)。一个后果就是行为者决策的一个可能的最终结果。它包括对于该决策者而言的所有有关效应。这一组的结果是相互独立、完全穷尽的。有一个并且只有一个结果会发生。对后果的定义是建模者的选择。你可以选择让它简单,也可以选择让它复杂。比如,一次总统选举的结果可以被简单描述为是共和党的候选人还是民主党的候选人获胜。选举的后果也可以是获胜的候选人一旦就任所实施的政策。我们还可以从一个行为者的观点出发,将获胜的票数差或某个特定的人是否投票视作选举结果的一个相关方面。
行为者拥有对一组结果的偏好。让我们用C来表示所有后果的集合,并用下标表示每个具体的后果。偏好是由两个后果之间的一种关系R给定的。CiRCj读作“后果i至少和后果j一样好”2。由于行为者弱偏好第一种结果胜过第二种结果,R被称为弱偏好关系(weak preference re-lation)。换句话说,第一种结果至少和第二种结果一样好,也许比第二种结果更好。当CiRCj和CjRCi都成立时,无差异(indifference)I发生,并且被记作CiICj。由于两个结果都至少和对方一样好,它们在行为者的眼中是同等令人向往的。强偏好关系(strong preference relation)P意思是第一种结果比第二种结果更好。换句话说,CiPCj等价于(CiRCj,且非CjRCi)。
我们假定每个行为者都对结果的集合拥有一组完全而且具有传递性的偏好。完全性(completeness)表示行为者对任意两个后果都能够作比较。
一个行为者可以说他偏好一种结果胜过另一种结果,也可以说这两者对他而言无差异。完全性意味着该偏好序(preference order)是自反性的(reflective),即对于所有的Ci,CiRCi成立。换句话说,所有的后果都至少和它们自身一样好。此外,偏好还是传递性的。
传递性的意思是:如果第一种结果Ci至少和第二种结果Cj一样好,而第二种结果至少和第三种结果Ck一样好,那么第一种结果Ci必定至少和第三种结果Ck一样好。
完全性和传递性是进行偏好排序的基本要素。每个行为者都能够把结果从最好到最坏进行排列,同时允许在结果之间存在无差异的情形。由于完全且传递性的偏好能够对结果作出排序,这样的偏好被称为序数偏好(ordinal preferences)。这两个假定对于理性而言是必要的。如果没有完全的偏好这样的假定,行为者就会出现无法对不可比较的结果作出选择的情况。但出现无法比较的偏好的情形是很少见的。比如,如果要让我们说出我们更偏好吃梨还是偏好看到肯尼迪参议员当选总统时,我们很多人都很难回答。3我们认为这样的结果是不可比较的。但同时这也不是一个真实合理的选择。通常我们排除具有不可比较后果的情形而对后果的集合作出限定,从而行为者对于整个集合都有完全的偏好。由于我们可以对结果集合作出选择以切合我们要建模的问题,我们能够定义结果以避免出现非完全的偏好。
传递性的偏好剔除出现强偏好循环的情形(如CiPCj且CjPCk且CkPCi)。强偏好循环使前后一致的选择根本无从谈起。在这个循环的三个结果中,行为者更偏好哪个结果呢?虽然该行为者在任意两个结果中总是更偏好一个结果,但我们还是无法说出他更偏好哪一个结果。在该循环的各个结果之间所作的选择取决于这些结果被呈现的顺序。如果我先比较Ci和Cj,然后将其结果和Ck作比较,我们就会发现Ck最受偏好。如果我们先比较Cj和Ck,然后将其结果和Ci作比较,我们就会发现Ci最受偏好,依此类推。难道我们能说这样的偏好是得到清楚定义的偏好吗?
违反传递性的偏好的经典例子是关于咖啡甜度的例子。在我的咖啡里放一颗糖至少和一颗糖也不放一样好,放两颗至少和一颗一样好,如此类推。每次放糖对我来说都是无差异的,因为我无法说出一颗糖能给我的咖啡的甜度带来什么不同。如果我对咖啡甜度的偏好具有传递性的话,那么我对我的咖啡里糖的数量应该是无所谓的。然而,一颗糖也没有(这是我最喜欢的数量)和每杯咖啡里放几磅糖,这两者对我来说并非无差异的。我喜欢每杯咖啡里大约放两茶匙的糖。如果糖比这个少时,我偏好加上一颗。如果糖比这个更多时,我会偏好哪怕一颗糖也不再多加。因此,我并非真的对于在我的咖啡里加上一颗糖无所谓。这个悖论之所以发生,是因为我在每次比较时都无法分辨哪个杯里的糖多了一颗。通过在行为者能分辨的结果中作选择,我们能够避免这种情形,从而剔除这种无差异悖论。
我们假定对结果的偏好是固定不变的。它们不会在我们对决策进行考察的过程中发生改变。有些人主张,偏好转变时有发生。我们不允许偏好发生转变,因为这样会让效用理论失去解释力。偏好是看不见的,我们是通过观察行动来推断出偏好。但是,偏好的转变无法被确认。当我们观察到行为和模型所说的不同时,我们总是很想说偏好已经改变。如果当行为改变时我们就宣称偏好转变了,那么该模型将无法被验证,因为我们可以通过宣称偏好已经发生改变而对任何证明模型不成立的事实置之不理。相反,我们假定偏好是不变的,并且行为的改变是由情境的变化和行为者所拥有的信息的变化所导致的。
对不变的偏好的假定限定了我们能够建模的情境。但这并没有像表面看来那么具有限制性,因为我们可以选择符合我们意图的结果。我们区分对于结果的偏好和对于行动(或策略)的偏好。结果是最终结局,而行动则是能产生几种结果中的一种结果的选择。对结果的偏好被假定为不变,而对行动的偏好则可能随着行为者获得关于不同行动的功效的新信息而发生改变。通过小心地选择结果,“偏好转变”被视为对于行动的偏好的转变而不是对结果的偏好的转变。例如,一次选举的结果可以用模型表示为哪位候选人当选,如在1988年总统大选中是布什还是杜卡基斯当选。这样,在选战过程中,在要投票给哪位候选人的问题上改变主意的投票者看起来似乎转变了他们对结果的偏好。然而,让我们把选举的结果表示为胜出的候选人将采纳的政策。这样,随着投票者了解每位候选人如果当选可能会采纳什么政策,他们可能会改变其对于候选人的偏好。对于候选人的偏好的转变现在被看作对于投票给布什还是投票给杜卡基斯这两个行动的偏好的转变。
序数偏好可以表示为一个降序的数字序列。最大的数字被指定为最受偏好的结果,第二大的数字被指定为偏好序中第二受偏好的结果,如此递减直到最不受偏好的结果。两个结果之间的无差异要求我们指定给这两个结果的数字是相等的。任何序列,只要指定给结果的数字所形成的次序反映偏好的排序,该序列就是对该排序的表示。我们称这些数字为效用(utilities),用u表示,并称在结果与表示个体对这些结果的偏好的数字之间形成映射的函数则为效用函数(utility function)。就序数偏好而言,越大的数字表示越好的结果,但指定给两个结果的数字之间的差则是没有意义的。比如,对应于偏好排序C2PC1PC3的效用函数既可以是u(C1)=1且u(C2)=2且u(C3)=0,也可以是u(C1)=1且u(C2)=104且u(C3)=-4,这两个函数都是可接受的。只有表示式中的数字的次序才反映偏好,因此我们称之为序数偏好。如果这些数字之间的区间是有意义的,那么我们就会有基数偏好序(cardinal preference order)。在后面我会说明,基数效用不仅表示对结果的序数偏好,还表示行为者为获取所偏好的结果而愿意承担的风险,并且这样的基数效用是可以被计算的。
对理性概念的几个误解
由于博弈论对理性的定义比直觉对理性的定义要狭窄,前者常常遭到误解。下文是一些常见的错误解读以及对其的正确回应。第一,我们并不假定决策过程是一系列字面上的计算。相反,人们作出的选择反映其基本目标和所处情境的约束,并且我们能够创造一个效用函数来表示他们在给定约束下的行动。效用函数并非试图解释个体的认知过程。它要在一个一般框架里抓住决策背后的重要考虑,而且这个一般框架能够用数学来操作,同时允许个体选择方面的变化。我们的目的不是要解释认知,而是要理解政治行为。在这里,我们运用关于选择的抽象模型来表示个体在政治情境下的选择。即使是用这样简单的认知模型,策略逻辑也是非常复杂的。理性选择模型试图抓住一个情境的关键方面并考察行为者的决策,把行为者的决策看作和情境的约束相联系的行为者的偏好的结果。为了做到这一点,我们运用理性选择模型来从实际认知的复杂性中抽象出来,实现简化。
第二,理性并不告诉我们任何关于行为者对结果的偏好,它只是告诉我们关于行为者在其偏好和所面对情境给定的情况下作选择的信息。这里的一个经典例子是阿道夫·希特勒。根据惯常的关于理性的想法,他是一个疯子。他追求令人发指的目标,并且冒了巨大的政治风险采取最终导致他自己和纳粹德国毁灭的行动。然而,从效用理论的视角来看,他的行为是可以用理性来解释的。他前后一致地追求德国的民族主义扩张,并且前后一致地回应了他所面对的环境和环境给他带来的机会。从很多方面来看,希特勒比任何其他国家领导人都更理解20世纪30年代的国际气候。
第三,当面临同样的情境时,不同的理性行为者也许不会或者大体上不会全部作出同样的决定。理性的行为者可能会对结果有不同偏好。一个国际象棋大师在和他或她的孩子下棋时不可能纯粹为了赢得比赛。相反,他或她努力使这个比赛对于孩子来说能玩得开心。有一些下法如果在这位大师与竞争对手下棋时采用就显得非理性,但如果在与孩子下棋时采用就可能是很理性的,因为大师下棋的目的截然不同。不仅如此,即使两个行为者拥有同样的序数偏好,他们也可能对风险和不确定性有不同的反应,这会让他们对可以采取的行动作出很不一样的评估。对风险的不同反应可能体现在效用函数中,而对不确定性的不同反应则可能体现为行为者对每个行动所带来结果的主观概率分布。每个人在拨动运气转盘时都偏好赢而不是输,但有些人愿意碰这个运气而有些人则不愿意。这两种类型的人都偏好赢胜过输,但不玩这个游戏的人避免了游戏的风险,这种偏好可以体现在他们对于结果的效用函数里。我在后面会讨论对待风险的态度以及不同态度如何体现在效用函数里。最后,不同行为者也许会拥有不同信息,这会导致他们在什么行动能带来所偏好的结果这个问题上有不同的想法。当知道哪匹马能赢得一场胜负已被操纵的赛马时,即使风险规避的个体也可能会下注一场赛马。
第四,理性的行为者也可能会出错,也就是会得到不想要的结果。这有三个原因。理性并不意味着所作的决定是不会出错的。首先,各种情境是有风险的。当一个人的行事方式是凭侥幸时,坏的结果就可能出现,因为他不够幸运。其次,行为者所拥有的信息是有限的。行为者无法确定他们的行动的后果,并且他们必定会作出可能不准确的判断。他们也许认为实现目标的非有效途径是有效的。在这里,关键的一点是后见之明总是准确的,但是,当行为者必须作出选择时,他们不知道自己的行动会带来什么后果。只有在考虑到作决定的条件时,决策才可能被恰当地评判。坏的决定在它们的后果为人所知后则一目了然。但行为者是无法知道未来的事情的。他们对可能的未来作出判断,并且根据这些判断行事。效用理论试图抓住这个问题的要点。
事前(ex ante facto)推理和事后(ex post facto)推理这两者之间的差别为我们带来最后一个观察。当我们能够选择行为者的目标以切合行为者的行动时,这很容易会产生循环解释(circular explanation)。例如,“他跳楼因为他想跳楼”,这种说法并不是一个对自杀的令人非常满意的解释。为了避免这种类型的循环推理,我们要么作出有关偏好的假定,要么把偏好建立在充分的初始信息的基础上。这两种方法常常一起运用。我们作出一定的关于行为者偏好的一般性假定,并允许存在对于不同的行为者而言差别很大的假定条件,但这些假定条件可以通过考察行为者以前的行为而适用。当说到消费品时,经济学家一般假定“越多越好”,但对于要购物的特定个体而言,多多少,是哪种商品,这些都是经验问题。