一个例子:尼克松的“圣诞节大轰炸”

让我们来考察从实际决策中抽象出来的一个简单例子,那就是尼克松于1972年12月对北越的“圣诞节大轰炸”。在起初同意结束美国对越南战争的介入以后,对于美国与北越之间解决争议的确切性质就出现了分歧。从尼克松政府的角度来看,北越政府正努力通过拖延协议的签字来获得更多的让步。然而,也有可能是对于最初协议的解读出现了真实的误解。我们把这些可能性中的每一种称为一种世界状态。当尼克松政府必须决定该怎么办时,它不知道世界的实际状态是什么。它不得不对哪种状态更有可能出现作出一个判断。我们称第一种状态为“越南人的恫吓”,记作S1,而称第二种状态为“没有恫吓”,记作S2。这两种状态相互独立、完全穷尽。北越不可能同时是在恫吓而又不是在恫吓,但是其中一种状态肯定存在。

我们考虑两种可以采取的行动:第一,通过空中轰炸来显示军事力量;第二,同意北越政府所要求的更多让步。显然,除了这两个选项,还有更多的选项可供选择,但是为了便于讲解,我以这种方式对情境作了简化。我们把第一种行动称为“轰炸”,记作A1,并把第二种行动称为“不轰炸”,记作A2。各种状态和行动一起带来结果(outcomes)或后果(conse-quences)。如果尼克松政府选择A2,那么我们假定,尼克松政府会作出更多让步,并且不管北越是否在恫吓,一个修改了的解决方案都会达成。我们称这一后果为C2。如果尼克松政府选择A1,那么结果就取决于北越如何回应轰炸。如果他们正在恫吓(也就是说,如果S1是世界状态),那么我们假定最初的协议会得到重新确认。我们称这一后果为C1。然而,如果只是发生了简单的误解,我们假定轰炸会惹怒北越,使其中断谈判并继续地面战争(为了简明起见,我们假定重新开始的地面战争不会把美国的地面部队重新牵涉进去)。我们称这一后果为C3。表2.1列出了各种选择、状态以及后果。

表2.1 对北越的“圣诞节大轰炸”中的行动、状态和后果

在尼克松政府眼里(这是我们的假定),这些后果的排序和它们的下标顺序一致:C1PC2PC3。尼克松政府偏好不作出更多让步胜过作出这些让步,但是战争继续比作出更多让步更糟糕。这一顺序给出了一组对于结果的序数偏好。但是对于结果的效用函数还明确了行为者为获得其偏好的结果而愿意接受多大程度的风险。尼克松政府把更多的让步看作非常不令人向往的,并且为了避免作出让步而愿意碰一下运气。让我们假定u(C1)=1,u(C2)=0.3,u(C3)=0。在各种状态上的概率分布概括了有关尼克松政府认为北越政府为回应美国行动会做什么的信念。它相信北越政府正在恫吓。让我们假定p(S1)=0.7而p(S2)=0.3(因为这两种状态是完全穷尽的,所以这两个概率加起来必须等于1)。通过计算期望效用,我们能够说明尼克松政府偏好A1胜过A2

EU(A1)=p(S1)u(C1)+p(S2)u(C3)=(0.7)(1)+(0.3)(0)=0.7,

EU(A2)=p(S1)u(C2)+p(S2)u(C2)=(0.7)(0.3)+(0.3)(0.3)

=0.21+0.09=0.3,

EU(A1)>EU(A2),故A1PA2

轰炸河内和海防的决定在美国国内非常有争议。《纽约时报》严厉批评尼克松政府的轰炸行动。虽然《纽约时报》具有和尼克松政府一样的对三个结果的假定的序数偏好,但它既不和尼克松政府一样愿意承担重新发动战争的风险,也不和尼克松一样估计北越正在实施恫吓。

练习2.1:说明以下任何一种改变都足以使决策者对上例中的各种行动的偏好发生逆转:(1)u(C2)=0.8或(2)p(S1)=0.2且p(S2)=0.8。

期望效用的比较的最终结果既取决于赋予每种结果的效用,又取决于每种状态的概率。正如上例中所表明的,当我们改变两者中的任意一个时,选择就可能变化。

对结果、行动、状态等的定义是一个建模决定。你选择如何表示一个行为者可以作出的选择以及这些选择的后果,这是建模过程中最重要的步骤。我有意识地使以上例子显得简单明了。你可以加入更多的行动、状态和结果。当然,这些会使这一简单模型变得复杂。对决策问题的结构分析可以有多种水平的复杂性。选择合适的复杂水平在任何模型的设计中都是关键问题。如果把复杂水平定得太高,问题就变得难以驾驭。如果把复杂水平定得太低,结果又显得微不足道。这里的本质问题是你想用你的模型来说明什么,以及你想怎样说明你的论点。一个模型的复杂水平是在一个更详细模型的进一步复杂性和一个简单模型的清晰说明之间所作的选择。简单的模型就足以明确许多蕴含重要内容的要点,而进一步增加复杂性和数学上的精深程度也许不能带来更多的政治上的洞见。

练习2.2:通过增加一个新的行动A3(即利用美国的地面部队重新干涉)来彻底改动以上的决策问题。如果A3被选择,那么,若S1是世界状态的话,所带来的后果则为C1,若S2是世界状态的话,所带来的后果则为C4,即一场把美国、北越、南越部队都牵涉进去的地面战争会被重新点燃(一种新的后果)。C3PC4。继续运用上例中对u(C1)、u(C2)、u(C3)、p(S1)、p(S2)赋值。

(1)令u(C4)=x,求解A3的期望效用。

(2)寻找u(C4)的值,以满足A2PA3

对于这个例子还应作最后一点注解。你应该会觉得奇怪,我们把北越的行动看作是不变的并由世界状态来决定。这的确显得奇怪。北越政府完全有资格被作为一个单独的行为者来对待。这样做的话会形成一个在尼克松政府和河内政府之间的博弈。通过这个例子,我想说明在决策论和博弈论之间存在一种天然的相似。在博弈论中,另一位参与者的行动类似于决策论中的世界状态。然而,由于其他参与者也选择它们的行动以最大化它们的期望效用,在博弈中每一方的决策必须依赖于它对另一方所选择的行动的预期。与决策论中对一个行动的选择相比,这是一个更复杂的问题。然而,这两种类型的决策都始于本章所介绍的效用概念。