1.6 扩展式博弈
扩展式博弈是一种树状结构,其又被称为博弈树,更适用于描述动态博弈。一个扩展式博弈可以表示为G={N,H,E,I,A,U},其中N表示参与者集合,H表示非终止节点(非叶子节点)集合,E表示终止节点(叶子节点)集合,I 表示信息集,A 表示参与者在信息集上的可选策略集合,U 表示效用函数,即参与者在终止节点上的效用。
在扩展式博弈G中,第i个参与者pi的一个行为策略si指的是对于该参与者的每个信息集Ii∈I,为其可选行动Ai∈A分配一个概率分布。那么Si∈{si}代表该参与者的所有行为策略集合。如果n个参与者每人分别从自己的行为策略集合中选择一个行为策略,那么n维向量s=(s1,…,si,…,sn)被称为一个策略组合,或将一个策略组合表示为s=(si,s-i),其中s-i=(s1,…,si-i,si+1,…,sn)。