1.4 面向零和博弈的值迭代算法

作为鲁棒控制中不可或缺的一个分支,H控制在抑制扰动引起的系统性能恶化方面取得了相当大的成功[81-87]。从理论角度来看,H控制的核心思想是求解 Hamilton-Jacobi-Isacs(HJI)方程。H控制与零和博弈相关,其中控制输入使代价函数最小化,扰动使代价函数最大化。在过去的几十年里,ADP 算法在解决零和博弈问题上取得了丰硕的成果[88-94]