- 智能控制与强化学习:先进值迭代评判设计
- 王鼎 赵明明 哈明鸣 任进
- 162字
- 2025-01-09 16:59:59
1.4 面向零和博弈的值迭代算法
作为鲁棒控制中不可或缺的一个分支,H∞控制在抑制扰动引起的系统性能恶化方面取得了相当大的成功[81-87]。从理论角度来看,H∞控制的核心思想是求解 Hamilton-Jacobi-Isacs(HJI)方程。H∞控制与零和博弈相关,其中控制输入使代价函数最小化,扰动使代价函数最大化。在过去的几十年里,ADP 算法在解决零和博弈问题上取得了丰硕的成果[88-94]。