1.4 面向零和博弈的值迭代算法_智能控制与强化学习：先进值迭代评判设计-QQ阅读男生科幻网

书名：智能控制与强化学习：先进值迭代评判设计
作者名：王鼎赵明明哈明鸣任进
本章字数：162字
更新时间：2025-01-09 16:59:59

1.4 面向零和博弈的值迭代算法

作为鲁棒控制中不可或缺的一个分支，H∞控制在抑制扰动引起的系统性能恶化方面取得了相当大的成功［81-87］。从理论角度来看，H∞控制的核心思想是求解 Hamilton-Jacobi-Isacs（HJI）方程。H∞控制与零和博弈相关，其中控制输入使代价函数最小化，扰动使代价函数最大化。在过去的几十年里，ADP 算法在解决零和博弈问题上取得了丰硕的成果［88-94］。