- 智能控制与强化学习:先进值迭代评判设计
- 王鼎 赵明明 哈明鸣 任进
- 1390字
- 2025-01-09 16:59:55
前言
人工智能如春风拂大地,在无形处促进社会发展。
控制技术似微雨润万物,于无声中推动产业变革。
人工智能的研究热潮一浪接一浪,从理论研究到核心方法,从技术开发到落地应用,正推动着许多行业稳步迈向智能时代。自动控制的发展,也前前后后注入了大量人工智能元素。如今,人工智能驱动的自动化技术不断涌现,如与青春作伴,常常活力无限。其中,机器学习扮演着关键角色,助力以大规模数据为特色的智能自动化控制技术快速发展。即使面对环境保护、城市交通、电力系统等复杂对象,它依然起到了重要作用;反之,这也推进了机器学习本身的研究进展。值得一提的是,注重与环境交互的强化学习,更有利于自主智能系统的研究和开发。智能控制与强化学习,恰似美好时代背景下的双子星,熠熠生辉,并且交叉融合、相互促进。
在强化学习与智能控制的推动下,以自适应评判为主要思想的自适应动态规划方法,能够实现非线性系统的智能优化控制。在此基础上推广的智能评判控制,已经成为开展复杂动态系统控制设计的一类先进技术。在这一过程中,设计自适应能力强、学习速度快、运行成本低的智能控制器,成为复杂工业过程智能化运行趋势下的研究热点。作为一类经典而又常用的算法,以值迭代为基础的智能评判控制理论和方法取得了显著进展,相关学者已经围绕迭代机制、学习算法、智能实现及应用验证等开展了大量研究。然而,现有的基本值迭代方法存在着演化策略适用范围有限、难以快速获得最优策略等不足,在控制器实用性和决策快速性方面亟待提升。为了使相关领域学者有效地把握先进值迭代的研究动态与最新发展现状,亟须对此内容加以归纳整理,并进行开拓创新。
本书作为新一代人工智能技术的关键基础理论研究,将对先进值迭代驱动的智能控制设计进行详细阐述。在进行第1章的先进值迭代方法综述之后,本书主体内容分为三大部分。第一部分包括第2、3、4、5、6章,主要阐述广义值迭代方法;第二部分包括第7章,主要阐述演化值迭代方法;第三部分包括第8、9、10章,主要阐述加速值迭代方法。作者先后将先进值迭代用于解决调节器设计、轨迹跟踪、零和博弈等问题,还针对污水处理系统进行了应用验证。作者的研究工作得益于北京人工智能研究院、智慧环保北京实验室提供的良好平台,也希望相关成果对人工智能、智慧环保的理论研究和应用开发做出应有的贡献。
非常感谢国家自然科学基金(项目编号:62222301)、科技创新2030——“新一代人工智能”重大项目(课题编号:2021ZD0112302)、北京市自然科学基金(项目编号:JQ19013)等对于相关研究工作给予的大力资助。非常感谢赵明明、哈明鸣、任进,在开展相关研究和整理全书材料的过程中付出了极大努力;感谢胡凌治、赵慧玲、武俊龙帮助作者整理了第5、6、9章的基本内容;感谢高宁、辛鹏、李梦花、杨茹越、王将宇、周子航、李鑫、范文倩、刘奥、黄海铭、王元、马宏宇、唐国翰、胡琴娜、刘楠、袁泽强,帮助作者多次校对书稿。感谢人民邮电出版社的哈爽编辑,她对本书的出版付出了大量努力,前前后后与作者多次沟通,助力成稿发行。科研之路漫漫,充满无数挑战;坚守初心相伴,追逐梦想如愿。衷心感谢导师的启发和朋友的帮助,也特别感谢家人的无尽支持:照远方迎光明,感受一片安宁;鼓勇气助前行,欣赏无限风景。
由于作者水平所限,而且考虑人工智能及相关科技领域的快速发展,书中难免存在不足之处,恳请读者予以批评指正,以期做进一步的修改和完善。
王鼎
2023年8月26日于北京